Tại sao chọn hồi quy tobit

Cách lựa chọn FEM REM OLS trong hồi quy dữ liệu bảng PANEL Ứng dụng thuật toán phân loại Naïve Bayes Bàn luận về kết quả hồi quy mô hình tobit trên. hướng dẫn hồi quy mô hình tobit trên stata, hướng dẫn cách đọc kết quả hồi quy, hướng ứng dụng xây dựng kết quả, với mô hình giới hạn tobit, hướng dẫn chạy hồi quy với dữ liệu có sẵn, dễ dàng đối chiếu và học hỏi từ mô hình ví dụ, cách đọc kết quả mô hình tobit

Nội dung chính Show

Phương pháp phân tích bạn có thể xem xét
Hồi quy tobit
Kiểm tra phân phối chuẩn của biến apt
Kiểm định tương quan
Kiểm tra tương quan giữa ước lượng và quan sát
Bàn luận về kết quả hồi quy mô hình tobit trên.

Mô hình quỹ đạo, còn được gọi là mô hình hồi quy kiểm duyệt, được thiết kế để ước tính mối quan hệ tuyến tính giữa các biến khi có kiểm duyệt trái hoặc phải trong biến phụ thuộc (còn được gọi là kiểm duyệt từ bên dưới và bên trên). Kiểm duyệt từ trên diễn ra khi các trường hợp có giá trị ở hoặc trên một ngưỡng nào đó, tất cả đều đảm nhận giá trị của ngưỡng đó, để giá trị thực có thể bằng ngưỡng, nhưng cũng có thể cao hơn. Trong trường hợp kiểm duyệt từ bên dưới, các giá trị nằm ở hoặc dưới một số ngưỡng được kiểm duyệt.

Xin lưu ý: Mục đích của trang này là hiển thị cách sử dụng các lệnh phân tích dữ liệu khác nhau. Nó không bao gồm tất cả các khía cạnh của quá trình nghiên cứu mà các nhà nghiên cứu dự kiến sẽ làm. Đặc biệt, nó không bao gồm việc làm sạch và kiểm tra dữ liệu, xác minh các giả định, chẩn đoán mô hình và phân tích theo dõi tiềm năng.

Phương pháp phân tích bạn có thể xem xét

Dưới đây là danh sách một số phương pháp phân tích mà bạn có thể đã gặp phải. Một số phương pháp được liệt kê là khá hợp lý trong khi các phương pháp khác không được ưa chuộng hoặc có những hạn chế.

Hồi quy Tobit, trọng tâm của trang này.
Hồi quy OLS – Bạn có thể phân tích các dữ liệu này bằng hồi quy OLS. Hồi quy OLS sẽ coi 800 là giá trị thực tế và không phải là giới hạn trên của năng lực học tập hàng đầu. Một hạn chế của phương pháp này là khi biến được kiểm duyệt, OLS cung cấp các ước tính không nhất quán của các tham số, nghĩa là các hệ số từ phân tích sẽ không nhất thiết phải tiếp cận các tham số dân số “thật” khi kích thước mẫu tăng. Xem Long (1997, chương 7) để thảo luận chi tiết hơn về các vấn đề sử dụng hồi quy OLS với dữ liệu bị kiểm duyệt.
Hồi quy rút gọn – Đôi khi có sự nhầm lẫn về sự khác biệt giữa dữ liệu bị cắt và dữ liệu bị kiểm duyệt. Với các biến được kiểm duyệt, tất cả các quan sát đều có trong tập dữ liệu, nhưng chúng tôi không biết giá trị “thực” của một số trong số chúng. Với việc cắt bớt một số quan sát không được đưa vào phân tích vì giá trị của biến. Khi một biến được kiểm duyệt, các mô hình hồi quy cho dữ liệu bị cắt cung cấp các ước tính không nhất quán của các tham số. Xem Long (1997, chương 7) để thảo luận chi tiết hơn về các vấn đề sử dụng mô hình hồi quy cho dữ liệu bị cắt để phân tích dữ liệu bị kiểm duyệt.

Đọc xong mấy cái định nghĩa và giả thuyết quá đau đầu,vì vậy ứng dụng của mô hình này là giới hạn biến phụ thuộc trong khoang (a;b) và là biến liên tục có phân phối chuẩn.

Hồi quy tobit

Trước tiên chúng ta hãy sử dụng bộ dự liệu sau để hồi quy

use https://stats.idre.ucla.edu/stat/stata/dae/tobit.dta, clear

Lệnh hồi quy:

tobit apt read math prog, ul(800)

ta được kết quả hồi quy tobit như sau:

kết quả hồi quy tobit

Tùy theo bộ dữ liệu mà chúng ta lấy giới hạn trái(ll) hoặc giới hạn phải(ul).

Kiểm tra phân phối chuẩn của biến apt

histogram apt, normal bin(10) xline(800)

Nhìn vào biểu đồ histogram chúng ta dễ nhận thấy rằng, biến apt là biến liên tục và có phân phối là chuẩn, nói đúng hơn là bán chuẩn, vì chuẩn thì không thể lấy giới hạn được.

Nhìn vào biểu đồ trên cho thấy sự phân phối của apt , chúng ta có thể thấy sự kiểm duyệt trong dữ liệu, nghĩa là, có nhiều trường hợp có điểm từ 750 đến 800 hơn so với người ta mong đợi khi nhìn vào phần còn lại của phân phối. Dưới đây là một biểu đồ thay thế làm nổi bật hơn nữa các trường hợp thừa apt = 800. Trong biểu đồ bên dưới, tùy chọn rời rạc tạo ra biểu đồ trong đó mỗi giá trị duy nhất của apt có thanh riêng. Tùy chọn freq làm cho trục y được gắn nhãn với tần số cho từng giá trị, thay vì mật độ. Bởi vì apt là liên tục, hầu hết các giá trị của aptlà duy nhất trong tập dữ liệu, mặc dù gần trung tâm phân phối, có một vài giá trị của apt có hai hoặc ba trường hợp. Sự tăng đột biến ở phía bên phải của biểu đồ là thanh cho các trường hợp apt = 800, chiều cao của thanh này so với tất cả các trường hợp khác cho thấy rõ số lượng trường hợp vượt quá với giá trị này.

Đồng thời chúng ta dễ dàng tìm ra được giới hạn phải của mô hình.

Kiểm định tương quan

Tiếp theo chúng ta kiểm định tương quan giữa các biến độc lập

Từ kết quả trên ta dễ nhận thấy rằng mô hình có các biến độc lập rất tương quan nhau.

Kiểm tra tương quan giữa ước lượng và quan sát

Mối tương quan giữa các giá trị dự đoán và quan sát của apt là 0,7825. Nếu chúng ta bình phương giá trị này, chúng ta sẽ có được tương quan nhiều bình phương, điều này cho thấy các giá trị dự đoán chia sẻ khoảng 61% (0,7825 ^ 2 = 0,6123) về phương sai của chúng với apt . Ngoài ra, chúng ta có thể sử dụng lệnh fitstat do người dùng viết để tạo ra nhiều số liệu thống kê phù hợp.