Công thức tính sai số chuẩn của hàm hồi quy

Bài này sẽ bàn về giá trị sai số chuẩn standard error của hệ số hồi quy, đồng thời giới thiệu cách tính thủ công giá trị t value trong phương trình hồi quy nhé.

Từ file số liệu để chạy hồi quy ở đây phantichspss.com/filefordownload/standard-error-t-value.sav, chạy hồi quy với biến phụ thuộc là HAILONG, biến độc lập là 2 biến còn lại ra sẽ được kết quả sau:

Công thức tính sai số chuẩn của hàm hồi quy

Sai số chuẩn của hệ số

Sai số chuẩn standard error của hệ số hồi quy là một ước tính về mức độ thay đổi của hệ số hồi quy giữa các mẫu có cùng kích thước được lấy từ cùng một tổng thể. Theo nghĩa đơn giản, nó là độ lệch chuẩn của các ước lượng hệ số của b trên nhiều mẫu. Nếu một người phải lấy nhiều mẫu có cùng cỡ mẫu từ cùng một tổng thể và sử dụng chúng để tính toán phương trình hồi quy, thì sai số chuẩn là một ước tính về hệ số hồi quy sẽ thay đổi bao nhiêu từ mẫu này sang mẫu khác. Sai số chuẩn nhỏ hơn ngụ ý dự đoán đáng tin cậy hơn và do đó khoảng tin cậy nhỏ hơn.

Ví dụ về sai số chuẩn standard errors.

Trong ảnh trên, sai số chuẩn của DAMBAO là 0.132, biểu thị rằng khoảng tin cậy 95 phần trăm cho DAMBAO sẽ là 0.542+- (1.96*0.132), hoặc nằm trong khoảng từ mức thấp nhất là 0.28 đến mức cao nhất là 0.8. Giá trị b của DAMBAO chia cho sai số chuẩn =0.542/0.132 =4.106 là giá trị t được tính toán cho kiểm định t-test (hệ số b của DAMBAO=0) (chính là giá trị trong cột t ở bảng trên).

Giá trị t của các biến trong phương trình hồi quy

Giá trị t của các biến trong phương trình, như vừa được tính toán, đo lường mức ý nghĩa thống kê của mối tương quan từng phần của biến được phản ánh qua hệ số hồi quy. Như vậy, nó chỉ ra rằng liệu nhà nghiên cứu có thể tự tin nói rằng, với một mức sai số đã nêu, rằng hệ số này không bằng 0 hay không. Giá trị F có thể được đưa ra ở giai đoạn này hơn là giá trị t. Chúng có thể so sánh trực tiếp vì giá trị t xấp xỉ căn bậc hai của giá trị F.

Giá trị t cũng đặc biệt hữu ích trong thủ tục stepwise trong việc giúp xác định xem có nên loại bỏ bất kỳ biến nào khỏi phương trình sau khi một biến độc lập khác được thêm vào hay không. Mức ý nghĩa được tính toán được so sánh với mức ngưỡng do nhà nghiên cứu đặt ra để loại bỏ biến. Khi nhiều biến được thêm vào phương trình hồi quy, mỗi biến sẽ được kiểm tra để xem liệu nó có còn nằm trong ngưỡng này hay không. Nếu nó nằm ngoài ngưỡng (mức ý nghĩa lớn hơn .10), nó sẽ bị loại khỏi phương trình hồi quy và mô hình được ước lượng lại. Trong ví dụ trên, giá trị t (được tính bằng cách chia hệ số hồi quy cho sai số chuẩn) =giá trị b của DAMBAO chia cho sai số chuẩn =0.542/0.132 =4.106, có ý nghĩa thống kê ở mức .000. Nó cung cấp cho nhà nghiên cứu một mức độ đảm bảo cao rằng hệ số này không bằng 0 và có thể được đánh giá như một yếu tố dự báo về sự hài lòng của khách hàng.