Bài giảng Kinh tế lượng - Chương 5: Đa cộng tuyến

ppt 24 trang hapham 2040
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 5: Đa cộng tuyến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_kinh_te_luong_chuong_5_da_cong_tuyen.ppt

Nội dung text: Bài giảng Kinh tế lượng - Chương 5: Đa cộng tuyến

  1. Chương 5 ĐA CỘNG TUYẾN
  2. 1. Đa cộng tuyến là gì ? Theo giả thiết của phương pháp OLS thì các biến độc lập không có mối quan hệ tuyến tính. Nếu quy tắc này bị vi phạm thì sẽ có hiện tượng đa cộng tuyến, Như vậy , “đa cộng tuyến ”là hiện tượng các biến độc lập trong mô hình phụ thuộc tuyến tính lẫn nhau và thể hiện được dưới dạng hàm số
  3. 1. Đa cộng tuyến là gì ? Xét mô hình hồi quy tuyến tính k biến với hàm PRF : YXXXUi=1 +  2 2 i +  3 3 i + +  k ki + i Đa cộng tuyến hoàn hảo xảy ra khi giữa các biến độc lập có mối quan hệ chính xác theo dạng a2 X 2+ a 3 X 3 + + akk X = 0 Đa cộng tuyến không hoàn hảo xảy ra khi giữa các biến độc lập có mối quan hệ theo dạng a2 X 2+ a 3 X 3 + + akk X + V = 0
  4. 1. Đa cộng tuyến là gì ? Ví dụ  Đa cộng tuyến hoàn hảo: X2 X3 X4 10 50 52 15 75 78 18 90 97 24 120 129 11 55 63 X2 và X3 có mối quan hệ tuyến tính chính xác: X3 = 5X2 => Trường hợp này có đa cộng tuyến hoàn hảo
  5. 1. Đa cộng tuyến là gì ?  Điều gì xảy ra khi có đa cộng tuyến hoàn hảo ? Xét ví dụ hàm hồi quy tuyến tính 3 biến Yi = 1 + 2 X 2i + 3 X 3i +Ui Và giả sử có đa cộng tuyến hoàn hảo : X3i=aX2i Ta có : y x x2 − x x y x ˆ ( i 2i )( 3i ) ( 2i 3i )( i 3i ) 2 = 2 ( x2 )( x2 )− ( x x ) Vì : X3i=aX2i  2i  3i  2i 3i ( y x )(a2 x2 )− (a x x )(a y x ) 0 ˆ =  i 2i  2i  2i 2i  i 2i = 2 2 2 2 2 0 ( x2i )(a  x2i )− (a x2i x2i )
  6. 1. Đa cộng tuyến là gì ? Đây là dạng vô định => Vậy không xác định được ˆ  2 Tương tự => Vậy không xác định được ˆ 3 Tổng quát : ma trận (XTX) suy biến, không có ma trận nghịch đảo Như vậy trong trường hợp đa cộng tuyến hoàn hảo thì sẽ không xây dựng được mô hình hồi quy
  7. 1. Đa cộng tuyến là gì ?  Điều gì xảy ra khi có đa cộng tuyến không hoàn hảo ? Chúng ta vẫn ước lượng được các tham số và xây dựng được mô hình hồi quy nhưng hãy xét đến hậu quả của đa cộng tuyến không hoàn hảo trong các phần tiếp theo
  8. 2. Hệ quả của đa cộng tuyến Khi gặp đa cộng tuyến hoàn hảo, chúng ta không thể ước lượng được mô hình Hệ quả khi có đa cộng tuyến không hoàn hảo 1. Khi dùng phương pháp ước lượng OLS, phương sai vẫn là nhỏ nhất nhưng giá trị lại khá lớn so với giá trị ước lượng 2. Sai số chuẩn của các hệ số hồi qui sẽ lớn Do đó: o Khoảng tin cậy lớn và việc kiểm định ít có ý nghĩa. o Giả thiết H0 dễ dàng được chấp nhận
  9. 2. Hậu quả của đa cộng tuyến 3. R2 cao nhưng tỷ số t ít có ý nghĩa Dễ dàng bác bỏ giả thuyết “không” của thống kê F và cho rằng mô hình ước lượng có gía trị.
  10. 2. Hậu quả của đa cộng tuyến 4. Các ước lượng và sai số chuẩn của ước lượng rất nhạy cảm với sự thay đổi của dữ liệu Chỉ cần một sự thay đổi nhỏ trong mẫu dữ liệu sẽ kéo theo sự thay đổi lớn các hệ số ước lượng.
  11. 2. Hậu quả của đa cộng tuyến Ví dụ  Xem kết quả ước lượng hàm tiêu dùng: Y = 24.77 + 0.94X2 - 0.04X3 R2=0.96, F = 92.40 X2 : thu nhập X3 : của cải R2 rất cao giải thích 96% biến đổi của hàm tiêu dùng. Sai sót : ✓Có một biến sai dấu. ✓Biến thu nhập và của cải tương quan rất mạnh với nhau do đó không thể nào ước lượng được tác động biên chính xác cho thu nhập hoặc của cải lên tiêu dùng
  12. 3. Nguồn gốc của đa cộng tuyến ➢Do phương pháp thu thập dữ liệu Các giá trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu, nhưng không phụ thuộc lẫn nhau trong tổng thể Ví dụ: người có thu nhập cao hơn khuynh hướng sẽ có nhiều của cải hơn. Điều này có thể đúng với mẫu mà không đúng với tổng thể . Cụ thể , trong tổng thể sẽ có các quan sát về các cá nhân có thu nhập cao nhưng không có nhiều của cải và ngược lại.
  13. 3. Nguồn gốc của đa cộng tuyến ➢Dạng hàm mô hình: Ví dụ: - hồi qui dạng hàm đa thức - hồi quy mà số biến độc lập nhiều hơn số quan sát ➢Các biến độc lập được quan sát theo chuỗi thời gian có cùng chiều hướng biến động Ví dụ: giá cả các mặt hàng tăng theo thời gian
  14. 4. Nhận biết đa cộng tuyến ➢ R2 cao và thống kê t thấp. Dấu hiệu này thể hiện nghịch lý gì ? Nhược điểm : chỉ thể hiện rõ khi có đa cộng tuyến ở mức cao
  15. 4. Nhận biết đa cộng tuyến ➢Hệ số tương quan giữa các biến độc lập cao. Công thức tính hệ số tương quan giữa X2 và X3 (X − X )( X − X ) r =  2i 2 3i 3 23 2 2 (X 2i − X 2 ) (X 3i − X 3 ) Hệ số tương quan có ý nghĩa như thế nào ? Nhược điểm của phương pháp này là gì ?
  16. 4. Nhận biết đa cộng tuyến ➢Thực hiện hồi qui phụ Hồi qui giữa một biến độc lập nào đó theo các biến độc lập còn lại với nhau và quan sát hệ số R2 của các hồi qui phụ Hồi quy chính : Yi = 1+2X2i+3X3i+ 4X4i + Ui Hồi quy phụ : X4i = α1+α2X2i+α3X3i+ Vi - Nhược điểm của việc hồi quy phụ là gì ?
  17. 4. Nhận biết đa cộng tuyến ➢Dùng nhân tử phóng đại phương sai 1 VIFj = 2 1− Rj 2 Rj là hệ số xác định của mô hình hồi qui phụ Xj theo các biến độc lập khác. Nếu có đa cộng tuyến thì VIF lớn. VIFj > 10 thì Xj có đa cộng tuyến cao với các biến khác.
  18. 5. Khắc phục đa cộng tuyến a) Bỏ qua đa cộng tuyến nếu |t| > 2 b) Bỏ qua đa cộng tuyến nếu R2 của mô hình cao hơn R2 của mô hình hồi qui phụ. c) Bỏ qua đa cộng tuyến nếu mục tiêu xây dựng mô hình sử dụng để dự báo chứ không phải kiểm định.
  19. 5. Khắc phục đa cộng tuyến d)Bỏ bớt biến độc lập. Ví dụ: bỏ biến của cải ra khỏi mô hình hàm tiêu dùng. e) Bổ sung dữ liệu hoặc tìm dữ liệu mới f) Thay đổi dạng mô hình:
  20. Ví dụ minh hoạ Khảo sát chi tiêu cho tiêu dùng (Y), thu nhập (X2) và quy mô tài sản (X3) ta có số liệu sau : Y 70 65 90 95 110 115 120 140 155 150 X2 80 100 120 140 160 180 200 220 240 260 X3 810 1009 1273 1425 1633 1876 2052 2201 2435 2686