Rất nhiều mô hình kinh tế liên quan đến vấn đề biến nội sinh (endogeneity). Biến nội sinh là những biến có sự tương quan với phần dư. Đây là những vấn đề thường gặp cả trong lý thuyết về kinh tế vi mô (hàm cầu tiêu dùng chẳng hạn) và vĩ mô ví như hàm tổng cầu Keynes. Ở góc độ kinh tế lượng, sự xuất hiện biến nội sinh sẽ dẫn đến các trường hợp như bỏ biến, sai số trong biến, hoặc được xác định đồng thời qua các biến giải thích khác. Trong các trường hợp này, OLS không còn phù hợp với những thông số ước lượng tin cậy. Phương pháp tổng quát để giải quyết vấn đề này là ước lượng biến công cụ (Instrumental variables estimator), đặc biệt là ước lượng 2 giai đoạn tối thiểu 2SLS.
1. Giới thiệu phương pháp
Giả sử, tiền lương của người lao động được xác định theo biểu thức sau:
log(wage) = β0 + β1educ + β2exper + β3abil + e (1)
Biểu thức này không thể ước lượng, bởi vì biến năng khiếu (abil) không có khả năng quan sát được. Nó có thể được ước lượng thông qua một biến đại diện cho abil, như IQ chẳng hạn. Như vậy, hiệu quả của biểu thức được ước lượng khi đó sẽ phụ thuộc vào chất lượng của biến đại diện này. Trường hợp, nếu bỏ qua biến abil thì thành phần abil sẽ được tính vào sai số u của biểu thức (2) hay còn gọi là biểu thức cấu trúc bên dưới.
log(wage) = β0 + β1educ + β2exper + u (2)
Nếu educ là biến ngoại sinh (không có tương quan với phần dư) thì ước lượng OLS sẽ là ước lượng phù hợp. Ngược lại, nếu educ là biến nội sinh thì OLS sẽ bị chệch và cho kết quả không đáng tin cậy. Trường hợp này, nếu hai biến abil và educ tương quan với nhau, thì ước lượng OLS sẽ không phù hợp. Khi đó, cần thiết phải có một biến mới z thỏa mãn 2 tính chất: (i) z không tương quan với u; (ii) nhưng z lại có tương quan với educ. Một biến thỏa mãn 2 tính chất trên được gọi là biến công cụ (IV). Biến z, chẳng hạn như học vấn của cha (fatheduc), hoặc nơi sinh sống gần trường đại học (nearc4), trong trường hợp này được gọi là biến công cụ cho educ. Giả sử chọn nearc4 là biến công cụ cho educ, thì biến giải thích educ được biểu diễn như sau (còn được gọi là biểu thức dạng rút gọn)
educ = π0 + π1exper + π2nearc4 + υ (3)
Các điều kiện của IV được thể hiện qua hệ phương trình sau:
E(u)=0
Cov(nearc4, u)=0
Cov(exper, u)=0
2. Thực hiện
Giải hệ phương trình trên với các thông số dữ liệu mẫu chính là kết quả của ước lượng IV. Tuy nhiên, bài viết này không đi sâu trình bày các công thức thống kê và phương pháp toán để giải hệ này. Quá trình giải sẽ được thực hiện trên các phần mềm thống kê. Cụ thể, quy trình ước lượng công cụ (instrumental variable estimator) IV trên các phần mềm được thực hiện như sau:
- Đầu tiên, ước lượng OLS biểu thức (3) và tính giá trị dự đoán educ_hat
- Sau đó, thay educ ở (2) bằng educ_hat vừa tính và ước lượng OLS cho biểu thức mới này.
Kết quả ước lượng này chính là kết quả ước lượng IV. Ước lượng IV theo cách này (ước lượng thủ công) sẽ cho các hệ số ước lượng đúng, tuy nhiên sai số chuẩn của các hệ số sẽ không chính xác. Điều này sẽ được khắc phục bằng câu lệnh ivreg của STATA.
Ví dụ minh họa cho trường hợp này, Sử dụng file card.dta, xem biến (nearc4) là biến công cụ cho educ. (nearc4) là một biến giả cho thấy rằng một người lớn lên gần hơn học 4 năm đại học. Ước lượng mô hình sau: Log(wage)=β0 + β1(educ) + β2exper + β3exper2 + β3(smsa) + β3(south) + u theo 2 cách OLS và IV.
Kết quả được thể hiện trên phần mềm STATA như sau:
Ước lượng OLS và IV (2SLS) cho mô hình thu nhập của người lao động |
Kiểm định sự tương quan của nearc4 với educ thông qua ý nghĩa thống kê của hệ số nearc4 |
Đây là trường hợp ước lượng IV với một biến nội sinh và một biến công cụ. Ngoài ra, còn hai trường hợp IV khác phổ biến hơn là (i) một biến nội sinh - nhiều biến công cụ; và (ii) nhiều biến nội sinh - nhiều biến công cụ. Đối với hai trường hợp còn lại này, ước lượng IV sẽ được thay bằng ước lượng hai giai đoạn tối thiểu 2SLS (2 Stage Least Square). Nguyên tắc cơ bản của hai trường hợp này là một biến nội sinh sẽ cần tối thiểu một biến công cụ. Ngoài ra, ở trường hợp một biến nội sinh - nhiều biến công cụ thì vế phải của phương trình (3) sẽ là tổ hợp tuyến tính tốt nhất của các biến công cụ.
3. Kiểm định
Sử dụng IV sẽ làm khuếch đại (inflate) phương sai của ước lượng, và làm giảm khả năng suy diễn cho ước lượng. Do vậy, việc lựa chọn ước lượng IV cho các mô hình cần đặc biệt quan tâm đến tính hiệu quả của phương pháp. Có 2 vấn đề chính liên quan đến độ tin cậy của ước lượng IV: (i) ràng buộc xác định quá mức (overidentifying restrictions); (ii) tính nội sinh của biến (endogeneity)
- Thông thường, các biến công cụ ngoại sinh có thể không cần kiểm định. Tuy nhiên, khi số lượng biến công cụ lớn, cần thiết phải kiểm định các biến này. Quá trình kiểm định này được gọi là kiểm định ràng buộc xác định quá mức (overidentifying restrictions). Đối với trường hợp phương sai của mô hình là đồng nhất (homoskedasticity) thì có thể sử dụng thống kê Sargan; ngược lại sử dụng thống kê Hansen khi phương sai thay đổi (heteroskedasticity).
- Đối với kiểm định tính nội sinh của biến thì nguyên tắc cơ bản của kiểm định là xét sự tương quan giữa sai số u của biểu thức cấu trúc (2) và υ của biểu thức rút gọn (3). Nếu u và υ có tương quan nhau, nghĩa là biến nội sinh trong bài (educ) là biến nội sinh.
- Ngoài ra, cần lưu ý rằng, kiểm định tính nội sinh là cần thiết nếu các biến công cụ thỏa mãn tính chất của biến công cụ. Vì vậy, kiểm định overidentifying restrictions phải được kiểm tra trước. Nếu thỏa mãn kiểm định này thì mới tiếp tục thực hiện kiểm định tính nội sinh.
Tài liệu tham khảo:
Wooldridge, J.M, (2002); "Econometric Analysis of Cross Section and Panel Data"; The MIT Press. Cambridge; Chapter 6: Additional Single-equation Topics,
0 nhận xét:
Đăng nhận xét