1. Giới thiệu về dữ liệu mảng Panel Data
Panel Data là bộ dữ liệu bao gồm cả hai chiều không gian và thời gian.
Mô hình hồi tác động cố định (Fixed-effects) và tác động ngẫu nhiên (random-effects) được sử dụng trong phân tích dữ liệu bảng (đôi khi còn được gọi là dữ liệu dài: longitudinal data). Dữ liệu bảng là sự kết hợp của dữ liệu chéo (cross-section) và dữ liệu thời gian (time series). Để thu thập dữ liệu bảng, chúng ta phải thu thập nhiều đối tượng (units) giống nhau trong cùng một hoặc nhiều thời điểm. Chẳng hạn, chúng ta có thể thu thập các dữ liệu của cùng các cá nhân, công ty, trường học, thành phố, quốc gia… trong giai đoạn từ năm 2000 đến 2014.
Sử dụng dữ liệu bảng có hai ưu điểm lớn như:
i) Dữ liệu bảng cho các kết quả ước lượng các của tham số trong mô hình tin cậy hơn;
ii) Dữ liệu bảng cho phép chúng ta xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng sử dụng chéo hoặc dữ liệu thời gian.
2. Cách lựa chọn mô hình cho dữ liệu bảng
Câu hỏi đặt ra là mô hình nào sẽ là mô hình dữ liệu phù hợp: Pooled OLS, FE hay RE. Sự phù hợp của ước lượng tác động ngẫu nhiên và tác động cố định được kiểm chứng trên cơ sở so sánh với ước lượng thô.
Cụ thể, ước lượng tác động cố định được kiểm chứng bằng kiểm định F với giả thuyết H0 cho rằng tất cả các hệ số vi đều bằng 0 (nghĩa là không có sự khác biệt giữa các đối tượng hoặc các thời điểm khác nhau). Bác bỏ giả thuyết H0 với mức ý nghĩa cho trước (mức ý nghĩa 5% chẳng hạn) sẽ cho thấy ước lượng tác động cố định là phù hợp.
Đối với ước lượng tác động ngẫu nhiên, phương pháp nhân tử Lagrange (LM) với kiểm định Breusch-Pagan được sử dụng để kiểm chứng tính phù hợp của ước lượng (Baltagi, 2008 trang 319). Theo đó, giả thuyết H0 cho rằng sai số của ước lượng thô không bao gồm các sai lệch giữa các đối tượng var(vi) = 0 (hay phương sai giữa các đối tượng hoặc các thời điểm là không đổi).
Bác bỏ giả thuyết H0, cho thấy sai số trong ước lượng có bao gồm cả sự sai lệch giữa các nhóm, và phù hợp với ước lượng tác động ngẫu nhiên.
Kiểm định Hausman sẽ được sử dụng để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định và tác động ngẫu nhiên (Baltagi, 2008 trang 320; Gujarati, 2004 trang 652). Giả thuyết H0 cho rằng không có sự tương quan giữa sai số đặc trưng giữa các đối tượng (vi) với các biến giải thích Xit trong mô hình. Ước lượng RE là hợp lý theo giả thuyết H0 nhưng lại không phù hợp ở giả thuyết thay thế. Ước lượng FE là hợp lý cho cả giả thuyết H0 và giả thuyết thay thế. Tuy nhiên, trong trường hợp giả thuyết H0 bị bác bỏ thì ước lượng tác động cố định là phù hợp hơn so với ước lượng tác động ngẫu nhiên.
Ngược lại, chưa có đủ bằng chứng để bác bỏ H0 nghĩa là không bác bỏ được sự tương quan giữa sai số và các biến giải thích thì ước lượng tác động cố định không còn phù hợp và ước lượng ngẫu nhiên sẽ ưu tiên được sử dụng.
3. Mô hình Pooled ols
Mô hình POOL thực chất là mô hình pooled ols bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mây dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình pooled ols.
Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho dữ liệu có được và thực hiện các kiểm định bình thường ( 8 giả định OLS).
Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích. Mặc khác, đây cũng là gợi ý cho các kiểm định phát hiện các vấn đề trước khi quyết định phân tích theo các mô hình khác nhau.
4. Mô hình Var (Mô hình vectơ tự hồi quy)
Giới thiệu mô hình Var ( tự hồi quy vector) là mô hình bao gồm hệ phương trình, không phân biệt biến độc lập và biến phụ thuộc.
Việc sử dụng mô hình Var bắt buộc các chuỗi dữ liệu đưa vào phải là chuỗi dừng, nếu chưa dừng thì lấy sai phân khi nào dừng thì thôi. Trung trâm nghiên cứu định lượng hôm nay giới thiệu cho các bạn cách thực hành mô hình Var trên EViews
Về bản chất VAR thật ra là sự kết hợp của 2 phương pháp: tự hồi quy đơn chiều (univariate autoregression-AR) và hệ phương trình ngẩu nhiên (simultanous equations-SEs). VAR hay ở chỗ nó lấy ưu điểm của AR là rất dễ ước lượng bằng phương pháp tối thiểu hóa phần dư (OLS) nó lấy ưu điểm của SEs là ước lượng nhiều biến trong cùng 1 hệ thống. Và đồng thời nó khắc phục nhược điểm của SEs là nó không cần quan tâm đến tính nội sinh của các biến kinh tế (endogeneity). Tức là các biến kinh tế vĩ mô thường mang tính nội sinh khi chúng tác động qua lại lẫn nhau. Thuộc tính này làm cho phương pháp cổ điển hồi quy bội dùng 1 phương trình hồi quy nhiều khi bị sai lệch khi ước lượng. Đây là những lý do cơ bản khiến VAR trở nên phổ biến trong nghiên cứu kinh tế vĩ mô. Nó cũng chính là nền tảng cho nghiên cứu về sự cùng hợp nhất (cointegration) của Engle và Granger (1983, 1987) giành giải nobel năm 2003.
5. Giới thiệu về kiểm định Hausman
Kiểm định Hausman là một kiểm tra giả định thống kê trong kinh tế lượng được đặt theo tên của James Durbin, De-Min Wu và Jerry A. Hausman. Thuật toán này sử dụng để so sánh hai phương pháp ước lượng FEM và REM.
Hay nói cách khác để xem xét mô hình FEM hay REM phù hợp hơn, ta sử dụng kiểm định Hausman. Thực chất kiểm định Hausman để xem xét có tồn tại tự tương quan giữa εi và các biến độc lập hay không.
Kiểm định Hausman nhằm mục đích xác định mô hình tác động cố định hay ngẫu nhiên là phù hợp trong mô hình dữ liệu bảng. Kiểm định này nhằm xác định sai số ui có tương quan với các biến giải thích hay không. Giả thuyết H0 của mô hình cho rằng không có tương quan giữa sai số và cái biến giải thích. Để thực hiện kiểm định này, đầu tiên bạn chạy mô hình tác động cố định (Lệnh xtreg y x1, fe) sau đó lưu các kết quả ước lượng lại (Lệnh store fixed), sau đó chạy mô hình tác động ngẫu nhiên (Lệnh xtreg y x1, re) và cũng lưu kết quả lại (Lệnh store random).
0 nhận xét:
Đăng nhận xét