1. Đặt vấn đề
Trong mô hình hồi quy cổ điển, chúng ta cần xem xét các lỗi có thể xảy ra của mô hình như: (1) vấn đề đa cộng tuyến do các biến độc lập lại phụ thuộc lẫn nhau; (2) vấn đề phương sai sai số thay đổi do phần dư của mô hình là không ổn định và phụ thuộc vào các biến độc lập; (3) Tự tương quan do phần dư của mô hình lại biểu diễn được qua các phần dư cấp n của chính nó.Tuy nhiên trong các mô hình hồi quy hiện đại, chúng ta còn phải xem xét thêm các vấn đề khác của mô hình như: Vấn đề nôi sinh - do các tính chất, quy luận thực tiễn của các biến gây ra, mà khiến một vài biến lại sinh ra từ chính mô hình. Về mặt thống kê, ước lượng, vấn đề nội sinh mô hình được coi là một trong những vi phạm nghiêm trọng các giả định hồi quy. Và để xem xét mô hình có gặp vấn đề nội sinh hay không chúng ta thường xem xét: Mối quan hệ tương quan của biến độc lập và phần dư của mô hình. Theo luanhay.vn vấn đề nội sinh trong mô hình thường xuất hiện dưới 3 dạng sau:
- Thiếu vắng biến độc lập trong mô hình và do đó phần giải thích của biến này sẽ nằm ở sai số (phần dư). Khi đó có mối tương quan chặt giữa biến độc lập và phần dư.
- Sai số trong đo lường hay sai lệch do lựa chọn.
- Vấn đề đồng thời và hệ phương tình đồng thời.
Trên thực tế làm việc với số liệu thì có khá nhiều cách để xử lý vấn đề nội sinh, việc quyết định lựa chọn phương pháp nào là phụ thuộc vào: (i) Mẫu nghiên cứu có T (chiều thời gian) lớn hơn N (số đơn vị quan sát) ; hay N lớn hơn T; (ii) Phụ thuộc vào vấn đề nội sinh xuất hiện ở dạng nào như đã nêu ở mục 1; (iii) Vào bản chất, quy luật kinh tế của mô hình nghiên cứu. Và từ đó có một số cách cơ bản để xử lý vấn đề nội sinh, luanhay.vn xin giới thiệu như sau:
- Cách 1: Chấp nhận sai lệch tiềm ẩn mà không làm gì cả; và cũng có thể sử dụng thêm lệnh ước lượng vững (thủ tục robust).
- Cách 2: Sử dụng panel data với một mô hình có thể giải quyết vấn đề nội sinh (tức là chọn phương pháp xử lý dữ liệu phù hợp với vấn đề..)
- Cách 3: Tìm một biến proxy khác phù hợp để giải quyết mô hình (tức là bỏ biến có vấn đề đi, tuy nhiên đôi khi mô hình kinh tế của chúng ta vẫn cần biến đó nghiên cứu..)
- Cách 4: Sử dụng mô hình với biến công cụ chẳng hạn như: Hồi quy IV OLS, Hồi quy 2 giai đoạn 2SLS, Hồi quy 3 giai đoạn 3SLS, Hồi quy GMM, System GMM, Difference GMM.
3. Difference GMM – DGMM (GMM sai phân)
Khi bộ dữ liệu nghiên cứu đối mặt với vấn đề T nhỏ và N lớn hơn T (ví dụ: thời gian nghiên cứu từ 2008 – 2016, số quan sát là 300 doanh nghiệp..) và biến trễ của biến phụ thuộc có khả năng làm gia tăng sự tương quan trong mô hình; đồng thời mô hình đã gặp vấn đề nội sinh , vấn đề các đơn vị quan sát lại tương quan với các biến giải thích mà các phương pháp hồi quy IV, 2SLS, 3SLS không giải quyết được thì khi đó DGMM được đề cập tới để xử lý.
Khi đó từ mô hình tổng quát Yt = a + b*Yt-1+ c*Xt + d*Zt + ut… sẽ được lấy sai phân và biến đổi thành ∆Yt = a + b*∆Yt-1+ c*∆Xt + d*∆Zt + ∆ut khi đó các vấn đề sẽ được giải quyết.
Lưu ý: Trong phương pháp DGMM thì chúng ta cần đặc biệt quan tâm tới việc phân định rõ: (1) Các biến nội sinh của mô hình; (2) Các biến ngoại sinh của mô hình; (3) Số trễ cần có của biến phụ thuộc; (4) Biến công cụ và số trễ cần có của biến công cụ để khai báo khi phân tích. Việc phân định này phụ thuộc hoàn toàn vào các lý thuyết, phương pháp, mô hình nghiên cứu được trình bầy trước khi thu thập dữ liệu để xử lý mô hình.
4. Minh họa xử lý DGMM băng Eview và Stata
4.1. Ví dụ bằng Eview cho việc xem xét quyết định đầu tư vào hàng tồn kho
Mô hình xem xét: Quyết định đầu tư vào hàng tồn kho = f(Độ trễ của hàng tồn kho, Thanh khoản, Đòn bẩy, Dòng tiền, TobinQ). Trong đó TobinQ là gặp vấn đề nội sinh và mô hình có vấn đề độ trễ của biến phụ thuộc có sinh ra lỗi tự tương quan; mẫu có T = 8, N = 320. Khi đó biến đổi mô hình thông qua lấy sai phân và GMM; đồng thời xác định biến nội sinh là TOBINQ, biến công cụ là sai phân của TOBINQ, các biến còn lại là ngoại sinh (biến giải thích, kiểm soát..).
Estimation Command:
=========================
GMM(CX=FD,COV=PERWHITE,GMM=PERWHITE,ITER=ONEB) INVENTORIES INVENTORIES(-1) LIQUIDITY LEVERAGE CASH_FLOW TOBINQ @ @DYN(INVENTORIES,-2) D(TOBINQ)
Estimation Equation:
=========================
@DADJ(INVENTORIES) = C(1)*@DADJ(INVENTORIES(-1)) + C(2)*@DADJ(LIQUIDITY) + C(3)*@DADJ(LEVERAGE) + C(4)*@DADJ(CASH_FLOW) + C(5)*@DADJ(TOBINQ)
Kết quả ước lượng như bên dưới và thống kê J (Hansen 0 Sargan), kiểm định Arellano-Bond cho thấy mô hình đã ổn, phù hợp và đọc các kết quả giải thích được
Dependent Variable: INVENTORIES | |||||||||
Method: Panel Generalized Method of Moments | |||||||||
Transformation: First Differences | |||||||||
Sample (adjusted): 2009 2016 | |||||||||
Periods included: 8 | |||||||||
Cross-sections included: 320 | |||||||||
Total panel (unbalanced) observations: 2260 | |||||||||
White period instrument weighting matrix | |||||||||
White period standard errors & covariance (d.f. corrected) | |||||||||
Instrument specification: @DYN(INVENTORIES,-2) D(TOBINQ) | |||||||||
Constant added to instrument list | |||||||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. | |||||
INVENTORIES(-1) | -0.061830 | 0.028607 | -2.161329 | 0.0308 | |||||
LIQUIDITY | -18.64114 | 10.11710 | -1.842539 | 0.0655 | |||||
LEVERAGE | 2.524247 | 0.779049 | 3.240167 | 0.0012 | |||||
CASH_FLOW | 4.754557 | 0.990234 | 4.801448 | 0.0000 | |||||
TOBINQ | 0.292702 | 0.163671 | 1.788352 | 0.0739 | |||||
Effects Specification | |||||||||
Cross-section fixed (first differences) | |||||||||
Mean dependent var | -0.028118 | S.D. dependent var | 0.669318 | ||||||
S.E. of regression | 0.749639 | Sum squared resid | 1267.215 | ||||||
J-statistic | 38.10310 | Instrument rank | 37 | ||||||
Prob(J-statistic) | 0.211459 | ||||||||
Arellano-Bond Serial Correlation Test | |||||||||
Equation: EQ01_INVENTORIES | |||||||||
Date: 10/02/17 Time: 11:09 | |||||||||
Sample: 2007 2016 | |||||||||
Included observations: 2260 | |||||||||
Test order | m-Statistic | rho | SE(rho) | Prob. | |||||
AR(1) | -9.563193 | -437.036360 | 45.699839 | 0.0000 | |||||
AR(2) | -0.659621 | -18.316804 | 27.768680 | 0.5095 |
. import excel "Đường dẫn tới file số liệu\ So lieu phan tich.xlsx", sheet("Slieu") firstrow clear
. encode Country, gen(Qgia)
. xtset Qgia Year
panel variable: Qgia (strongly balanced)
time variable: Year, 1971 to 2016
delta: 1 unit
. xtabond2 GDPg l.GDPg FDI GDP Inflation Gross Urban, gmm (GDPg FDI GDP Inflation Gross ) small noconst
Favoring speed over space. To switch, type or click on mata: mata set matafavor space, perm.
Warning: Number of instruments may be large relative to number of observations.
Dynamic panel-data estimation, one-step system GMM
------------------------------------------------------------------------------
Group variable: qgia Number of obs = 741
Time variable : Year Number of groups = 19
Number of instruments = 728 Obs per group: min = 39
F(6, 735) = 59.88 avg = 39.00
Prob > F = 0.000 max = 39
------------------------------------------------------------------------------
GDPg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
GDPg |
L1. | .145992 .0364094 4.01 0.000 .0745132 .2174708
|
FDI | .2836637 .0835095 3.40 0.001 .1197181 .4476092
GDP | -.0001067 .0000349 -3.06 0.002 -.0001752 -.0000382
Inflation | -.0016668 .0003958 -4.21 0.000 -.0024438 -.0008898
Gross | .1148198 .0191629 5.99 0.000 .0771992 .1524403
Urban | -.2894683 .1062626 -2.72 0.007 -.4980828 -.0808538
------------------------------------------------------------------------------
Instruments for first differences equation
GMM-type (missing=0, separate instruments for each period unless collapsed)
L(1/39).(GDPg FDI GDP Inflation Gross)
Instruments for levels equation
GMM-type (missing=0, separate instruments for each period unless collapsed)
D.(GDPg FDI GDP Inflation Gross)
------------------------------------------------------------------------------
Arellano-Bond test for AR(1) in first differences: z = -4.39 Pr > z = 0.000
Arellano-Bond test for AR(2) in first differences: z = -1.04 Pr > z = 0.298
------------------------------------------------------------------------------
Sargan test of overid. restrictions: chi2(722) = 764.50 Prob > chi2 = 0.132
(Not robust, but not weakened by many instruments.)
Difference-in-Sargan tests of exogeneity of instrument subsets:
GMM instruments for levels
Sargan test excluding group: chi2(667) = 727.77 Prob > chi2 = 0.051
Difference (null H = exogenous): chi2(55) = 36.73 Prob > chi2 = 0.972
0 nhận xét:
Đăng nhận xét