Hướng dẫn Difference GMM - DGMM bằng Eview và Stata

1. Đặt vấn đề

Trong mô hình hồi quy cổ điển, chúng ta cần xem xét các lỗi có thể xảy ra của mô hình như: (1) vấn đề đa cộng tuyến do các biến độc lập lại phụ thuộc lẫn nhau; (2) vấn đề  phương sai sai số thay đổi do phần dư của mô hình là không ổn định và phụ thuộc vào các biến độc lập; (3) Tự tương quan do phần dư của mô hình lại biểu diễn được qua các phần dư cấp n của chính nó.
Tuy nhiên trong các mô hình hồi quy hiện đại, chúng ta còn phải xem xét thêm các vấn đề khác của mô hình như: Vấn đề nôi sinh  - do các tính chất, quy luận thực tiễn của các biến gây ra, mà khiến một vài biến lại sinh ra từ chính mô hình. Về mặt thống kê, ước lượng, vấn đề nội sinh mô hình được coi là một trong những vi phạm nghiêm trọng các giả định hồi quy. Và để xem xét mô hình có gặp vấn đề nội sinh hay không chúng ta thường xem xét: Mối quan hệ tương quan của biến độc lập và phần dư của mô hình. Theo luanhay.vn vấn đề  nội sinh trong mô hình thường xuất hiện dưới 3 dạng sau:
  1. Thiếu vắng biến độc lập trong mô hình và do đó phần giải thích của biến này sẽ nằm ở sai số (phần dư). Khi đó có mối tương quan chặt giữa biến độc lập và phần dư.
  2. Sai số trong đo lường hay sai lệch do lựa chọn.
  3. Vấn đề đồng thời và hệ phương tình đồng thời.


2. Cách xử lý vấn đề nội sinh
Trên thực tế làm việc với số liệu thì có khá nhiều cách để xử lý vấn đề nội sinh, việc quyết định lựa chọn phương pháp nào là phụ thuộc vào: (i) Mẫu nghiên cứu có T (chiều thời gian) lớn hơn N (số đơn vị quan sát) ; hay N lớn hơn T; (ii) Phụ thuộc vào vấn đề nội sinh xuất hiện ở dạng nào như đã nêu ở mục 1; (iii) Vào bản  chất, quy luật kinh tế của mô hình nghiên cứu. Và từ đó có một số cách cơ bản để xử lý vấn đề nội sinh, luanhay.vn xin giới thiệu như sau:
  1. Cách 1: Chấp nhận sai lệch tiềm ẩn mà không làm gì cả;  và cũng  có thể sử dụng thêm lệnh ước lượng vững (thủ tục robust).
  2. Cách 2: Sử dụng panel data với một mô hình có thể giải quyết vấn đề nội sinh (tức là chọn phương pháp xử lý dữ liệu phù hợp với vấn đề..)
  3. Cách 3: Tìm một biến proxy khác phù hợp để giải quyết mô hình (tức là bỏ biến có vấn đề đi, tuy nhiên đôi khi mô hình kinh tế của chúng ta vẫn cần biến đó nghiên cứu..)
  4. Cách 4: Sử dụng mô hình với biến công cụ chẳng hạn như:  Hồi quy  IV OLS, Hồi quy 2 giai đoạn 2SLS, Hồi quy 3 giai đoạn 3SLS, Hồi quy GMM, System GMM, Difference GMM.
Việc lựa chọn cách nào để giải quyết vấn đề là tùy thuộc vào bộ dữ liệu thu thập được và bản chất của mô hình kinh tế mà chúng ta cần xử lý. Vì thế việc xem xét cẩn trọng các lý luận về mô hình chúng ta định xử lý là rất quan trọng, nó giúp xác định rõ bản chất kinh tế các biến, các mối quan hệ, biến nào là biến công cụ, biến nào là kiểm soát, biến nào là ngoại sinh, biến nào là nội sinh… từ đó sẽ giúp kỹ thuật viên xử lý mô hình một cách tin cậy nhất.
3. Difference GMM – DGMM  (GMM sai phân)
Khi bộ dữ liệu nghiên cứu đối mặt với vấn đề T nhỏ và N lớn hơn T (ví dụ: thời gian nghiên cứu từ 2008 – 2016, số quan sát là 300 doanh nghiệp..) và biến trễ của biến phụ thuộc có khả năng làm gia tăng sự tương quan trong mô hình; đồng thời mô hình đã gặp vấn đề nội sinh , vấn đề các đơn vị quan sát lại tương quan với các biến giải thích mà các phương pháp hồi quy IV, 2SLS, 3SLS không giải quyết được thì khi đó DGMM được đề cập tới để xử lý.
Khi đó từ mô hình tổng quát Yt = a + b*Yt-1+ c*Xt + d*Zt + ut… sẽ được lấy sai phân và biến đổi thành ∆Yt = a + b*∆Yt-1+ c*∆Xt + d*∆Zt + ∆ut khi đó các vấn đề sẽ được giải quyết.
Lưu ý: Trong phương pháp DGMM thì chúng ta cần đặc biệt quan tâm tới việc phân định rõ: (1) Các biến nội sinh của mô hình; (2) Các biến ngoại sinh của mô hình; (3) Số trễ cần có của biến phụ thuộc; (4) Biến công cụ và số trễ cần có của biến công cụ để khai báo khi phân tích. Việc phân định này phụ thuộc hoàn toàn vào các lý thuyết, phương pháp, mô hình nghiên cứu được trình bầy trước khi thu thập dữ liệu để xử lý mô hình.
 
4. Minh họa xử lý DGMM băng Eview và Stata
4.1. Ví dụ bằng Eview cho việc xem xét quyết định đầu tư vào hàng tồn kho
Mô hình xem xét: Quyết định đầu tư vào hàng tồn kho = f(Độ trễ của hàng tồn kho, Thanh khoản, Đòn bẩy, Dòng tiền, TobinQ). Trong đó TobinQ là gặp vấn đề nội sinh và mô  hình có vấn đề độ trễ của biến phụ thuộc có sinh ra lỗi tự tương quan; mẫu có T = 8, N = 320. Khi đó biến đổi mô hình thông qua lấy sai phân và GMM; đồng thời xác định biến nội sinh là TOBINQ, biến công cụ là sai phân của TOBINQ, các biến còn lại là ngoại sinh (biến giải thích, kiểm soát..).
Estimation Command:
=========================
GMM(CX=FD,COV=PERWHITE,GMM=PERWHITE,ITER=ONEB) INVENTORIES INVENTORIES(-1) LIQUIDITY LEVERAGE CASH_FLOW TOBINQ @ @DYN(INVENTORIES,-2) D(TOBINQ)
 
Estimation Equation:
=========================
@DADJ(INVENTORIES) = C(1)*@DADJ(INVENTORIES(-1)) + C(2)*@DADJ(LIQUIDITY) + C(3)*@DADJ(LEVERAGE) + C(4)*@DADJ(CASH_FLOW) + C(5)*@DADJ(TOBINQ)
 
Kết quả ước lượng như bên dưới và thống kê J (Hansen 0 Sargan), kiểm định Arellano-Bond  cho thấy mô hình đã ổn, phù hợp và đọc các kết quả giải thích được
Dependent Variable: INVENTORIES 
Method: Panel Generalized Method of Moments 
Transformation: First Differences 
Sample (adjusted): 2009 2016  
Periods included: 8  
Cross-sections included: 320  
Total panel (unbalanced) observations: 2260 
White period instrument weighting matrix 
White period standard errors & covariance (d.f. corrected)
Instrument specification: @DYN(INVENTORIES,-2) D(TOBINQ)
Constant added to instrument list 
VariableCoefficientStd. Errort-StatisticProb.  
INVENTORIES(-1)-0.0618300.028607-2.1613290.0308
LIQUIDITY-18.6411410.11710-1.8425390.0655
LEVERAGE2.5242470.7790493.2401670.0012
CASH_FLOW4.7545570.9902344.8014480.0000
TOBINQ0.2927020.1636711.7883520.0739
     
 Effects Specification  
     
Cross-section fixed (first differences) 
     
     
Mean dependent var-0.028118    S.D. dependent var0.669318
S.E. of regression0.749639    Sum squared resid1267.215
J-statistic38.10310    Instrument rank37
Prob(J-statistic)0.211459   
     
Arellano-Bond Serial Correlation Test  
Equation: EQ01_INVENTORIES   
Date: 10/02/17   Time: 11:09   
Sample: 2007 2016   
Included observations: 2260   
Test orderm-Statistic rho     SE(rho)Prob.  
AR(1)-9.563193-437.03636045.6998390.0000 
AR(2)-0.659621-18.31680427.7686800.5095 
4.2. Ví dụ bằng Stata cho việc xet xét đầu tư tác động tăng trưởng GDP
. import excel "Đường  dẫn tới file số liệu\ So lieu phan tich.xlsx", sheet("Slieu") firstrow clear
. encode Country, gen(Qgia)
. xtset Qgia Year
       panel variable:  Qgia (strongly balanced)
        time variable:  Year, 1971 to 2016
                delta:  1 unit

. xtabond2 GDPg l.GDPg FDI GDP Inflation Gross Urban, gmm (GDPg FDI GDP Inflation Gross ) small noconst
Favoring speed over space. To switch, type or click on mata: mata set matafavor space, perm.
Warning: Number of instruments may be large relative to number of observations.
 
Dynamic panel-data estimation, one-step system GMM
------------------------------------------------------------------------------
Group variable: qgia                            Number of obs      =       741
Time variable : Year                            Number of groups   =        19
Number of instruments = 728                     Obs per group: min =        39
F(6, 735)     =     59.88                                      avg =     39.00
Prob > F      =     0.000                                      max =        39
------------------------------------------------------------------------------
        GDPg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        GDPg |
         L1. |    .145992   .0364094     4.01   0.000     .0745132    .2174708
             |
         FDI |   .2836637   .0835095     3.40   0.001     .1197181    .4476092
         GDP |  -.0001067   .0000349    -3.06   0.002    -.0001752   -.0000382
   Inflation |  -.0016668   .0003958    -4.21   0.000    -.0024438   -.0008898
       Gross |   .1148198   .0191629     5.99   0.000     .0771992    .1524403
       Urban |  -.2894683   .1062626    -2.72   0.007    -.4980828   -.0808538
------------------------------------------------------------------------------
Instruments for first differences equation
  GMM-type (missing=0, separate instruments for each period unless collapsed)
    L(1/39).(GDPg FDI GDP Inflation Gross)
Instruments for levels equation
  GMM-type (missing=0, separate instruments for each period unless collapsed)
    D.(GDPg FDI GDP Inflation Gross)
------------------------------------------------------------------------------
Arellano-Bond test for AR(1) in first differences: z =  -4.39  Pr > z =  0.000
Arellano-Bond test for AR(2) in first differences: z =  -1.04  Pr > z =  0.298
------------------------------------------------------------------------------
Sargan test of overid. restrictions: chi2(722)  = 764.50  Prob > chi2 =  0.132
  (Not robust, but not weakened by many instruments.)
 
Difference-in-Sargan tests of exogeneity of instrument subsets:
  GMM instruments for levels
    Sargan test excluding group:     chi2(667)  = 727.77  Prob > chi2 =  0.051
    Difference (null H = exogenous): chi2(55)   =  36.73  Prob > chi2 =  0.972

0 nhận xét:

Đăng nhận xét

PHƯƠNG PHÁP ĐỊNH LƯỢNG'S BLOG GỬI LỜI CẢM ƠN CHÂN THÀNH TỚI CÁC BẠN HỌC VIÊN, BẠN BÈ, ĐỒNG NGHIỆP, KHÁCH HÀNG ĐÃ ỦNG HỘ CHÚNG TÔI!