Rất nhiều bạn hỏi
xin số liệu, điều mà tôi không thể đáp ứng như đã giải thích trong bài bên dưới.
Tôi hiểu khó khăn của các bạn vì tôi cũng đã từng trải qua hoàn cảnh tương tự,
bởi vậy tôi đã cố gắng giải thích các giải pháp tìm số liệu trong bài viết dưới
đây. Vì thời gian có hạn tôi sẽ không trả các câu hỏi liên quan đến xin dữ liệu
nữa, mong các bạn thông cảm.
Thời gian gần đây
tôi nhận được rất nhiều comment trên blog và email của các bạn sinh viên hỏi
xin số liệu kinh tế. Mặc dù có một số request không thực sự nghiêm túc, đa số
các bạn đều hiểu mình làm gì và cần dữ liệu gì. Đây là dấu hiệu tốt vì nó chứng
tỏ chất lượng đào tạo kinh tế đang được cải thiện và các bạn sinh viên đang dần
dần tiếp cận với những lý thuyết và mô hình định lượng rất tiên tiến chứ không
chỉ viết "essay" như trước. Đáng tiếc là tôi không thể đáp ứng được hầu
hết request của các bạn vì hai lý do sau.
Thứ nhất nguồn số liệu
mà tôi sử dụng (từ Datastream của Thomson Reuters) có bản quyền nên tôi không
thể công bố rộng rãi. Trước đây tôi đã để link cho các bạn download số liệu GDP
và REER của VN, mặc dù không hoàn toàn legal nhưng có thể justify được phần nào
vì thực ra những số liệu đó được TCTK công bố công khai trên website và các ấn
phẩm của họ. Hơn nữa đó là những số liệu liên quan trực tiếp đến những bài viết
mà tôi công bố (về potential GDP và REER) nên theo truyền thống của giới
academic quốc tế những số liệu đó cần phải được công khai để người đọc có thể
kiểm tra lại kết quả tính toán của tôi nếu họ muốn. Thứ hai là ngay cả
Datastream và các dịch vụ số liệu chuyên nghiệp cũng có nhiều hạn chế về số liệu
kinh tế VN, cả về số lượng lẫn chất lượng. Tôi đã từng chỉ ra số liệu về lãi suất
qua đêm liên ngân hàng của Datastream khác xa số liệu của NHNN. Một số sai lệch
khác về số liệu lạm phát của Datastream so với TCTK cũng đã từng làm tôi đau đầu.
Bởi vậy ngoại trừ những chuối số liệu phổ biến và có chất lượng tương đối tốt,
tôi sẽ phải mất rất nhiều thời gian browse/search Datastream và các nguồn khác
để tìm các chuỗi số liệu đặc thù mà một số bạn request, điều này ngoài khả năng
của tôi.
Nói như vậy không có
nghĩa tôi sẽ không giúp các bạn tìm số liệu cho những nghiên cứu định lượng của
mình, thực ra tôi rất khuyến khích các bạn đi theo hướng nghiên cứu này vì đó
là cách học kinh tế rất thực dụng và hữu ích. Tôi cũng rất thấu hiểu những khó
khăn về số liệu mà các bạn đang phải đối đầu, tôi đã từng là sinh viên như các
bạn. Trong entry này tôi muốn truyền lại một số kinh nghiệm của bản thân thời
còn đi học để các bạn có thể tự tìm kiếm số liệu trước khi phải nhờ một ai đó,
tôi luôn cho rằng kỹ năng và kiến thức về nguồn số liệu là những điều rất căn bản
mà sinh viên kinh tế cần học.
Điều đầu tiên trước
khi bạn bắt tay tìm kiếm số liệu là phải hiểu thật rõ mô hình lý thuyết mà mình
định ước lượng. Cần hiểu kỹ các lý thuyết đằng sau nó và các mối quan hệ giữa
các biến số. Điều này quan trọng vì hầu hết các số liệu thống kê thực tế không
bao giờ trùng với khái niệm lý thuyết nên hiểu kỹ lý thuyết vừa giúp các bạn
tránh chọn sai số liệu vừa giúp mở rộng tập hợp các số liệu có khả năng thay thế
chuỗi số liệu mình không thể tìm được. Lấy ví dụ bạn có một mô hình cần sử dụng
M3, tuy nhiên VN không có thống kê M3 nên bạn cần cân nhắc mô hình lý thuyết để
xem thay M2 hay total credit vào mô hình đó liệu có được không. Hiểu mô hình lý
thuyết còn giúp các bạn chọn instrument variables cho một số phương pháp
econometric đặc thù.
Vấn đề thứ hai cần
quan tâm là phải/nên hiểu bản chất và cách thức dữ liệu được thu thập/compile.
Thực ra theo tôi đãy là thiếu sót của hầu hết các chương trình đào tạo kinh tế
(cả ở các trường đại học nước ngoài) khi không dạy cho sinh viên về các thống
kê kinh tế chủ yếu (cách thức thu thập, tính toán, hiệu chỉnh mùa vụ...). Hiểu
được bản chất của chuỗi dữ liệu giúp bạn định hình được nó có thực sự phù hợp với
mô hình định lượng của mình hay không. Nếu chạy mô hình xong kết quả không như
mong đợi hoặc khác với kết quả của những nghiên cứu (ở các nước khác) thì đó là
do dữ liệu hay do phương pháp tính toán của mình có sai sót. Có những bạn hỏi
xin tôi số liệu về output gap, inflation expectation hay equity risk premium,
cho thấy sự mơ hồ về chuỗi số liệu trong mô hình của mình. Hoặc những câu hỏi về
đơn vị của REER, làm thế nào để chuyển năm gốc cho một chuối số liệu thực, có
bao nhiêu loại hàng hóa trong rổ tính CPI, có thể tìm số liệu GDP theo tháng
hay không, cũng cho thấy các bạn chưa thực sự quan tâm tìm hiểu về chuỗi số liệu
của mình. Cần nhớ một nửa của kinh tế học là số liệu thống kê.
Với các bạn đang học
undergraduate thì nguồn số liệu đầu tiên bạn phải nghĩ đến là thư viện trường
mình (và các trường khác nếu bạn có thể tiếp cận được). Thời buổi mọi thứ được
số hóa như hiện nay, có lẽ khó có thể nghĩ đến việc mất vài ngày thậm chí vài
tuần vào lục thư viện và gõ lại số liệu vào máy tính, nhưng đó là những gì tôi
đã làm khi còn đi học. Rất may là ngày nay thư viện đã và đang chuyển dần sang
hình thức điện tử. Tôi biết các thư viện ở VN có rất ít resource nhưng các bạn
vẫn nên tìm hiểu, hỏi các thủ thư xem họ có giúp được gì không. Một số database
quốc tế về dữ liệu và tạp chí chuyên ngành cho phép thư viện của các trường đại
học truy cập miễn phí, nhất là từ các nước đang phát triển. Các bạn (sinh viên
và giáo viên) nên góp ý với thư viện trường mình lập danh sách những database
nào họ có access để giúp sinh viên dễ dàng tìm kiếm số liệu.
Nguồn số liệu kinh tế
tiếp theo là website của các cơ quan quản lý và thống kê quốc gia như TCTK,
NHNN, BTC của VN. Những năm gần đây các cơ quan này đã có rất nhiều tiến bộ
trong việc công bố thông tin, tôi rất mong họ sẽ tiếp tục xây dựng website tốt
hơn nữa (có thể học tập template trên website của WB và IMF) và cung cấp thêm
nhiều thông tin hơn nữa. [Một điểm tôi mong muốn các website này cải thiện là họ
nên có một section về education cho đại chúng như các website của Fed, ECB,
OECD]. Các bạn sinh viên nên bỏ một chút thời gian tìm hiểu cấu trúc và các
ngóc ngách trên các trang web nói trên, nhất là website của TCTK. Nếu các bạn
thực sự quan tâm đến số liệu và có ý định làm nghiên cứu định lượng, nên
download số liệu về máy tính của mình và thỉnh thoảng cập nhận những database
cá nhân này. Một skill quan trọng của các analyst trong lĩnh vực finance là phải
nhớ được khi nào các cơ quan thống kê (cả nhà nước và tư nhân) release những
thông số quan trọng (GDP, CPI, PMI, unemployment rate...).
Nguồn dữ liệu thứ ba
là các website của các tổ chức quốc tế, vd WB, IMF, ADB, BIS, ILO, OECD. Trong
số các tổ chức này, IMF có nhiều thông tin nhất và là tổ chức duy nhất có số liệu
quí và tháng cho một số chỉ số quan trọng. IMF có một số database mà sinh viên
từ các nước đang phát triển có thể truy cập miễn phí như IFS, DOTS, COFER, các
bạn cần tìm hiểu và đang ký tài khoản để lấy số liệu. Rất tiếc vì tôi không thuộc
diện được access miễn phí nên tôi không thử và hướng dẫn các bạn được, tuy
nhiên đã có nhiều bạn confirm đã access thành công từ VN. Nếu có khó khăn gì
các bạn thử liên hệ với văn phòng của IMF ở VN xin giúp đỡ, tôi tin họ sẽ rất
nhiệt tình. Các bạn ở HN có thể đến thẳng văn phòng IMF và xin truy cập số liệu
từ đó. UNDP và ADB cũng có văn phòng ở HN, nguồn số liệu trên website của ADB
cũng rất tốt tuy chỉ có annual data.
Đối với số liệu nước
ngoài, nhất là các nước phát triển, ngoài các nguồn quốc tế như IMF, OECD, các
bạn có thể vào website của central bank của họ để tìm thông tin. Ví dụ website
của FED, ECB, RBA, BOE, BOJ, ngay cả Bank of Thailand hay People Bank of China
cũng có rất nhiều số liệu kinh tế. Một số nguồn không chuyên khác có số liệu tốt
dù không nhiều/dài như CIA Factbook, The Economist Indicators (không phải EIU cần
có tài khoản). Cuối cùng tất nhiên là Dr. Google và Google Scholar, người bạn
không thể thiếu cho những người làm nghiên cứu.
Một số links số liệu
quan trọng
Tổng cục Thống kê:
Đây là nguồn quan trọng nhất cho các bạn sinh viên, ngoài các thông số kinh tế
hàng tháng (chọn tháng trên dropdown menu có thể lấy được rất nhiều số liệu từ
năm 2004) các bạn có thể xem số liệu năm trong mục "Số liệu thống kê"
và số liệu của các cuộc điều tra kinh tế xã hội lớn (mục "Các cuộc điều
tra").
Ngân hàng Nhà nước:
Ngoài những chỉ số chính sách tiền tệ căn bản như các loại lãi suất chính sách
và tỷ giá bình quân liên ngân hàng (reference rate), mục "Thị trường tiền
tệ" có các thống kê về VNBOR, hoạt động thị trường mở và đấu thầu trái phiếu
chính phủ. Một địa chỉ nữa cho các bạn quan tâm đến tài chính, tiền tệ là Bảo
hiểm Tiền gửi Việt nam, mặc dù hiện tại chưa có nhiều số liệu.
Bộ Tài chính: Mục
"Ngân sách nhà nước" có thống kê về ngân sách, chi thu của VN, ngoài
ra còn có thông tin về các dự án ODA và đặc biệt là Bản tin nợ nước ngoài rất hữu
ích. Số liệu về ngân sách nhà nước cũng có thể tra cứu trên website của Chinh
phủ.
Bộ Lao động Thương
binh và Xã hội: Mục Dữ liệu của bộ này có rất nhiều thông tin, chủ yếu kết quả
của các cuộc khảo sát xã hội, rất có ích cho những bạn quan tâm đến labor
market và các vấn đề xã hội. Đa số dữ liệu được cung câp dưới dạng bảng Excel
khá tiện dụng.
Bộ Nông Nghiệp và
Phát triển Nông thôn: Mặc dù một số trang trên website của bộ này bị lỗi và còn
nhiều tài liệu không dùng Unicode, mục Thống kê - Dự báo có rất nhiều thông tin
quan trọng. Tôi tìm thấy thống kê về khí tượng thủy văn của VN ở đây chứ không
phải trên website của Bộ Tài nguyên Môi trường.
Bộ Công Thương: Mục
Thống kê của bộ này rất tốt, số liệu xuất nhập khẩu khá chi tiết (các bạn có thể
update bảng số liệu REER/NEER mà tôi cung cấp trước đây bằng số liệu xuất nhập
khẩu từ trang web này). Phần thông tin về vốn đầu tư cũng khá chi tiết.
[Bộ Kế hoạch và Đầu
tư, Bộ Tài nguyên Môi trường, Bộ Khoa học Công nghệ là những bộ tôi rất thất vọng
vì không có các cơ sở dữ liệu/thống kê chuyên ngành đáng ra phải có.]
IMF: Như đã nói bên
trên, IMF có một số database rất quan trọng về kinh tế vĩ mô, theo tôi được biết
họ cung cấp miễn phí cho các nước đang phát triển nên các bạn ở VN có thể truy
cập được. Những database quan trọng là WEO, IFS, DOTS, BOPS, GFS. Ngoài ra
trong chuyên mục Vietnam and the IMFcũng có rất nhiều thông tin. Khi còn là
sinh viên và không có truy cập vào IFS tôi thường xuyên vào chuyên mục này lấy
số liệu của VN từ các Staff Report và Statistical Appendixes do văn phòng IMF
Vietnam công bố hàng năm. Trong chuyên mục này cũng có rất nhiều bài nghiên cứu
quan trọng về VN của các chuyên gia IMF. Năm ngoái có một bài về Output gap của
VN sử dụng Bayesian estimation những bạn quan tam về vấn đề này nên tham khảo.
IMF website là nguồn số liệu tất cả sinh viên kinh tế bắt buộc phải biết.
WB: Cách đây mấy năm
WB đã cho access miễn phí vào tất cả các database của họ (thời tôi đi học chỉ
được access vào World Development Indicators). Số liệu của WB rất rộng và họ bắt
đầu có các chuỗi số liệu theo quí (trước đây chỉ có số liệu theo năm). Đây cũng
là nguồn số liệu bắt buộc cho sinh viên kinh tế.
ADB: Số liệu của tổ
chức này rất tốt, tiếc là cũng chỉ có annual data như WB. Chuyên mục Key
Indicators có rất nhiều bảng Excel số liệu được update hàng năm (và có lẽ là
data source duy nhất lưu trữ theo vintage, nghĩa là các version khác nhau hàng
năm).
UNDP: Tổ chức này có
một database quan trọng liên quan đến chỉ số Human Development Indicator được sử
dụng rộng rãi trong các nghiên cứu kinh tế.
UNCTADSTAT: Database
của Unctad, một tổ chức thuộc UN tương tự như UNDP, chuyên về trade data. Số liệu
ngoại thương ở database này (cho VN) tương đương như của Bộ Công thương và DOTS
của IMF tôi trích dẫn bên trên.
BIS: Mặc dù không có
nhiều số liệu về VN, đây là địa chỉ quan trọng cho những bạn quan tâm đến số liệu
banking and finance quốc tế.
OECD: database này
chủ yếu phục vụ cho các thành viên của OECD nhưng có rất nhiều chỉ số quốc tế
(một số phải trả tiền).
FRED (của Fed St
Louis): Trong số các website của các ngân hàng trung ương, đây là database lớn
nhất và uy tín nhất với gần như toàn bộ số liệu macro của Mỹ, có những chuỗi
dài gần 100 năm. Database này cũng có số liệu của một số nước phát triển khác.
Ngoài ra Fed còn có một số data tại địa chỉ này và hầu hết các chi nhánh Fed
khác cũng cung cấp dữ liệu (NY, Kansas, San Francisco, Chicago, Cleveland).
Các central banks lớn
khác như ECB, BoE, BoJ, RBA, tuy nhiên số liệu chủ yếu cho các nước của họ.
Pen World Table: một
nguồn số liệu về national account tính theo PPP cho gần như tất cả các nước.
Đây là một database lâu đời và rất uy tín trong giới học thuật tuy nhiên số liệu
update chậm hơn so với nguồn WB và IMF.
The World Top Income
Database: số liệu về VN đang được thu thập, hi vọng sẽ có sớm.
Economagic.com: số
liệu của Mỹ và một số của Úc, ECB, BoJ
Knoema.com: số liệu
kinh tế xã hội quốc tế, có khá nhiều số liệu thú vị về VN.
UN Trade data: số liệu
thương mại của các nước, đặc biệt là Comtrade databasedatabase cho từng mặt
hàng
UN Economic
Statistics: số liệu kinh tế tổng hợp của các nước
Một số nguồn dữ liệu
tài chính
Damodaran: GS
Aswarth Damodaran (NYU) cung cấp một database rất lớn về số liệu của các công
ty đại chúng (US and non-US, trong đó có một số công ty VN). Website này còn
cung cấp một số spreadsheet tính toán liên quan đến valuation rất hữu ích cho
các bạn sinh viên tài chính.
Quandl: Một website
cung cấp số liệu miễn phí tương đối mới nhưng rất có triển vọng. Bạn có thể
download rất nhiều số liệu kinh tế và tài chính của các nước.
(Danh sách này sẽ tiếp
tục được bổ sung trong tương lai, nếu bạn nào biết link nào hữu ích muốn chia sẻ
thì báo cho tôi qua email hoặc để lại link dưới phần comment).
0 nhận xét:
Đăng nhận xét