DỊCH VỤ CHUYÊN NGHIỆP TẬN TÂM

XỬ LÝ SỐ LIỆU SPSS, EVIEWS, STATA, HỖ TRỢ NGHIÊN CỨU THẠC SĨ

SPSS HAY AMOS?

 Khi làm luận văn sẽ có một câu hỏi đặt ra là nghiên cứu của mình sẽ sử dụng SPSS để thực hiện hồi quy đa biến hay sử dụng mô hình cấu trúc tuyến tính SEM trong AMOS để xử lý, tìm hiểu thêm về việc lựa chọn SPSS hay AMOS (phương pháp tiếp cận CB-SEM) sao cho phù hợp nhất?



Ngày nay, việc sử dụng thang đo cảm nhận định lượng hay thang đo Likert scale hay thang đo khoảng với 5 mức độ, 7 mức độ, 9 mức độ, … trong các nghiên cứu, luận văn được sử dụng rộng rãi trong hầu hết lĩnh vực nghiên cứu như quản trị, kinh tế, marketing, tâm lý, giáo dục, y dược, xã hội nhân văn, thể thao, … Việc tiếp cận phân tích này có 3 cấp độ khác nhau. Phân biệt được cách tiếp cận này trong nghiên cứu sẽ giúp chúng ta lựa chọn phương pháp và phần mềm phù hợp.

(1) Cách tiếp cận thứ nhất:

Đánh giá độ tin cậy thang đo => Phân tích nhân tố khám phá => Hồi quy đa biến

Cách tiếp cận này thường phù hợp cho các nghiên cứu sử dụng mô hình hồi quy một cấp hay hồi quy với một biến phụ thuộc. Trong trường hợp này, phần mềm SPSS được sử dụng cho phân tích nhân tố khám phá (EFA) và hồi quy đa biến là phù hợp.

Lưu ý: Phương pháp EFA ứng dụng cho Hồi quy thường sử dụng phương pháp trích: Principal component; phương pháp xoay: varimax. Phương pháp tạo nhân số được dụng cho trường hợp này.

(2) Cách tiếp cận thứ hai:

Đánh giá độ tin cậy thang đo => Phân tích nhân tố khám phá (=> Phân tích nhân tố khẳng định) => Phân tích đường dẫn Paths

Cách tiếp cận này thường phù hợp cho các nghiên cứu sử dụng mô hình hồi quy nhiều cấp hay nhiều mô hình hồi quy hay nhiều biến biến phụ thuộc hay hồi quy có biến trung gian. Trong trường hợp này, phần mềm SPSS được sử dụng cho phân tích nhân tố khám phá (EFA); AMOS được sử dụng cho Phân tích nhân tố khẳng định (CFA) và phân tích đường dẫn Paths.

Lưu ý: Phương pháp EFA ứng dụng cho Paths có thể sử dụng (1) phương pháp trích: Principal component; phương pháp xoay: varimax; (2) phương pháp trích: Principal axis factoring, phương pháp trích: promax. Phương pháp tạo nhân số được dụng cho trường hợp này.

(3) Cách tiếp cận thứ ba:

Đánh giá độ tin cậy thang đo => Phân tích nhân tố khám phá (EFA) => Phân tích nhân tố khẳng định (CFA) => Phân tích mô hình cấu trúc tuyến tính (CB-SEM)

Tương tự như Paths về tiếp cận nhưng mô hình SEM sử dụng để ước lượng các mô hình đo lường (Mesurement Model) và mô hình cấu trúc (Structure Model) của bài toán lý thuyết đa biến. Phương pháp tạo nhân số không cần sử dụng cho trường hợp này.

-Công dụng và lợi thế của CB-SEM:

Kiểm định:

🎯 Các giả thuyết về các quan hệ nhân quả có phù hợp (FIT) với dữ liệu thực nghiệm hay không

🎯 Khẳng định (Confirmating) các quan hệ giữa các biến

🎯 Các quan hệ giữa các biến quan sát và không quan sát (biến tiềm ẩn)

Cho phép:

🎯 Ước lượng giá trị khái niệm (cấu trúc nhân tố)

🎯 Thực hiện đồng thời nhiều biến phụ thuộc (nội sinh)

🎯 Cung cấp các chỉ số độ phù hợp cho các mô hình kiểm định

🎯 Cho phép cải thiện các mô hình (MI_ Modification Indices)

🎯 SEM thường là một phức hợp giữa một số lượng lớn các biến quan sát và tiềm ẩn, các phần dư và sai số

Mô hình SEM phối hợp được tất cả các kỹ thuật gồm Hồi quy đa biến, Phân tích nhân tố, Phân tích mối quan hệ tương quan. Trong trường hợp này, phần mềm SPSS được sử dụng cho phân tích nhân tố khám phá (EFA); AMOS được sử dụng cho phân tích CFA và CB-SEM.

Lưu ý: Phương pháp EFA ứng dụng cho CB-SEM thường sử dụng phương pháp trích: Principal axis factoring, phương pháp trích: promax.

🌟Kết luận:

Để đánh giá tổng thể một mô hình gồm nhiều ước lượng hồi quy, tương quan hay nhiều biến phụ thuộc hay mô hình có biến trung gian,v.v. hoặc sử dụng CFA, Paths, CB-SEM thì ưu tiên dùng AMOS.

Với mô hình đơn giản với một biến phụ thuộc, vai trò của các item không khác biệt đáng kể, không có biến trung gian thì chỉ cần dùng SPSS là đủ để đánh giá.

Chia sẻ kinh nghiệm bảo vệ luận văn thạc sĩ trước hội đồng

 Các kinh nghiệm bảo vệ luận văn thạc sĩ sẽ giúp bạn hạn chế được những lỗi cơ bản và nghiêm trọng hay mắc phải trong quá trình bảo vệ luận văn nhằm đạt được số điểm luận văn như mong muốn.

Kinh nghiệm bảo vệ luận văn thạc sĩ được đúc kết từ những buổi thuyết trình luận văn thạc sĩ trong thực tiễn, bao gồm toàn bộ các bước từ lúc chuẩn bị đến khi kết thúc buổi bảo vệ luận văn.



1. Các bước chuẩn bị cho bài thuyết trình bảo vệ luận văn thạc sĩ

Kinh nghiệm bảo vệ luận văn thạc sĩ đầu tiên mà chúng tôi muốn chia sẻ với bạn là những bước bạn cần chuẩn bị trước khi đứng trước hội đồng chấm luận văn để bảo vệ luận văn thạc sĩ.

Khoảng gần 1 tháng trước ngày bảo vệ luận văn dự kiến, bạn cần nộp các loại giấy tờ liên quan đến việc bảo vệ luận văn thạc sĩ tại phòng đào tạo sau đại học, bao gồm:

Giấy đề nghị cho phép bảo vệ luận văn thạc sĩ của giảng viên hướng dẫn hoặc đơn xin bảo vệ luận văn thạc sĩ của bạn.

1. Chứng chỉ Anh Văn (B1) bản sao có công chứng.

2. Lý lịch khoa học của bạn (đã có chứng nhận của cơ quan chủ quản)

3. Bằng tốt nghiệp đại học bản sao có công chứng (Kèm theo bảng điểm).

4. 5 bản sao photo luận văn có đóng bìa mềm.

Sau khi hoàn thành bảo vệ luận văn thạc sĩ, bạn cần hoàn thành những điều sau: 

5. Chỉnh sửa lại luận văn theo những gợi ý của hội đồng thẩm định (nếu có).

6. Photo 2 bản luận văn và chép nội dung vào 1 đĩa CD nộp đến bộ phận đào tạo sau đại học để lưu giữ luận văn. 

Lưu ý: Tùy vào từng trường đại học mà có những quy định về hồ sơ khác nhau. Bạn cần tìm hiểu kỹ các yêu cầu của trường đại học sẽ chấm bài bảo vệ luận văn thạc sĩ của mình để thực hiện cho chính xác. 

2. Cách trình bày bảo vệ luận văn thạc sĩ

Với kinh nghiệm bảo vệ luận văn thạc sĩ của Tổng đài Luận văn 1080, bạn cần lưu ý những điều sau:

- Giới thiệu ngắn gọn về bản thân: họ tên đầy đủ, đề tài luận văn mà bạn bảo vệ.

- Sử dụng các từ nối như: Sau đây, thứ nhất, thứ hai, đầu tiên, tiếp theo, sau cùng, nếu như...thì…, vì thế, do đó… để mở vấn đề, dẫn dắt vấn đề, và kết thúc vấn đề, cũng như để chuyển từ ý này sang ý khác, chuyển từ slide này sang slide khác. Điều này sẽ giúp bài thuyết trình của bạn có tính liên kế và trôi chảy hơn.

- Vì tính chất của thuyết trình chủ yếu là nói nên bạn cần hạn chế việc đọc slide Powerpoint hay tài liệu. Hãy vận dụng kỹ năng diễn giải bằng ngôn ngữ và giọng nói tự nhiên nhất.

- Bạn nên chú ý thái độ của các giáo viên trong hội đồng chấm luận văn, nếu cảm thấy họ hơi nhàm chán với nội dung bạn đang thuyết trình, hãy lướt qua nhanh để đến với phần nội dung khác.

- Ưu tiên dành nhiều thời gian hơn để thuyết trình cho phần trọng tâm của bài luận.

- Cố gắng tương tác với hội đồng thẩm định luận văn và mọi người trong khán phòng nhiều nhất có thể bằng ánh mắt, bằng ngôn ngữ hình thể một cách tự tin và tự nhiên.

* Lưu ý: bạn chỉ có 15 phút để trình bày bài thuyết trình của mình nên bạn cần thuyết trình nhanh gọn và súc tích nhất có thể, để tránh hết thời gian mà vẫn chưa trình bày hết những gì bạn muốn nói trong luận văn. 

3. Cách trình bày luận văn thạc sĩ trước hội đồng

Ngày bảo vệ luận văn thạc sĩ là ngày rất quan trọng, nó quyết định sự thành bại của quá trình học tập của bạn trong một thời gian dài. Vì thế, trước khi trình bày luận văn thạc sĩ trước hội đồng, bạn cần chuẩn bị thật kỹ càng để có thể đạt được điểm số như mong muốn.

Cụ thể, theo kinh nghiệm bảo vệ luận văn thạc sĩ, khi trình bày trước hội đồng bạn cần chú ý những điểm sau: 

3.1. Chuẩn bị bài thuyết trình

Bạn cần chuẩn bị bài thuyết trình của mình thật kỹ lưỡng trước khi bước vào phòng bảo vệ luận án trước hội đồng, bao gồm: 

- Chuẩn bị file powerpoint thật đẹp, súc tích, đúng chuẩn và không bị lỗi font.

- Kiểm tra laptop để đảm bảo không bị lỗi về kỹ thuật và không hết pin. 

- Chép file vào một usb dự phòng để xử lý kịp thời nếu laptop của bạn hỏng hoặc hội đồng yêu cầu dùng laptop mà họ chuẩn bị sẵn. 

- Tập thuyết trình thử để đảm bảo bạn sẽ thuyết trình lưu loát và đúng thời gian quy định.

3.2. Quy định phân bổ thời gian thuyết trình:

Cũng như các sinh viên khác, bạn sẽ có tổng cộng 60 phút để thực hiện bài bảo vệ luận văn thạc sĩ của mình trước hội đồng, trong đó bao gồm thời gian dành cho thuyết trình, thời gian để hội đồng nhận xét và đặt câu hỏi, thời gian trả lời câu hỏi. Cụ thể, theo kinh nghiệm bảo vệ luận văn thạc sĩ của chúng tôi, các khoảng thời gian nên được phân bổ như sau:

- 15 phút đầu: Thuyết trình luận văn.

- 15 phút sau đó: Hội đồng chấm luận văn sẽ đưa ra nhận xét và các câu hỏi về bài luận văn (mỗi thầy cô thường hỏi khoảng 3 câu hoặc không hỏi).

- 30 phút còn lại: bạn sẽ trả lời và phản biện cho từng câu hỏi.

3.3. Cách trả lời câu hỏi phản biện

- Khi hội đồng đưa ra câu hỏi, bạn cần tiếp nhận một cách vui vẻ và cảm ơn cho từng câu hỏi.

- Bạn cần chuẩn bị sẵn giấy bút để ghi câu hỏi và ghi ngắn gọn các ý cho câu trả lời của bạn để tránh bỏ sót ý.

- Khi trả lời câu hỏi, bạn cần trả lời vào đúng trọng tâm, tránh trả lời lan man dài dòng.

- Bạn cần trả lời một cách bình tĩnh, tự tin và có sự giao tiếp bằng mắt với người đặt câu hỏi, cũng như ngôn ngữ hình thể phù hợp.

- Nếu câu hỏi quá khó mà bạn không thể trả lời được, bạn cứ thừa nhận điều đó với hội đồng và xin được biết câu trả lời từ họ.

4. Những lưu ý khác trong buổi thuyết trình bảo vệ luận văn thạc sĩ

- Bạn cần đến buổi thuyết trình với trang phục lịch sự, trang trọng, đầu tóc gọn gàng.

- Phong thái thuyết trình phải thật tự tin, nói to, rõ, và nhanh vừa phải. Tránh nói quá nhanh khiến người nghe không nắm được hết nội dung bạn đang nói. Ngược lại nếu bạn nói quá chậm thì sẽ gây nhàm chán và cũng không đảm bảo được thời gian.

- Nếu có thể, bạn hãy di chuyển một chút, tránh đứng yên một chỗ. Khi đó bài thuyết trình của bạn sẽ thu hút hơn rất nhiều.

- Cần thuyết trình khớp với nội dung của slide đang trình chiếu để người xem có thể theo kịp bài thuyết trình của bạn một cách tốt nhất. Vì thế bạn cần chuẩn bị một file powerpoint thật tốt, thực tập vừa nói vừa chạy slide, nắm rõ vị trí nội dung các slide để có những thay đổi kịp thời khi chạy slide sai với nội dung bạn đang nói.

- Không được quên lời cảm ơn các thầy cô trong ban hội đồng phản biện và tất cả những người đã đến tham dự buổi thuyết trình của bạn khi bạn hoàn thành xong buổi bảo vệ luận văn thạc sĩ của mình

Trên đây là những kinh nghiệm bảo vệ luận văn thạc sĩ mà chúng tôi đúc kết được từ thực tế. Hy vọng rằng những chia sẻ này có thể giúp bạn hoàn thành tốt buổi thuyết trình bảo vệ luận án học vị thạc sĩ của mình.

Phân tích tương quan Pearson trong SPSS

 Phân tích tương quan Pearson là một trong các bước chúng ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS. Thường bước này sẽ được thực hiện trước khi phân tích hồi quy.

Phân tích tương quan Pearson trong SPSS

Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau.

1. Lý thuyết về tương quan Pearson

Tương quan tuyến tính giữa hai biến là mối tương quan mà khi biểu diễn giá trị quan sát của hai biến trên mặt phẳng Oxy, các điểm dữ liệu có xu hướng tạo thành một đường thẳng. Theo Gayen (1951) , trong thống kê, các nhà nghiên cứu sử dụng hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Nếu một trong hai hoặc cả hai biến không phải là biến định lượng (biến định tính, biến nhị phân,…) chúng ta sẽ không thực hiện phân tích tương quan Pearson cho các biến này. 

Hệ số tương quan Pearson r có giá trị dao động từ -1 đến 1:

  • Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.
  • Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
  • Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.
  • Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.

Andy Field (2009) cho rằng mặc dù có thể đánh giá mối liên hệ tuyến tính giữa hai biến qua hệ số tương quan Pearson, nhưng chúng ta cần thực hiện kiểm định giả thuyết hệ số tương quan này có ý nghĩa thống kê hay không. Kết quả kiểm định nếu sig kiểm định nhỏ hơn 0.05, cặp biến có tương quan tuyến tính với nhau; nếu sig lớn hơn 0.05, cặp biến không có tương quan tuyến tính (giả định lấy mức ý nghĩa 5% = 0.05).

Khi đã xác định hai biến có mối tương quan tuyến tính (sig nhỏ hơn 0.05), chúng ta sẽ xét đến độ mạnh/yếu của mối tương quan này thông qua trị tuyệt đối của r. Theo Andy Field (2009):

  • |r| < 0.1: mối tương quan rất yếu
  • |r| < 0.3: mối tương quan yếu 
  • |r| < 0.5: mối tương quan trung bình
  • |r| ≥ 0.5: mối tương quan mạnh

2. Phân tích tương quan Pearson trên SPSS 26

Thực hiện phân tích tương quan để đánh giá mối quan hệ giữa các biến bằng cách vào Analyze > Correlate > Bivariate…

tuong quan pearson spss

Tại đây, chúng ta đưa hết tất cả các biến muốn chạy tương quan Pearson vào mục Variables. Để tiện cho việc đọc kết quả, chúng ta nên đưa biến phụ thuộc lên trên cùng. Trong ví dụ bên dưới biến phụ thuộc là F_HL, các biến còn lại là độc lập. Nhấp vào OK để xác nhận thực hiện lệnh.

tuong quan pearson spss

Kết quả tương quan Pearson sẽ được thể hiện trong bảng Correlations. Điểm qua các ký hiệu trong bảng này: Pearson Correlation là hệ số tương quan Pearson (r), Sig. (2-tailed) là giá trị sig của kiểm định t đánh giá hệ số tương quan Pearson có ý nghĩa thống kê hay không, N là cỡ mẫu. 

tuong quan pearson spss

3. Đọc kết quả tương quan Pearson

Chúng ta sẽ xem xét hai loại mối quan hệ tương quan: tương quan giữa biến phụ thuộc với các biến độc lập và tương quan giữa các biến độc lập với nhau. Sở dĩ việc chia ra như vậy, vì sự kỳ vọng về kết quả sẽ có đôi chút khác biệt giữa hai loại mối quan hệ này.

3.1 Tương quan giữa biến độc lập với biến phụ thuộc

Trong bảng kết quả bên trên là các giá trị sig được tô màu đỏ. Khi xây dựng mô hình nghiên cứu chúng ta đã tìm hiểu rất kỹ để tìm ra các biến độc lập có sự tác động lên biến phụ thuộc. Việc đưa ra các biến độc lập này dựa trên nền tảng cơ sở lý thuyết, các nghiên cứu tương tự trước đó và sự đánh giá tình hình thực tế tại môi trường khảo sát. Do đó, chúng ta kỳ vọng rằng kết quả phân tích từ dữ liệu sẽ cho thấy các biến độc lập có sự tương quan với biến phụ thuộc hoặc có sự tác động lên biến phụ thuộc. Nếu chúng ta thực hiện phân tích tương quan trước hồi quy, kết quả từ tương quan Pearson cho thấy biến độc lập có tương quan với biến phụ thuộc, khả năng biến độc lập đó sẽ tác động lên biến phụ thuộc ở hồi quy sẽ cao hơn.

Trong bảng kết quả ví dụ, sig kiểm định t tương quan Pearson các giữa sáu biến độc lập F_LD, F_DN, F_CV, F_TL, F_DT, F_DK với biến phụ thuộc F_HL đều nhỏ hơn 0.05. Như vậy, có mối liên hệ tuyến tính giữa các biến độc lập này với biến phụ thuộc.

Kỳ vọng: sig tương quan giữa độc lập với phụ thuộc nhỏ hơn 0.05 và hệ số tương quan càng cao càng tốt.

3.2 Tương quan giữa các biến độc lập với nhau

Trong bảng kết quả bên trên là các giá trị sig được tô màu xanh dương. Tên gọi “biến độc lập” phần nào nói lên được đặc điểm kỳ vọng của dạng biến này: chúng độc lập về ý nghĩa với nhau. Giữa hai biến độc lập nếu có sự tương quan quá mạnh, có khả năng hai biến này bản chất chỉ là một biến, một khái niệm. Hai biến độc lập không có tương quan (sig lớn hơn 0.05) thì gần như không có khả năng xảy ra cộng tuyến giữa hai biến này. Hai biến độc lập có tương quan (sig nhỏ hơn 0.05) và trị tuyệt đối hệ số tương quan lớn hơn 0.7 thì khả năng xảy ra cộng tuyến giữa chúng là tương đối cao (Carsten F. Dormann và các cộng sự, 2013).

Cần lưu ý, khi đánh giá đa cộng tuyến chúng ta nên kết hợp hệ số tương quan Pearson ở bước này cùng với chỉ số VIF trong phân tích hồi quy tuyến tính để có thể đưa ra đánh giá một cách chính xác nhất. Bạn xem cách đánh giá VIF tại bài viết Đa cộng tuyến: Nguyên nhân, dấu hiệu nhận biết và cách khắc phục.

Kỳ vọng: (1) sig tương quan giữa các biến độc lập lớn hơn 0.05 hoặc (2) sig nhỏ hơn 0.05 và hệ số tương quan sẽ càng thấp càng tốt (nên dưới 0.5).

** Ý NGHĨA 2 DÒNG CUỐI TRONG KẾT QUẢ PEARSON

Khi sig nhỏ hơn 0.05 thì chỗ hệ số tương quan Pearson chúng ta sẽ thấy ký hiệu * hoặc **.

  • Ký hiệu ** cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 99% (tương ứng mức ý nghĩa 1% = 0.01). 
  • Ký hiệu * cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 95% (tương ứng mức ý nghĩa 5% = 0.05). 

Phân tích và đọc kết quả hồi quy tuyến tính bội trong SPSS

 Hồi quy tuyến tính là phép hồi quy xem xét mối quan hệ tuyến tính – dạng quan hệ đường thẳng giữa biến độc lập với biến phụ thuộc. 

Hồi quy đa biến trong SPSS

1. Lý thuyết hồi quy tuyến tính

Trong nghiên cứu, chúng ta thường phải kiểm định các giả thuyết về mối quan hệ giữa hai hay nhiều biến, trong đó có một biến phụ thuộc và một hay nhiều biến độc lập. Nếu chỉ có một biến độc lập, mô hình được gọi là mô hình hồi quy đơn biến SLR (Simple Linear Regression). Trường hợp có từ hai biến độc lập trở lên, mô hình được gọi là hồi quy bội MLR (Multiple Linear Regression). Những nội dung tiếp theo ở tài liệu này chỉ đề cập đến hồi quy bội, hồi quy đơn biến tính chất tương tự với hồi quy bội

- Phương trình hồi quy đơn biến: Y = β0 + β1X + e

- Phương trình hồi quy bội: Y = β0 + β1X1 + β2X2 + … + βnXn + e

Trong đó:

  • Y: biến phụ thuộc, là biến chịu tác động của biến khác.
  • X, X1, X2, Xn: biến độc lập, là biến tác động lên biến khác.
  • β0: hằng số hồi quy, hay còn được gọi là hệ số chặn. Đây là chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0. Nói cách khác, chỉ số này cho chúng ta biết giá trị của Y là bao nhiêu nếu không có các X. Khi biểu diễn trên đồ thị Oxy, β0 là điểm trên trục Oy mà đường hồi quy cắt qua.
  • β1β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho chúng ta biết về mức thay đổi của Y gây ra bởi X tương ứng. Nói cách khác, chỉ số này nói lên có bao nhiêu đơn vị Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị.
  • e: sai số. Chỉ số này càng lớn càng khiến cho khả năng dự đoán của hồi quy trở nên kém chính xác hơn hoặc sai lệch nhiều hơn so với thực tế. Sai số trong hồi quy tổng thể hay phần dư trong hồi quy mẫu đại diện cho hai giá trị, một là các biến độc lập ngoài mô hình, hai là các sai số ngẫu nhiên.

Trong thống kê, vấn đề chúng ta muốn đánh giá là các thông tin của tổng thể. Tuy nhiên vì tổng thể quá lớn, chúng ta không thể có được các thông tin này. Vì vậy, chúng ta dùng thông tin của mẫu nghiên cứu để ước lượng hoặc kiểm định thông tin của tổng thể. Với hồi quy tuyến tính cũng như vậy, các hệ số hồi quy tổng thể như β1β2 … hay hằng số hồi quy β0 là những tham số chúng ta muốn biết nhưng không thể đo lường được. Do đó, chúng ta sẽ sử dụng tham số tương ứng từ mẫu để ước lượng và từ đó suy diễn ra tổng thể. Phương trình hồi quy trên mẫu nghiên cứu:

Y = B0 + B1X1 + B2X2 + … + BnXn + ε

Trong đó:

  • Y: biến phụ thuộc
  • X, X1, X2, Xn: biến độc lập
  • B0: hằng số hồi quy
  •  B1B2, Bn: hệ số hồi quy
  • εphần dư

Tất cả các nội dung hồi quy tiếp sau đây chỉ nói về hồi quy trên tập dữ liệu mẫu. Do vậy, thuật ngữ sai số sẽ không được đề cập mà chỉ nói về phần dư.

2. Ước lượng hồi quy tuyến tính bằng OLS

Một trong các phương pháp ước lượng hồi quy tuyến tính phổ biến là bình phương nhỏ nhất OLS (Ordinary Least Squares). 

Với tổng thể, sai số (error) ký hiệu là e, còn trong mẫu nghiên cứu sai số lúc này được gọi là phần dư (residual) và được ký hiệu là ε. Biến thiên phần dư được tính bằng tổng bình phương tất cả các phần dư cộng lại. 

Nguyên tắc của phương pháp hồi quy OLS là làm cho biến thiên phần dư này trong phép hồi quy là nhỏ nhất. Khi biểu diễn trên mặt phẳng Oxy, đường hồi quy OLS là một đường thẳng đi qua đám đông các điểm dữ liệu mà ở đó, khoảng cách từ các điểm dữ liệu (trị tuyệt đối của ε) đến đường hồi quy là ngắn nhất.

Từ đồ thị scatter biểu diễn mối quan hệ giữa các biến độc lập và biến phụ thuộc, các điểm dữ liệu sẽ nằm phân tán nhưng có xu hướng chung tạo thành dạng một đường thẳng. Chúng ta có thể có rất nhiều đường đường thẳng hồi quy đi qua đám đông các điểm dữ liệu này chứ không phải chỉ một đường duy nhất, vấn đề là ta phải chọn ra đường thẳng nào mô tả sát nhất xu hướng dữ liệu. Bình phương nhỏ nhất OLS sẽ tìm ra đường thẳng đó dựa trên nguyên tắc cực tiểu hóa khoảng cách từ các điểm dữ liệu đến đường thẳng. Trong hình ở trên đường màu đỏ là đường hồi quy OLS.

3. Phân tích hồi quy tuyến tính bội trên SPSS

Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này lên biến phụ thuộc. Chúng ta vào Analyze > Regression > Linear…

Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.

Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.

Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.

Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp đưa biến vào, tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc Stepwise. Tính chất đề tài thực hành là nghiên cứu khẳng định, do vậy tác giả sẽ chọn phương pháp Enter đưa biến vào một lượt. Tiếp tục nhấp vào OK. 

SPSS sẽ xuất ra rất nhiều bảng, chúng ta sẽ tập trung vào các bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.

3.1 Bảng ANOVA

Chúng ta cần đánh giá độ phù hợp mô hình một cách chính xác qua kiểm định giả thuyết. Để kiểm định độ phù hợp mô hình hồi quy, chúng ta đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, mô hình hồi quy là phù hợp.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, mô hình hồi quy không phù hợp.
Trong SPSS, các số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.

Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy. Giá trị sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.

3.2 Bảng Model Summary

Các điểm dữ liệu luôn phân tán và có xu hướng tạo thành dạng một đường thẳng chứ không phải là một đường thẳng hoàn toàn. Do đó, hầu như không có đường thẳng nào có thể đi qua toàn bộ tất cả các điểm dữ liệu, luôn có sự sai lệch giữa các giá trị ước tính và các giá trị thực tế. Chúng ta sẽ cần tính toán được mức độ sai lệch đó cũng như mức độ phù hợp của mô hình hồi quy tuyến tính với tập dữ liệu. 

(Bên trái là độ phù hợp mô hình cao, bên phải là độ phù hợp mô hình thấp)

Một thước đo sự phù hợp của mô hình hồi quy tuyến tính thường dùng là hệ số xác định R2 (R square). Khi phần lớn các điểm dữ liệu tập trung sát vào đường hồi quy, giá trị R2 sẽ cao, ngược lại, nếu các điểm dữ liệu phân bố rải rác cách xa đường hồi quy, R2 sẽ thấp. Chỉ số R2 nằm trong bảng Model Summary.

Khi chúng ta đưa thêm biến độc lập vào phân tích hồi quy, R2 có xu hướng tăng lên. Điều này dẫn đến một số trường hợp mức độ phù hợp của mô hình hồi quy bị thổi phồng khi chúng ta đưa vào các biến độc lập giải thích rất yếu hoặc không giải thích cho biến phụ thuộc. Trong SPSS, bên cạnh chỉ số R2, chúng ta còn có thêm chỉ số R2 Adjusted (R2 hiệu chỉnh). Chỉ số R2 hiệu chỉnh không nhất thiết tăng lên khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ phù hợp của mô hình chính xác hơn hệ số R2

R2 hay R2 hiệu chỉnh đều có mức dao động trong đoạn từ 0 đến 1. Nếu R2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc, và ngược lại, R2 càng tiến về 0, các biến độc lập giải thích càng ít cho biến phụ thuộc. 

Không có tiêu chuẩn chính xác R2 ở mức bao nhiêu thì mô hình mới đạt yêu cầu. Cần lưu ý rằng, không phải luôn luôn một mô hình hồi quy có R2 cao thì nghiên cứu có giá trị cao, mô hình có R2 thấp thì nghiên cứu đó có giá trị thấp, độ phù hợp mô hình hồi quy không có mối quan hệ nhân quả với giá trị của bài nghiên cứu. Trong nghiên cứu lặp lại, chúng ta thường chọn mức trung gian là 0.5 để phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu và kỳ vọng từ 0.5 đến 1 thì mô hình là tốt, bé hơn 0.5 là mô hình chưa tốt. Tuy nhiên, điều này không thực sự chính xác bởi việc đánh giá giá trị R2 sẽ phụ thuộc rất nhiều vào các yếu tố như lĩnh vực nghiên cứu, tính chất nghiên cứu, cỡ mẫu, số lượng biến tham gia hồi quy, kết quả các chỉ số khác của phép hồi quy,… 

Trong ví dụ ở trên, bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình. Giá trị R bình phương hiệu chỉnh bằng 0.695 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 69.5% sự biến thiên của biến phụ thuộc, còn lại 31.4% là do các biến ngoài mô hình và sai số ngẫu nhiên. 

Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để đánh giá hiện tượng tự tương quan chuỗi bậc nhất. Giá trị DW = 1.849, nằm trong khoảng 1.5 đến 2.5 nên kết quả không vi phạm giả định tự tương quan chuỗi bậc nhất (Yahua Qiao, 2011).

3.3 Bảng Coefficients

Chúng ta sẽ đánh giá hệ số hồi quy của mỗi biến độc lập có ý nghĩa trong mô hình hay không dựa vào kiểm định t (student) với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi bằng 0. Mô hình hồi quy có bao nhiêu biến độc lập, chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa (trong SPSS gọi là B) và đã chuẩn hóa (trong SPSS gọi là Beta). Mỗi hệ số hồi quy này có vai trò khác nhau trong việc diễn giải hàm ý quản trị của mô hình hồi quy. Để hiểu khi nào dùng phương trình hồi quy nào, bạn có thể xem bài viết Sự khác nhau giữa hệ số hồi quy chuẩn hóa và chưa chuẩn hóa

Nếu hệ số hồi quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc. Ngược lại nếu B hoặc Beta không có dấu (dấu dương), nghĩa là biến độc lập tác động thuận chiều lên biến phụ thuộc. Khi xem xét mức độ tác động giữa các biến độc lập lên biến phụ thuộc, chúng ta sẽ dựa vào trị tuyệt đối hệ số Beta, trị tuyệt đối Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc. Xem chi tiết hơn tại bài viết Hệ số hồi quy B, Beta âm trong phân tích SPSS.

Trong SPSS, các số liệu của kiểm định t được lấy từ bảng hệ số hồi quy Coefficients. Cũng lưu ý rằng, nếu một biến độc lập không có ý nghĩa thống kê trong kết quả hồi quy, chúng ta sẽ kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc mà không cần thực hiện loại biến và phân tích lại hồi quy.

Trong ví dụ ở trên, bảng Coefficients cho chúng ta kết quả kiểm định t để đánh giá giả thuyết ý nghĩa hệ số hồi quy, chỉ số VIF đánh giá đa cộng tuyến và các hệ số hồi quy. 

Biến F_DN có giá trị sig kiểm định t bằng 0.777 > 0.05 , do đó biến này không có ý nghĩa trong mô hình hồi quy, hay nói cách khác, biến này không có sự tác động lên biến phụ thuộc F_HL. Các biến còn lại gồm F_LD, F_CV, F_TL, F_DT, F_DK đều có sig kiểm định t nhỏ hơn 0.05, do đó các biến này đều có ý nghĩa thống kê, đều tác động lên biến phụ thuộc F_HL. Hệ số hồi quy các biến độc lập này đều mang dấu dương, như vậy các biến độc lập có tác động thuận chiều lên biến phụ thuộc.

Lưu ý rằng, biến không có ý nghĩa trong hồi quy thì không loại biến đó và chạy lại phân tích, lý do vì sao bạn xem chi tiết tại bài viết Biến không có ý nghĩa ở hồi quy, SEM có cần loại chạy lại không?.

Kết luận giả thuyết:

H1: Tiền lương (F_TN)tác động đến sự hài lòng của nhân viên trong công việc  (Chấp nhận)

H2: Đào tạo và thăng tiến (F_DT) tác động đến sự hài lòng của nhân viên trong công việc (Chấp nhận)

H3: Lãnh đạo (F_LD) tác động đến sự hài lòng của nhân viên trong công việc (Chấp nhận)

H4: Đồng nghiệp (F_DN) tác động đến sự hài lòng của nhân viên trong công việc (Bác bỏ)

H5: Bản chất công việc (F_DN) đến sự hài lòng của nhân viên trong công việc (Chấp nhận)

H6: Điều kiện làm việc (F_DK) tác động đến sự hài lòng của nhân viên trong công việc (Chấp nhận)

Hệ số phóng đại phương sai (VIF) là một chỉ số đánh giá hiện tượng cộng tuyến trong mô hình hồi quy. VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến. Hair và cộng sự (2009) cho rằng, ngưỡng VIF từ 10 trở lên sẽ xảy ra đa cộng tuyến mạnh. Nhà nghiên cứu nên cố gắng để VIF ở mức thấp nhất có thể, bởi thậm chí ở mức VIF bằng 5, bằng 3 đã có thể xảy ra đa cộng tuyến nghiêm trọng. Theo Nguyễn Đình Thọ (2010) , trên thực tế, nếu VIF > 2, chúng ta cần cẩn thận bởi vì đã có thể xảy ra sự đa cộng tuyến gây sai lệch các ước lượng hồi quy. Xem thêm bài viết Đa cộng tuyến: Nguyên nhân, dấu hiệu nhận biết và cách khắc phục.

Cụ thể trong ví dụ ở bảng trên, Hệ số VIF của các biến độc lập đều nhỏ hơn 10, trong trường hợp này thậm chí nhỏ hơn 2, do vậy dữ liệu không vi phạm giả định đa cộng tuyến.

Từ các hệ số hồi quy, chúng ta xây dựng được hai phương trình hồi quy chuẩn hóa và chưa chuẩn hóa theo thứ tự như sau:

Y = 0.322*F_LD + 0.288*F_CV + 0.096*F_TL + 0.076*F_DT + 0.421*F_DK + ε

Y= -0.475 + 0.267*F_LD + 0.259*F_CV + 0.084*F_TL + 0.066*F_DT + 0.393*F_DK + ε

Khi viết phương trình hồi quy, lưu ý rằng: 

  • Không đưa biến độc lập không có ý nghĩa thống kê vào phương trình.
  • Nếu biến độc lập có hệ số hồi quy âm, chúng ta sẽ viết dấu trừ trước hệ số hồi quy trong phương trình. 
  • Nhìn vào phương trình chúng ta sẽ có thể xác định ngay được biến độc lập nào tác động mạnh nhất, mạnh thứ hai,…, yếu nhất lên biến phụ thuộc.
  • Luôn có phần dư ε cuối phương trình hồi quy dù là phương trình chuẩn hóa hay chưa chuẩn hóa.

4. Đánh giá giả định hồi quy qua 3 biểu đồ

4.1 Biểu đồ tần số phần dư chuẩn hóa Histogram

Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích... Vì vậy, chúng ta cần thực hiện nhiều cách khảo sát khác nhau. Một cách khảo sát đơn giản nhất là xây dựng biểu đồ tần số của các phần dư Histogram ngay dưới đây. Một cách khác nữa là căn cứ vào biểu đồ P-P Plot ở mục sau.

Đối với biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn Std. Dev gần bằng 1, các cột giá trị phần dư phân bố theo dạng hình chuông, ta có thể khẳng định phân phối là xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm. Cụ thể trong ảnh trên, Mean = 5.74E-15 = 5.74 * 10-15 = 0.00000... gần bằng 0, độ lệch chuẩn là 0.991 gần bằng 1. Như vậy có thể nói, phân phối phần dư xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.

4.2 Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Ngoài cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ biến giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa.

Đối với biểu đồ Normal P-P Plot, nếu các điểm dữ liệu trong phân phối của phần dư bám sát vào đường chéo, phần dư càng có phân phối chuẩn. Nếu các điểm dữ liệu phân bố xa đường chéo, phân phối càng “ít chuẩn”.

Cụ thể với vị dụ trên, các điểm dữ liệu phần dư tập trung khá sát với đường chéo, như vậy, phần dư có phân phối xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.

4.3 Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Một giả định trong hồi quy là phải có mối liên hệ tuyến tính giữa biến phụ thuộc với các biến độc lập. Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. 


Nếu các điểm dữ liệu phân bố tập trung xung quanh đường tung độ 0 và có xu hướng tạo thành một đường thẳng, giả định liên hệ tuyến tính không bị vi phạm. Cách bố trí của điểm dữ liệu trên đồ thị scatter sẽ tùy thuộc vào bản chất biến phụ thuộc, khi đánh giá, chúng ta cần nhìn tổng quát xu hướng của đám mây điểm dữ liệu.

Cụ thể với tập dữ liệu mẫu, phần dư chuẩn hóa phân bổ tập trung xunh quanh đường tung độ 0, do vậy giả định quan hệ tuyến tính không bị vi phạm.
PHƯƠNG PHÁP ĐỊNH LƯỢNG'S BLOG GỬI LỜI CẢM ƠN CHÂN THÀNH TỚI CÁC BẠN HỌC VIÊN, BẠN BÈ, ĐỒNG NGHIỆP, KHÁCH HÀNG ĐÃ ỦNG HỘ CHÚNG TÔI!