Biến phụ thuộc trong hầu hết các mô hình hồi quy đều bằng số, thường được đo theo một thang đo tỷ lệ (ratio scale). Nhưng trong nhiều ứng dụng thì các biến phụ thuộc là định danh (nominal) theo nghĩa rằng chúng biểu hiện các phân loại (categories), như nam hoặc nữ, có gia đình hoặc chưa có gia đình, có việc làm hoặc thất nghiệp, trong lực lượng lao động hoặc không thuộc lực lượng lao động. Giả sử chúng ta có dữ liệu về những người trưởng thành, một số trong họ hút thuốc và một số khác thì không. Hơn nữa, giả sử rằng chúng ta muốn biết các nhân tố nào quyết định việc một người hút thuốc hay không. Vì thế biến tình trạng hút thuốc là một biến định danh; hoặc là bạn hút thuốc hoặc là bạn không hút thuốc. Chúng ta mô hình hóa các biến định danh như thế như thế nào?
Chúng ta có thể sử dụng các kỹ thuật hồi quy cổ điển hay chúng ta cần các kỹ thuật chuyên biệt? Các mô hình hồi quy liên quan đến các biến có thang đo định danh là một ví dụ của một lớp các mô hình được gọi chung là các mô hình hồi quy phản ứng định tính (qualitative response regression models). Có rất nhiều loại mô hình như thế, nhưng trong chương này chúng ta sẽ xem xét một loại đơn giản nhất trong các mô hình đó, có tên gọi là các mô hình hồi quy có biến phụ thuộc là biến giả hoặc biến nhị phân (binary or dichotomous). Trong các chương tiếp theo, chúng ta sẽ xem xét các loại khác trong các mô hình hồi quy phản ứng định tính. Mục tiêu của chương này là nhằm cho thấy rằng mặc dù các mô hình hồi quy biến nhị phân có thể được ước lượng theo phương pháp bình phương bé nhất, nhưng các mô hình như thế thường được ước lượng theo các phương pháp đặc biệt, chẳng hạn như logit và probit. Trước hết chúng ta sẽ cho thấy tại sao phương pháp bình phương bé nhất không thích hợp và sau đó xem xét các mô hình logit và probit. Chúng ta bắt đầu bằng một ví dụ.
0 nhận xét:
Đăng nhận xét