PDA

View Full Version : mô hình hồi quy bảng



ksnguyenvanthe
26-03-13, 01:48 AM
nhà mình ơi. tình hình là....rất tình hình. mình đang chạy mô hình hồi quy dang panel data. mà chưa bjk sd biến dummy ntn hixx.
mình có 3 nhóm:
nhóm 1, nhóm 2, nhóm 3 tương đương với 3 biến giả Ebank1. Ebank2, Ebank3.
nhưng ko bjk đưa vào mô hình ntn. bồ nào rành mí cái dzụ này, xin chỉ giáo nhé. tks nhìu
The Nguyen

phamthuytrangpt
29-03-13, 12:45 PM
Hic. Em cũng bị vướng vu Panel Data. Mỗi việc viết miêu tả dữ liệu thôi cũng bị sửa te tua.

duynguyen88vn
29-03-13, 01:29 PM
theo mình thì sẽ như thế này
series D1 =@recode(@Ebank1 , 1, 0)
series D2 = @recode(@Ebank2 , 1, 0)
series D3 = @recode(@Ebank3 , 1, 0)

bạn phải gửi ảnh bảng số liệu là ntn để có thể chính xác lại mã hóa biến Dummy

ho_vinh1412
07-04-13, 01:19 PM
nhà mình ơi. tình hình là....rất tình hình. mình đang chạy mô hình hồi quy dang panel data. mà chưa bjk sd biến dummy ntn hixx.
mình có 3 nhóm:
nhóm 1, nhóm 2, nhóm 3 tương đương với 3 biến giả Ebank1. Ebank2, Ebank3.
nhưng ko bjk đưa vào mô hình ntn. bồ nào rành mí cái dzụ này, xin chỉ giáo nhé. tks nhìu
The Nguyen

Hi anh,

Thật sự cũng chưa hiểu rõ câu hỏi của anh. Nhưng qua miêu tả thì thấy anh đang rối ở biến giả. Vậy cứ theo như giả định của mình thì câu trả lời sẽ như sau:

Một trong những mục đích của việc sử dụng biến giả là để so sánh một thuộc tính A với một thuộc tính B. Biến giả quy cho thuộc tính B sẽ là biến tham chiếu (biến được so sánh) và sẽ không được đưa vào mô hình hồi quy.

Ví dụ: Phương trình Mincer đo lường mức lương (thu nhập) của người lao động như sau:

Wage = b0 + b1 Exp + b2 School + ui (1)

Trong đó:
Wage: mức lương trung bình;
Exp: kinh nghiệm làm việc (số năm đi làm);
School: trình độ học vấn (số năm đi học)

Câu hỏi đặt ra: Nếu trong mẫu nghiên cứu có 2 thuộc tính A (nam) và B (nữ) thì mức lương của hai thuộc tính này có gì khác nhau? Lúc này kỹ thuật sẽ như sau: Trong file excel (hoặc eview, spss,...) anh sẽ tạo ra hai cột biến giả. VD: có thể là Male (có giá trị là 1 nếu là nam và ngược lại là 0) và Female (có giá trị là 1 nếu là nữ và ngược lại là 0). Giả sử đặt biến Female là biến tham chiếu (biến được dùng để so sánh) thì biến Female sẽ ko được đưa vào mô hình hồi quy. Mô hình mới khi có so sánh thu nhập trung bình giữa nam so với nữ sẽ như sau:

Wage = b0 + b1 Exp + b2 School + b3 Male + ui (2)

Ở đây anh sẽ quan tâm đến hệ số hồi quy b3 (xin nhắc lại là anh đang so sánh thu nhập trung bình của nam so với nữ).

- Nếu b3 mang dấu (+) và có mức ý nghĩa thống kế (1%, 5%, hay 10%) thì kết luận rằng: có sự khác biệt giữa mức lương trung bình của nam so với nữ và cụ thể là thu nhập của nam cao hơn so với nữ.
- Ngược lại áp dụng giải thích cho b3 mang dấu (-) và có ý nghĩa thống kê.
- Nếu b3 không có ý nghĩa thống kê ở mức ý nghĩa (1%, 5%, hay 10%) thì có thể kết luận rằng không có sự khác biệt về mức lương trung bình của nam so với nữ.

Mở rộng thêm, nếu một quốc gia nào đó (ví dụ thôi hen) có công nhận có thêm giới tính khác (Nam, Nữ, Khác). Tương tự, lúc đó trong file excel (eview,...), ngoài hai cột biến giả nam, nữ anh tạo thêm một cột biến: Other (có giá trị là 1 nếu là khác ngược lại có giá trị là 0). Giả sử xem biến Other là biến tham chiếu thì biến Other sẽ ko được đưa vào mô hình. Và mô hình mới có dạng như sau:

Wage = b0 + b1 Exp + b2 School + b3 Male + b4 Female + ui (3)

Ở đây anh sẽ quan tâm đến hai hệ số hồi quy b3 và b4 (vẫn nhắc thêm là anh có tất cả 3 biến giả: Male, Female và Other nhưng do biến Other là biến tham chiếu, nên sẽ ko đưa vào mô hình). Anh có hai việc cần giải thích:

Thứ nhất:
- Nếu b3 mang dấu (+) và có mức ý nghĩa thống kế (1%, 5%, hay 10%) thì kết luận rằng: có sự khác biệt giữa mức lương trung bình của nam so với "KHÁC" (do biến Other (khác) là biến tham chiếu, khác với trường hợp trên ko còn là nữ nữa) và cụ thể là thu nhập của nam cao hơn so với "KHÁC".
- Ngược lại áp dụng giải thích cho b3 mang dấu (-) và có ý nghĩa thống kê.
- Nếu b3 không có ý nghĩa thống kê ở mức ý nghĩa (1%, 5%, hay 10%) thì có thể kết luận rằng không có sự khác biệt về mức lương trung bình của nam so với "KHÁC".

Thứ hai:
- Nếu b4 mang dấu (+) và có mức ý nghĩa thống kế (1%, 5%, hay 10%) thì kết luận rằng: có sự khác biệt giữa mức lương trung bình của nữ so với "KHÁC" và cụ thể là thu nhập của nữ cao hơn so với "KHÁC".
- Ngược lại áp dụng giải thích cho b4 mang dấu (-) và có ý nghĩa thống kê.
- Nếu b4 không có ý nghĩa thống kê ở mức ý nghĩa (1%, 5%, hay 10%) thì có thể kết luận rằng không có sự khác biệt về mức lương trung bình của nữ so với "KHÁC".

Xa hơn, ứng dụng biến giả có thể được sử dụng cho các quốc gia (Việt Nam, Thái Lan, Singapore...), nhóm ngành nghiên cứu (sản xuất, thương mại, dịch vụ...), hình thức sở hữu công ty (quốc doanh, tư nhân, nước ngoài...).

Tổng quát, nếu mẫu nghiên cứu có "n" biến giả thì trong mô hình hồi quy sẽ có "n - 1" biến giả và một biến giả làm tham chiếu sẽ không được đưa vào mô hình.

Mặc dù biến giả có những lợi điểm riêng như: sử dụng để so sánh, vai trò làm biến kiểm soát, vai trò làm biến điều tiết, vai trò làm biến phụ thuộc để chạy mô hình hồi quy xác suất... nhưng vẫn tồn tại các mặt hạn chế cố hữu của biến giả. Ví dụ:
- Sử dụng biến giả nhiều trong mô hình có thể dẫn đến hiện tượng đa cộng tuyến.
- Sử dụng biến giả không thay đổi qua các năm (vd: ngành, quốc gia,...) cho mô hình Fixed Effect trong dữ liệu bảng sẽ ko thực hiện được.
- v.v....

Đến đây, về cơ bản có thể kết thúc kỹ thuật sử dụng biến giả như kỳ vọng của anh (mình giả định và hy vọng là như vậy). Anh có thể áp dụng cho 3 biến giả Ebank1, Ebank2, và Ebank3 trong nghiên cứu của anh. Để ý là nếu anh chọn biến giả nào là biến tham chiếu thì biến đó sẽ không được đưa vào mô hình hồi quy.

Have fun!

ksnguyenvanthe
27-05-13, 12:12 AM
oh, cám ơn duynguyen88, cám ơn Ho_vinh1412
Ho_vinh hướng dẫn rất chi tiết. mình coi bài tập tổng kết môn học SPSS của bạn và hướng dẫn này thấy bạn am hiểu rất tốt về KTL. giúp ích cho bài của mình rất nhiều. theo gợi ý của thầy thuận mình bỏ bớt đi 1 nhóm nên mô hình còn lại 2 biến dummy, theo hd của bạn mình chạy đc mô hình với biến giả rồi.tks bạn nhìu
Mô hình chạy ra kq cũng khá tốt: các biến độc lập và dummy có ý nghĩa TK ở mức @1%. R2và R2 hiệu chỉnh khá cao 0.62, các kiểm định t, wall, F đều tốt, AIC, SchwarzSchwarz khá nhỏ, kđịnh White, Serial corelation LM tốt. TUy nhiên nó ko vượt qua đc kđ Ramsay và historam nomal.... tức là mô hình đang bị bỏ sót biến và không có phân phối chuẩn. có cách nào khắc phục đc vấn đề này không ho_vinh? mình đọc bài làm SPSS của bạn có nói đến dạng mmo hình log line gì đó, nhưng không nói kỹ nên cũng chưa bjk khắc phục vấn đề này ntn. nếu không khác phục đc mà chấp nhận mô hình này có vấn đề gì ko bạn?
à để mình gửi file ban coi giùm mình thé> tks nhìu nhìu. :D
The Nguyen MFB3

ksnguyenvanthe
31-05-13, 02:12 AM
..

ho_vinh1412
02-06-13, 02:26 AM
oh, cám ơn duynguyen88, cám ơn Ho_vinh1412
[...] à để mình gửi file ban coi giùm mình thé> tks nhìu nhìu. :D
The Nguyen MFB3

Hi anh,

Trước tiên, mô hình cuối cùng anh sử dụng để giải thích các kết quả nghiên cứu là mô hình gì (dữ liệu bảng có thể sử dụng các mô hình Pool, FE, RE...). Biết được mô hình nào sử dụng để phân tích thì anh sẽ trả lời được mô hình có bị ảnh hưởng từ vấn đề thiếu biến hay không? Nhắc lại, vấn đề không phải là mô hình bị thiếu biến, mà quan trọng là mức độ nghiêm trọng gây ra từ việc thiếu biến này như thế nào? Để hình dung rõ hơn, ho_vinh minh họa hiện tượng đa cộng tuyến trong mô hình hồi quy (luôn tồn tại trong thực tế). Rõ ràng, điều mình quan tâm ở đây là mức độ nghiêm trọng từ đa cộng tuyến là như thế nào chứ không phải là mô hình có bị đa cộng tuyến hay không?

Thứ hai, nếu giá trị phần dư không có phân phối chuẩn, thì mô hình OLS vẫn thỏa các giả thiết thống kê từ 1-4 (dĩ nhiên là các giả thiết này anh đã kiểm soát). Hay nói cách khác mô hình hồi quy vẫn thỏa tính chất BLUE. Điều này có nghĩa là các kết quả ước lượng tham số là vững và không chệch (xin nhắc lại, với điều kiện là anh đã kiểm soát hết các giả thiết thống kê từ 1-4 trong mô hình). Do đó, nếu phần dư là chuẩn thì càng tốt, anh có thể ghi vào kết quả kiểm định JB để tăng tính thuyết phục cho nghiên cứu. Nhưng nếu phần dư không có phân phối chuẩn, theo như những gì mình đề cập trên thì cũng chẳng sao. Hoặc nếu sành điệu và bản lĩnh hơn, anh có thể xử lý cho phần dư có phân phối chuẩn ở mức tương đối. Đó là định nghĩa lại cách đo lường các biến nghiên cứu để giảm bớt độ nhọn và mức độ lệch trái hay lệch phải của phân phối. Ok, nôm na là vậy. Chúc anh làm hoàn chỉnh luận văn nhanh chóng để cùng bảo vệ chung với hội đồng sắp tới.

Have fun!