ผลกระทบปีไม่สอดคล้องกันระหว่างผลแบบสุ่มและผลคงที่


2

ผมใช้การประเมินข้อมูลแผงที่ฉันรวมทั้งผลกระทบปี เป้าหมายของฉันคือดูว่ามีแนวโน้มเวลาในข้อมูลหลังจากควบคุมปัจจัยอื่น ๆ หรือไม่

เมื่อใช้เอฟเฟกต์แบบสุ่มฉันพบว่าแนวโน้มมีแนวโน้มที่จะสูงขึ้น เมื่อใช้เอฟเฟกต์คงที่ฉันพบว่าแนวโน้มลดลง

นี่เป็นผลลัพธ์ที่ไม่ดีใช่ไหม การทดสอบ Hausman ปฏิเสธค่า RE ด้วยค่า p เป็น 0.000 หมายความว่าค่าแนวโน้มจาก RE สามารถไม่สอดคล้องกันได้หรือไม่ หรือ FE จับภาพสิ่งที่แตกต่างจากโมเดล RE หรือไม่ ความแตกต่างในความแตกต่างอาจจะ?

คำตอบ:


1

นี่คือผลลัพธ์ที่น่าสนใจไม่ใช่ผลลัพธ์ที่ไม่ดี หากไม่มีผู้ลงทะเบียนอื่นนอกเหนือจากเวลาหุ่นฉันคิดว่า OLS = RE = FE (ผมเคยทำการทดลองเพียงไม่กี่กับreg y i.year, xtreg y i.year, feและxtreg y i.year, reแต่ผมยังไม่ได้รับการพิสูจน์.)

Xit

set more off
clear all
local n 100
local T 5
set seed 1
set obs `=`n'*`T''
gen id = floor((_n-1)/`T')+1
by id, sort: gen year = _n
xtset id year
tempvar a0
gen `a0' = rnormal() if year==1
by id: egen a = mean(`a0')
gen x = a-year+rnormal()
gen y = a+x-0.2*year+rnormal()
drop a
* So far x and y have been generated.
xtreg y x year, fe
est store fe
xtreg y x year, re
hausman fe ., sigma
set more on

คุณจะเห็นว่า FE ให้แนวโน้มเชิงลบ RE ให้แนวโน้มเชิงบวกและการทดสอบ Hausman มีความสำคัญมาก (ด้านบนฉันรวมแนวโน้มเชิงเส้นเพื่อความเรียบง่ายผลลัพธ์จะคล้ายกันเมื่อi.yearใช้แทน) ฉันคิดว่ามันเป็นแนวโน้มใน X และการปรากฏตัวของเอฟเฟกต์คงที่

. set more off

. clear all

. local n 100

. local T 5

. set seed 1

. set obs `=`n'*`T''
number of observations (_N) was 0, now 500

. gen id = floor((_n-1)/`T')+1

. by id, sort: gen year = _n

. xtset id year
       panel variable:  id (strongly balanced)
        time variable:  year, 1 to 5
                delta:  1 unit

. tempvar a0

. gen `a0' = rnormal() if year==1
(400 missing values generated)

. by id: egen a = mean(`a0')

. gen x = a-year+rnormal()

. gen y = a+x-0.2*year+rnormal()

. drop a

. * So far x and y have been generated.

. xtreg y x year, fe

Fixed-effects (within) regression               Number of obs     =        500
Group variable: id                              Number of groups  =        100

R-sq:                                           Obs per group:
     within  = 0.8276                                         min =          5
     between = 0.9353                                         avg =        5.0
     overall = 0.8066                                         max =          5

                                                F(2,398)          =     955.57
corr(u_i, Xb)  = 0.4473                         Prob > F          =     0.0000

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
           x |   .9803594   .0483021    20.30   0.000     .8854004    1.075318
        year |  -.2207004   .0568937    -3.88   0.000    -.3325502   -.1088506
       _cons |   .1019471   .1021303     1.00   0.319    -.0988351    .3027294
-------------+----------------------------------------------------------------
     sigma_u |  1.1387103
     sigma_e |  .97339535
         rho |  .57779363   (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(99, 398) = 3.61                     Prob > F = 0.0000

. est store fe

. xtreg y x year, re

Random-effects GLS regression                   Number of obs     =        500
Group variable: id                              Number of groups  =        100

R-sq:                                           Obs per group:
     within  = 0.8066                                         min =          5
     between = 0.9353                                         avg =        5.0
     overall = 0.8436                                         max =          5

                                                Wald chi2(2)      =    2432.08
corr(u_i, X)   = 0 (assumed)                    Prob > chi2       =     0.0000

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
           x |    1.40149   .0391177    35.83   0.000      1.32482    1.478159
        year |    .196468   .0523296     3.75   0.000     .0939039     .299032
       _cons |   .1267828    .123712     1.02   0.305    -.1156882    .3692539
-------------+----------------------------------------------------------------
     sigma_u |   .3602397
     sigma_e |  .97339535
         rho |  .12046423   (fraction of variance due to u_i)
------------------------------------------------------------------------------

. hausman fe ., sigma

Note: the rank of the differenced variance matrix (1) does not equal the number
        of coefficients being tested (2); be sure this is what you expect, or
        there may be problems computing the test.  Examine the output of your
        estimators for anything unexpected and possibly consider scaling your
        variables so that the coefficients are on a similar scale.

                 ---- Coefficients ----
             |      (b)          (B)            (b-B)     sqrt(diag(V_b-V_B))
             |       fe           .          Difference          S.E.
-------------+----------------------------------------------------------------
           x |    .9803594      1.40149       -.4211302        .0389278
        year |   -.2207004      .196468       -.4171684        .0385616
------------------------------------------------------------------------------
                           b = consistent under Ho and Ha; obtained from xtreg
            B = inconsistent under Ha, efficient under Ho; obtained from xtreg

    Test:  Ho:  difference in coefficients not systematic

                  chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)
                          =      117.03
                Prob>chi2 =      0.0000

. set more on

0

ดังนั้นหากคุณเห็นความแตกต่างที่สำคัญระหว่างเอฟเฟกต์แบบสุ่มและเอฟเฟกต์คงที่สิ่งนั้นควรเป็นตัวบ่งชี้ว่ารูปแบบที่ไม่แปรเปลี่ยนเวลาซึ่ง FE ควบคุมสำหรับเรื่องต่างๆ Hausman ของคุณยืนยัน

FE จับภาพบางอย่างที่แตกต่างกันเนื่องจาก FE ลบรูปแบบที่ไม่แปรผันของเวลาทั้งหมดและใช้รูปแบบภายในเท่านั้นในขณะที่เอฟเฟกต์แบบสุ่มใช้ทั้งภายในและระหว่าง ตัวอย่างเช่นหากคุณพยายามประเมินผลกระทบของเพศต่อค่าจ้างเมื่อเวลาผ่านไปคุณไม่สามารถทำได้โดยใช้เอฟเฟกต์คงที่เนื่องจากเพศจะเลื่อนออก แต่คุณสามารถทำได้โดยใช้เอฟเฟกต์แบบสุ่ม


เร็ก จุดที่ 1 ฉันต้องการเห็นวิวัฒนาการอย่างชัดเจนตลอดเวลา และหลักฐานในทั้งสองกรณีคือปีที่ต่างกันดังนั้นการใช้ตัวแปร จำกัด จึงไม่ดี เร็ก จุดที่ 2 ฉันไม่เข้าใจประเด็นของคุณ เหตุใดระหว่างผลกระทบที่ไม่เกี่ยวข้องกับข้อผิดพลาดที่เป็นนิสัย? ฉันทดสอบและยืนยันว่าไม่มี endogeneity ที่ทำให้เกิด id ความผิดพลาด เพียงพอหรือไม่
luchonacho

ประเด็นของฉันที่มี 2 คือถ้าคุณเห็นความแตกต่างอย่างมากระหว่าง RE และ FE มันจะดีกว่าที่จะไว้วางใจ FE เพราะมันจะควบคุมอคติที่อาจเกิดขึ้นได้ในขณะที่ RE คิดว่ามันเป็น orthogonal การทดสอบ Hausman นั้นไม่ค่อยดีนักเนื่องจากเป็นเรื่องยากที่จะทดสอบหา endogeneity
VCG

ฉันไม่เห็นว่าทำไม RE ที่ไม่สอดคล้องกันทำให้ Hausman ไม่ถูกต้อง จุดทั้งหมดของ Hausman คือการทดสอบความสอดคล้องของ RE มันก็เหมือนกับการปฏิเสธโมฆะทำให้การทดสอบไม่ถูกต้อง ที่ไม่สมเหตุสมผลกับฉัน แต่ใช่ฉันเชื่อใน FE มากกว่านี้ ฉันแค่เดินไปทำไมความแตกต่างที่รุนแรงระหว่างแนวโน้มเวลา
luchonacho

ยาฉันลบสิ่งที่ฉันพูดว่าฉันสับสน ฉันใช้เวลาอ่านหนังสือเล็กน้อยและตอนนี้โพสต์ใหม่
VCG
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.