วิธีเก็บรักษาตัวแปรที่คงที่ของเวลาในรูปแบบเอฟเฟกต์คงที่


15

ฉันมีข้อมูลเกี่ยวกับพนักงานของ บริษัท ขนาดใหญ่ของอิตาลีในช่วงสิบปีที่ผ่านมาและฉันต้องการดูว่าช่องว่างทางเพศในรายได้ของเพศชายและเพศหญิงมีการเปลี่ยนแปลงตลอดเวลาอย่างไร เพื่อจุดประสงค์นี้ฉันใช้ pooled OLS: โดยที่คือรายได้จากการบันทึกต่อปีรวม covariates ที่แตกต่างกันไปตามแต่ละบุคคลและเวลาคือ dummies ปีและ{\ rm male} _iเท่ากับหนึ่งถ้าคนงานเป็นผู้ชายและไม่มีศูนย์

yit=Xitβ+δmalei+t=110γtdt+εit
yXitdtmalei

ตอนนี้ฉันมีความกังวลว่าเพื่อนร่วมพันธุ์บางคนอาจมีความสัมพันธ์กับเอฟเฟกต์คงที่ที่ไม่ได้สังเกต แต่เมื่อฉันใช้เอฟเฟ็กต์คงที่ (ภายใน) ตัวประมาณหรือความแตกต่างครั้งแรกฉันเสียโมเดลเพศเพราะตัวแปรนี้ไม่เปลี่ยนแปลงตลอดเวลา ฉันไม่ต้องการใช้ตัวประมาณเอฟเฟกต์แบบสุ่มเพราะฉันมักจะได้ยินคนพูดว่ามันทำให้สมมติฐานที่ไม่สมจริงมากและไม่น่าจะถือได้

มีวิธีใดบ้างที่จะรักษาความหลอกทางเพศและควบคุมเอฟเฟกต์คงที่ในเวลาเดียวกันได้หรือไม่? หากมีวิธีฉันต้องจัดกลุ่มหรือดูแลปัญหาอื่น ๆ ด้วยข้อผิดพลาดสำหรับการทดสอบสมมติฐานเกี่ยวกับตัวแปรเพศหรือไม่?

คำตอบ:


22

มีวิธีที่เป็นไปได้สองสามอย่างสำหรับคุณที่จะรักษาหุ่นจำลองทางเพศไว้ในการถดถอยเอฟเฟกต์

ภายในเครื่องมือประมาณการ
สมมติว่าคุณมีโมเดลที่คล้ายกันเมื่อเทียบกับโมเดล OLS ที่รวมกำไรของคุณซึ่งคือ โดยที่ตัวแปรนั้นเคยเป็นมาก่อน ตอนนี้ทราบว่าและไม่สามารถระบุได้เพราะภายในไม่สามารถประมาณการแตกต่างจากผลการแก้ไขC_iระบุว่าคือการสกัดกั้นสำหรับปีฐาน ,คือผลกระทบทางเพศต่อรายได้ในช่วงเวลานี้ สิ่งที่เราสามารถระบุได้ในกรณีนี้คือ β 1 β 1

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1ฉันβ 1ตัน= 1 γ 1 γ 2 , . . , γ 10 γ 2 , . . , γ 10β1+γ1(malei)ciβ1t=1γ1γ2,...,γ10เพราะพวกมันมีปฏิสัมพันธ์กับเวลาของคุณและพวกเขาวัดความแตกต่างในผลกระทบบางส่วนของตัวแปรเพศของคุณเมื่อเทียบกับช่วงเวลาแรก ซึ่งหมายความว่าหากคุณสังเกตเห็นการเพิ่มขึ้นของเมื่อเวลาผ่านไปนี่เป็นข้อบ่งชี้ถึงการเพิ่มช่องว่างรายได้ระหว่างชายและหญิงγ2,...,γ10

เครื่องมือประมาณการความแตกต่างแรก
หากคุณต้องการทราบผลโดยรวมของความแตกต่างระหว่างชายและหญิงเมื่อเวลาผ่านไปคุณสามารถลองใช้โมเดลต่อไปนี้: โดยที่ตัวแปรมีการโต้ตอบกับเพศที่ไม่แปรผันเวลา ตัวแทนเชิด ตอนนี้ถ้าคุณรับความแตกต่างแรกและเลื่อนออกและคุณได้รับ จากนั้น T = 1 , 2 , . . , 10 β 1 c ฉันy ฉันt - y ฉัน

Yผมเสื้อ=β1+Σเสื้อ=210βเสื้อdเสื้อ+γ(เสื้อม.aล.อีผม)+Xผมเสื้อ'θ+ผม+εผมเสื้อ
เสื้อ=1,2,...,10β1ผมγ(tmaleฉัน-[(t-1)malei])=γ[(t-(t-1))malei]=γ(
Yผมเสื้อ-Yผม(เสื้อ-1)=Σเสื้อ=310βเสื้อ(dเสื้อ-d(เสื้อ-1))+γ(เสื้อม.aล.อีผม-[(เสื้อ-1)ม.aล.อีผม])+(Xผมเสื้อ'-Xผม(เสื้อ-1)')θ+εผมเสื้อ-εผม(เสื้อ-1)
γ Δ Y ฉันT = 10 Σ T = 3 β เสื้อ Δ d T + γ ( ลิตรอีฉัน ) + Δ X ' ฉันที θ + Δ ε ฉันทีγ(เสื้อม.aล.อีผม-[(เสื้อ-1)ม.aล.อีผม])=γ[(เสื้อ-(เสื้อ-1))ม.aล.อีผม]=γ(ม.aล.อีผม)และคุณสามารถระบุความแตกต่างทางเพศในกำไร\ดังนั้นสมการการถดถอยครั้งสุดท้ายจะเป็น: และคุณได้รับผลกระทบที่น่าสนใจ สิ่งที่ดีคือมันสามารถนำไปใช้กับซอฟต์แวร์ทางสถิติได้อย่างง่ายดาย แต่คุณจะเสียเวลาไปγ
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit

Hausman-Taylor Estimator
ตัวประมาณค่านี้แยกความแตกต่างระหว่าง regressors ที่คุณสามารถสันนิษฐานได้ว่าไม่เกี่ยวข้องกับเอฟเฟกต์คงที่และค่าที่มีความสัมพันธ์กับมัน นอกจากนี้ยังแยกความแตกต่างระหว่างตัวแปรที่แปรผันตามเวลาและตัวแปรไม่แปรตามเวลา ให้แสดงถึงตัวแปรที่ไม่เกี่ยวข้องกับและคนที่เป็นและสมมุติว่าตัวแปรเพศของคุณเป็นตัวแปรแปรผันตามเวลาเท่านั้น ตัวประมาณ Hausman-Taylor ใช้การเปลี่ยนเอฟเฟกต์แบบสุ่ม: ที่เครื่องหมายตัวหนอนหมายถึงci1ci2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1ผมโดยที่ใช้สำหรับการเปลี่ยนเอฟเฟกต์แบบสุ่มและคือเวลาเฉลี่ยของแต่ละบุคคล นี้ไม่ได้เป็นเหมือนปกติผลกระทบสุ่มประมาณการว่าคุณต้องการที่จะหลีกเลี่ยงเนื่องจากกลุ่มตัวแปร instrumented สำหรับเพื่อที่จะเอาความสัมพันธ์กับC_iสำหรับเครื่องดนตรีเป็น{} เช่นเดียวกันกับตัวแปรเวลาที่ไม่แปรเปลี่ยนดังนั้นหากคุณระบุตัวแปรเพศที่อาจมีความสัมพันธ์กับเอฟเฟกต์คงที่มันจะได้รับการสร้างด้วยθ^iX¯1i2ciX~2itX2itX¯2iX¯1ผมดังนั้นคุณต้องมีการเปลี่ยนแปลงเวลามากกว่าตัวแปรที่ไม่แปรตามเวลา

ทั้งหมดนี้อาจฟังดูซับซ้อนเล็กน้อย แต่มีแพ็คเกจสำเร็จรูปสำหรับตัวประมาณนี้ ยกตัวอย่างเช่นใน Stata xthtaylorคำสั่งที่เกี่ยวข้องคือ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีนี้คุณสามารถอ่าน Cameron และ Trivedi (2009) "Microeconometrics Using Stata" มิฉะนั้นคุณสามารถใช้สองวิธีก่อนหน้าซึ่งง่ายกว่าเล็กน้อย

การอนุมาน
สำหรับการทดสอบสมมติฐานของคุณมีไม่มากที่ต้องพิจารณานอกเหนือจากสิ่งที่คุณจะต้องทำต่อไปในการถดถอยผลคงที่ คุณต้องดูแลความสัมพันธ์อัตโนมัติในข้อผิดพลาดตัวอย่างเช่นโดยการทำคลัสเตอร์ในตัวแปร ID แต่ละรายการ สิ่งนี้ช่วยให้โครงสร้างความสัมพันธ์โดยพลการในกลุ่ม (บุคคล) ซึ่งเกี่ยวข้องกับ autocorrelation สำหรับการอ้างอิงดูอีกครั้ง Cameron และ Trivedi (2009)


4

อีกวิธีที่เป็นไปได้สำหรับคุณที่จะรักษาหุ่นจำลองคือแนวทางของ Mundlak (1978)สำหรับโมเดลเอฟเฟกต์คงที่ที่มีตัวแปรไม่แปรผันตามกาลเวลา วิธีการของมันดัลก์จะแสดงให้เห็นว่าผลกระทบทางเพศสามารถถูกคาดการณ์ได้จากกลุ่มของตัวแปรที่แปรผันตามเวลา

Mundlak, Y. 1978: ในการรวมกลุ่มของอนุกรมเวลาและข้อมูลภาคตัดขวาง เศรษฐมิติ 46: 69-85


2

อีกวิธีหนึ่งคือการประมาณค่าสัมประสิทธิ์เวลาไม่แปรเปลี่ยนในสมการขั้นตอนที่สองโดยใช้ข้อผิดพลาดเฉลี่ยเป็นตัวแปรตาม

ขั้นแรกให้ประเมินโมเดลด้วย FE จากที่นี่คุณจะได้รับการประมาณค่าของและ{t} เพื่อความง่ายลองลืมเรื่องผลกระทบของปี กำหนดข้อผิดพลาดในการประมาณค่าเหมือนเมื่อก่อน:βγเสื้อยู^ผมเสื้อ

ยู^ผมเสื้อYผมเสื้อ-Xผมเสื้อβ^

ตัวทำนาย เชิงเส้นคือ:ยู¯ผม

ยู¯ผมΣเสื้อ=1Tยู^ผมT=Yผมเสื้อ¯-x¯ผมβ^

ทีนี้ลองพิจารณาสมการขั้นที่สองต่อไปนี้:

ยู¯ผม=δม.aล.อีผม+ผม

สมมติว่าเพศที่ uncorrelated กับปัจจัยสังเกต{i} จากนั้นตัวประมาณ OLS ของนั้นไม่เอนเอียงและสอดคล้องกับเวลา (นี่คือมันจะสอดคล้องกันเมื่อ )ผมδT


หากต้องการพิสูจน์ข้างต้นให้แทนที่โมเดลดั้งเดิมเป็นตัวประมาณ :ยู¯ผม

ยู¯ผม=x¯ผมβ-x¯ผมβ^+δม.aล.อีผม+ผม+Σเสื้อ=1Tεผมเสื้อT

ความคาดหวังของตัวประมาณนี้คือ:

E(ยู¯ผม)=x¯ผมβ-x¯ผมE(β^)+δม.aล.อีผม+E(ผม)+Σเสื้อ=1TE(εผมเสื้อ)T

หากสมมติฐาน FE ถือสอดคล้องเป็นประมาณการที่เป็นกลางจากและ0 ดังนั้น:β^βE(εผมเสื้อ)=0

E(ยู¯ผม)=δม.aล.อีผม+E(ผม)

นี่คือตัวทำนายของเราเป็นตัวประมาณค่าที่เป็นกลางของส่วนประกอบที่ไม่แปรเปลี่ยนเวลาของโมเดล

เกี่ยวกับความสอดคล้องขีด จำกัด ความน่าจะเป็นของตัวทำนายนี้คือ:

พีLimTยู¯ผม=พีLimT(x¯ผมβ)-พีLimT(x¯ผมβ^)+พีLimTδม.aล.อีผม+พีLimTผม+พีLimT(Σเสื้อ=1Tεผมเสื้อT)

อีกครั้งจากสมมติฐาน FE ที่ได้รับเป็นตัวประมาณที่สอดคล้องกันของและคำผิดพลาดมาบรรจบกับค่าเฉลี่ยซึ่งเป็นศูนย์ ดังนั้น:β^β

พีLimTยู¯ผม=δม.aล.อีผม+ผม

อีกครั้งตัวทำนายของเราเป็นตัวประมาณค่าที่สอดคล้องกันของส่วนประกอบที่ไม่แปรเปลี่ยนเวลาของโมเดล


1

อุปกรณ์แชนด์เลน Mundlak เป็นเครื่องมือที่สมบูรณ์แบบสำหรับสิ่งนี้ มันมักจะถูกเรียกว่าแบบจำลองผลกระทบแบบสุ่มที่มีความสัมพันธ์เพราะมันใช้แบบจำลองผลกระทบแบบสุ่มเพื่อประเมินผลกระทบคงที่สำหรับตัวแปรตัวแปรเวลาโดยปริยาย

อย่างไรก็ตามในซอฟท์แวร์ทางสถิติคุณใช้มันเป็นแบบจำลองเอฟเฟกต์แบบสุ่ม แต่คุณต้องเพิ่มวิธีการตัวแปรแปรปรวนตลอดเวลา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.