เมื่อใดที่จำเป็นต้องรวมความล่าช้าของตัวแปรตามในแบบจำลองการถดถอยและความล่าช้าใด


14

ข้อมูลที่เราต้องการใช้เป็นตัวแปรตามจะมีลักษณะเช่นนี้ (นับเป็นข้อมูล) เรากลัวว่าเนื่องจากมันมีองค์ประกอบวงจรและโครงสร้างแนวโน้มการถดถอยจึงกลายเป็นลำเอียงอย่างใด

ป้อนคำอธิบายรูปภาพที่นี่

เราจะใช้การถดถอยแบบทวินามเชิงลบในกรณีที่มันช่วย ข้อมูลเป็นพาเนลที่สมดุลหนึ่งจำลองต่อบุคคล (รัฐ) ภาพที่แสดงแสดงผลรวมของตัวแปรตามสำหรับทุกรัฐ แต่รัฐส่วนใหญ่เพียงอย่างเดียวมีพฤติกรรมที่คล้ายกัน เรากำลังพิจารณาโมเดลเอฟเฟกต์คงที่ ตัวแปรตามไม่ได้มีความสัมพันธ์กันอย่างมากส่วนหนึ่งของการวิจัยคือการหาความสัมพันธ์ที่ไม่คาดคิดระหว่างตัวแปรนี้ดังนั้นความสัมพันธ์ที่อ่อนแอจึงเป็นสิ่งที่ดี

  1. อะไรคือภัยที่แน่นอนของการไม่รวมตัวแปรล่าช้าของตัวแปรตาม?
  2. หากมีความจำเป็นที่จะต้องรวมหนึ่งจะมีการทดสอบที่จะรู้ว่าหนึ่ง (s)?

มีการนำไปใช้งานใน R

หมายเหตุ : ฉันได้อ่านโพสต์นี้แต่ไม่ได้ช่วยแก้ไขปัญหาของเรา

คำตอบ:


14

โมเดลพาเนลแบบไดนามิกอาจสมเหตุสมผลถ้าคุณมีโมเดลการตอบโต้แบบตาต่อตาต่อตาสำหรับคดีฆาตกรรม ตัวอย่างเช่นหากอัตราการฆาตกรรมส่วนใหญ่ถูกผลักดันโดยความโกรธเคืองของแก๊งการฆาตกรรมในเวลาอาจเป็นหน้าที่ของการเสียชีวิตที่t - 1หรือล่าช้าอื่น ๆ tt1

ฉันจะตอบคำถามของคุณไม่เรียบร้อย สมมติว่า DGP คือ

yit=δyit1+xitβ+μi+vit,

โดยที่ข้อผิดพลาดและvเป็นอิสระจากกันและระหว่างกัน คุณสนใจที่จะทำการทดสอบว่าδ = 0 (คำถาม 2)μvδ=0

ถ้าคุณใช้ OLS มันเป็นเรื่องง่ายที่จะเห็นว่าและส่วนแรกของความผิดพลาดมีความสัมพันธ์ซึ่งทำให้ OLS ลำเอียงและไม่สอดคล้องกันแม้เมื่อไม่มีความสัมพันธ์ต่อเนื่องในโวลต์ เราต้องการสิ่งที่ซับซ้อนกว่าในการทำแบบทดสอบyit1v

สิ่งต่อไปที่คุณอาจลองคือตัวประมาณค่าเอฟเฟกต์ถาวรกับการแปลงภายในซึ่งคุณแปลงข้อมูลโดยการลบค่าเฉลี่ยของหน่วยแต่ละหน่วย, ˉ y iจากการสังเกตแต่ละครั้ง สิ่งนี้จะเช็ดออกμแต่ตัวประมาณนี้ทนทุกข์ทรมานจากอคติของ Nickellซึ่งความลำเอียงไม่หายไปเมื่อจำนวนการสังเกตที่Nเพิ่มขึ้นดังนั้นจึงไม่สอดคล้องกับแผงNขนาดใหญ่และขนาดเล็กT แต่เป็นTเติบโตขึ้นคุณจะได้รับความสอดคล้องของδและβ จั๊ดสันและโอเว่น (1999)ดำเนินการจำลองบางคนที่มีN = 20 ,yy¯iμNNTTδβและ T = 5 , 10 , 20 , 30และพบว่ามีอคติที่จะเพิ่มขึ้นใน δและลดลงในT อย่างไรก็ตามแม้สำหรับ T = 30อคติอาจมีค่ามากถึง 20 %ของค่าสัมประสิทธิ์ที่แท้จริง นั่นคือข่าวร้ายหมี! ดังนั้นขึ้นอยู่กับขนาดของพาเนลของคุณคุณอาจต้องการหลีกเลี่ยงตัวประมาณ FE ถ้า δ > 0อคตินั้นเป็นลบดังนั้นความคงอยู่ของ yจึงต่ำไป ถ้า regressors มีความสัมพันธ์กับความล่าช้า βก็จะมีอคติเช่นกันN=20,100T=5,10,20,30δTT=3020%δ>0yβ

วิธีง่ายๆ FE ก็คือการเป็นครั้งแรกที่ความแตกต่างของข้อมูลที่จะเอาผลคงที่และการใช้เพื่อใช้ในการΔ Y ฉันที- 1 = Y ฉันที- 1 - Y ฉันที- 2 คุณยังใช้x i t - x i t - 1เป็นเครื่องมือสำหรับตัวเอง Anderson and Hsiao (1981)เป็นข้อมูลอ้างอิงที่เป็นที่ยอมรับ ตัวประมาณนี้สอดคล้องกัน (ตราบใดที่Xอธิบายนั้นถูกกำหนดล่วงหน้าและyit2Δyit1=yit1yit2xitxit1Xข้อผิดพลาดเดิมไม่ได้มีความสัมพันธ์กันแบบอนุกรม) แต่ไม่มีประสิทธิภาพอย่างเต็มที่เนื่องจากไม่ได้ใช้ช่วงเวลาที่มีอยู่ทั้งหมดและไม่ได้ใช้ความจริงที่ว่าข้อผิดพลาดตอนนี้แตกต่างกัน นี่อาจเป็นตัวเลือกแรกของฉัน หากคุณคิดว่าทำตามกระบวนการ AR (1) คุณสามารถใช้ความล่าช้าที่สามและสี่ของyแทนได้vy

Arellano and Bond (1991) ได้รับวิธีการประมาณค่าแบบช่วงเวลาทั่วไป (GMM) ที่มีประสิทธิภาพมากขึ้นซึ่งได้ขยายออกไปนับตั้งแต่ผ่อนคลายสมมติฐานบางข้อ บทที่ 8 ของหนังสือเล่มนี้ของ Baltagi เป็นการสำรวจวรรณกรรมที่ดีแม้ว่ามันจะไม่เกี่ยวข้องกับการเลือกล่าช้าเท่าที่ฉันสามารถบอกได้ นี่คือตัวชี้วัดที่ทันสมัย ​​แต่มีความต้องการทางเทคนิคมากกว่า

ฉันคิดว่าplmแพ็กเกจใน R มีบางตัวในตัวโมเดลแผงควบคุมแบบไดนามิกอยู่ใน Stata มาตั้งแต่รุ่น 10และ SAS มีรุ่น GMMอย่างน้อย สิ่งเหล่านี้ไม่ใช่ตัวนับข้อมูลโมเดล แต่นั่นอาจไม่ใช่เรื่องใหญ่อะไรขึ้นอยู่กับข้อมูลของคุณ อย่างไรก็ตามนี่คือตัวอย่างหนึ่งของโมเดลพาเนล Poisson แบบไดนามิก GMM ใน Stata

yβ


ดังนั้นคุณใช้ระดับเป็นเครื่องมือเมื่อคุณมีซีรีส์ที่แตกต่างและความแตกต่างเมื่อคุณมีซีรีส์ในระดับ ?
Andy W

iΔyt2=yt2yt3yt2Δyt1=yt1yt2
Dimitriy V. Masterov
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.