ปัญหาพารามิเตอร์เล็กน้อย


15

ฉันมักจะดิ้นรนเพื่อให้ได้แก่นแท้ที่แท้จริงของปัญหาพารามิเตอร์โดยบังเอิญ ฉันอ่านหลายครั้งว่าตัวประมาณค่าผลกระทบคงที่ของโมเดลข้อมูลแผงไม่เชิงเส้นสามารถลำเอียงอย่างรุนแรงเพราะปัญหาพารามิเตอร์ "ที่รู้จักกันดี"

เมื่อฉันขอคำอธิบายที่ชัดเจนของปัญหานี้คำตอบทั่วไปคือ: สมมติว่าข้อมูลพาเนลมีบุคคล N คนในช่วงเวลา T ถ้า T ได้รับการแก้ไขเนื่องจาก N ที่เพิ่มขึ้นการประมาณค่าโควาเรียตจะกลายเป็นอคติ สิ่งนี้เกิดขึ้นเนื่องจากจำนวนของพารามิเตอร์รบกวนเพิ่มขึ้นอย่างรวดเร็วเมื่อ N เพิ่มขึ้น

ฉันจะขอบคุณมาก

  • คำอธิบายที่แม่นยำยิ่งขึ้น แต่ก็ยังง่าย (ถ้าเป็นไปได้)
  • และ / หรือตัวอย่างที่เป็นรูปธรรมที่ฉันสามารถออกกำลังด้วย R หรือ Stata

3
สิ่งนี้ไม่เพียงพอสำหรับคำตอบ ปัญหาพารามิเตอร์ที่เกิดขึ้นสามารถเกิดขึ้นได้ในโมเดลที่ไม่ใช่เชิงเส้นซึ่งต่างจากการถดถอยเชิงเส้นซึ่งไม่มีคุณสมบัติของการเป็นตัวประมาณแบบเอนเอียง ตัวอย่างที่นิยมคือ probit / logit แบบจำลองเหล่านี้เป็นตัวประมาณที่สอดคล้องกันซึ่งหมายความว่าเมื่ออัตราส่วนของจำนวนการสังเกตต่อจำนวนพารามิเตอร์เพิ่มขึ้นการประมาณค่าพารามิเตอร์จะมาบรรจบกันในค่าที่แท้จริงของพวกเขาเนื่องจากข้อผิดพลาดมาตรฐานกลายเป็นขนาดเล็กโดยพลการ ปัญหาของเอฟเฟกต์คงที่คือจำนวนพารามิเตอร์เพิ่มขึ้นตามจำนวนการสังเกต
Zachary Blumenfeld

2
ดังนั้นการประมาณพารามิเตอร์ไม่สามารถรวมกันเป็นค่าจริงได้เมื่อขนาดตัวอย่างเพิ่มขึ้น ดังนั้นการประมาณค่าพารามิเตอร์จึงไม่น่าเชื่อถืออย่างรุนแรง
Zachary Blumenfeld

ขอบคุณสำหรับคำชี้แจงนี้ ฉันเดาว่าตอนนี้ฉันเข้าใจปัญหาได้ดีขึ้น ดังนั้นหากแผงควบคุมของฉันคือ T = 8 และ N = 2000 ฉันสามารถเพิ่มเอฟเฟกต์ T-fixed ในการประมาณ probit / logit และรับการประมาณการที่เชื่อถือได้ มิฉะนั้นด้วยเอฟเฟ็กต์ N-fixed ฉันจะได้รับผลที่ไม่น่าเชื่อถือ ถูกต้องหรือไม่
emeryville

2
นี่คือรายการบล็อกแสดงให้เห็นถึงปัญหาพารามิเตอร์ที่เกิดขึ้นสำหรับ logit และ probit พร้อมตัวอย่างใน R: econometricsbysimulation.com/2013/12/30
Arne Jonas Warnke

คำตอบ:


21

ในรูปแบบ FE ของประเภท αเป็นพารามิเตอร์ที่เกิดขึ้นเนื่องจากการพูดเชิงทฤษฎีมันมีความสำคัญรอง โดยปกติแล้วβเป็นพารามิเตอร์ที่สำคัญ แต่ในสาระสำคัญαมีความสำคัญเนื่องจากให้ข้อมูลที่เป็นประโยชน์เกี่ยวกับการสกัดกั้นแต่ละรายการ

yit=αi+βXit+uit
αβα

β

yit=αi+uituitiiN(0,σ2)
u^it=yity¯iασ2
σ^2=1NTit(yity¯i)2=σ2χN(T1)2NT=σ2N(T1)NT=σ2T1T

T1Tσ2

β

โปรดทราบว่าในแผงควบคุมอวกาศเช่นสถานการณ์ตรงข้าม - T มักจะถือว่ามีขนาดใหญ่พอ แต่ N จะได้รับการแก้ไข ดังนั้น asymptotics มาจาก T ดังนั้นในพาเนลอวกาศคุณต้องมี T ใหญ่ ๆ !

หวังว่ามันจะช่วยอย่างใด


1NTit(yity¯i)2σ2χN(T1)2NT

1
@Mario GS: ผลรวมของตัวแปรสุ่มปกติกำลังสองคือไคสแควร์กระจาย
Corel
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.