บอกว่าฉันมีการสังเกต N อาจเป็นหลายปัจจัยและฉันทำซ้ำการสังเกตแต่ละครั้งสองครั้ง (หรือ M ครั้ง) การถดถอยของขนาด NM ใหม่นี้จะเปรียบเทียบกับการถดถอยเพียงแค่การสังเกตการณ์ดั้งเดิมได้อย่างไร
บอกว่าฉันมีการสังเกต N อาจเป็นหลายปัจจัยและฉันทำซ้ำการสังเกตแต่ละครั้งสองครั้ง (หรือ M ครั้ง) การถดถอยของขนาด NM ใหม่นี้จะเปรียบเทียบกับการถดถอยเพียงแค่การสังเกตการณ์ดั้งเดิมได้อย่างไร
คำตอบ:
ตามแนวคิดคุณกำลังเพิ่มไม่มีข้อมูล "ใหม่" แต่คุณ "รู้" ว่าข้อมูลนั้นแม่นยำยิ่งขึ้น
สิ่งนี้จะส่งผลให้สัมประสิทธิ์การถดถอยเดียวกันมีข้อผิดพลาดมาตรฐานที่น้อยกว่า
ตัวอย่างเช่นใน Stata ฟังก์ชันexpand xจะทำซ้ำการสังเกตแต่ละครั้งx
sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .001586 -2.43 0.018 -.0070138 -.0006891
length | -.0795935 .0553577 -1.44 0.155 -.1899736 .0307867
_cons | 47.88487 6.08787 7.87 0.000 35.746 60.02374
------------------------------------------------------------------------------
expand 5
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .0006976 -5.52 0.000 -.0052232 -.0024797
length | -.0795935 .0243486 -3.27 0.001 -.1274738 -.0317131
_cons | 47.88487 2.677698 17.88 0.000 42.61932 53.15043
------------------------------------------------------------------------------
อย่างที่คุณเห็นก่อนหน้านี้ค่าสัมประสิทธิ์ไม่ลงรอยกัน (ความยาว) มีความสำคัญทางสถิติในโมเดลที่ขยายเพิ่มขึ้นซึ่งแสดงถึงความแม่นยำที่คุณ "รู้" สิ่งที่คุณรู้