ถ้าฉันทำซ้ำการสังเกตทุกตัวอย่างในแบบจำลองการถดถอยเชิงเส้นและทำการถดถอยอีกครั้งผลลัพธ์จะได้รับผลกระทบอย่างไร

15

บอกว่าฉันมีการสังเกต N อาจเป็นหลายปัจจัยและฉันทำซ้ำการสังเกตแต่ละครั้งสองครั้ง (หรือ M ครั้ง) การถดถอยของขนาด NM ใหม่นี้จะเปรียบเทียบกับการถดถอยเพียงแค่การสังเกตการณ์ดั้งเดิมได้อย่างไร

regression linear-model multiple-regression

— วังจัน
แหล่งที่มา

13

ตามแนวคิดคุณกำลังเพิ่มไม่มีข้อมูล "ใหม่" แต่คุณ "รู้" ว่าข้อมูลนั้นแม่นยำยิ่งขึ้น

สิ่งนี้จะส่งผลให้สัมประสิทธิ์การถดถอยเดียวกันมีข้อผิดพลาดมาตรฐานที่น้อยกว่า

ตัวอย่างเช่นใน Stata ฟังก์ชันexpand xจะทำซ้ำการสังเกตแต่ละครั้งx

sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515    .001586    -2.43   0.018    -.0070138   -.0006891
      length |  -.0795935   .0553577    -1.44   0.155    -.1899736    .0307867
       _cons |   47.88487    6.08787     7.87   0.000       35.746    60.02374
------------------------------------------------------------------------------

expand 5

regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515   .0006976    -5.52   0.000    -.0052232   -.0024797
      length |  -.0795935   .0243486    -3.27   0.001    -.1274738   -.0317131
       _cons |   47.88487   2.677698    17.88   0.000     42.61932    53.15043
------------------------------------------------------------------------------

อย่างที่คุณเห็นก่อนหน้านี้ค่าสัมประสิทธิ์ไม่ลงรอยกัน (ความยาว) มีความสำคัญทางสถิติในโมเดลที่ขยายเพิ่มขึ้นซึ่งแสดงถึงความแม่นยำที่คุณ "รู้" สิ่งที่คุณรู้

— pmgjones
แหล่งที่มา

ใช่ข้อผิดพลาดมาตรฐานจะลงไปแน่นอน บางคนแนะนำการถดถอยเชิงเส้นแบบถ่วงน้ำหนักสำหรับเรื่องนี้ .. มีวิธีที่คุณใช้ในการแก้ไขปัญหานี้หรือไม่?

— BBDynSys

3

w^{*} = {argmin}_{w} | | X w - y | |^{2}

$w^* = \mbox{argmin}_w ||Xw - y||^2$

X

$X$

y

$y$

M

$M$

M

$M$

— Innuo
แหล่งที่มา

ตกลง แต่ฉันคิดว่าสถิติ t และข้อผิดพลาดมาตรฐานควรเปลี่ยนให้เปลี่ยนจาก N เป็น NM หรือไม่

— วังจันทร์

เนื่องจาก OLS ถือว่าเสียงเป็นอิสระข้อผิดพลาดมาตรฐานจะแตกต่างกันเนื่องจากจำนวนองศาอิสระจะเป็น

M * N - P

$M*N - P$ (

N

$N$ คือขนาดตัวอย่างดั้งเดิมและ

P

$P$ คือจำนวนของตัวทำนาย) และความยาวของเวกเตอร์ที่เหลือเพิ่มขึ้นตามปัจจัย

M

$M$ .

— Innuo