ข้อผิดพลาดมาตรฐานสำหรับสัมประสิทธิ์การถดถอยหลายค่า?


18

ฉันรู้ว่านี่เป็นคำถามพื้นฐาน แต่ฉันไม่สามารถหาคำตอบได้ทุกที่

ฉันคำนวณสัมประสิทธิ์การถดถอยโดยใช้สมการปกติหรือการสลายตัว QR ฉันจะคำนวณข้อผิดพลาดมาตรฐานสำหรับแต่ละสัมประสิทธิ์ได้อย่างไร ฉันมักจะคิดว่าข้อผิดพลาดมาตรฐานที่คำนวณเป็น:

SEx¯ =σx¯n

คืออะไรสำหรับแต่ละค่าสัมประสิทธิ์? วิธีที่มีประสิทธิภาพมากที่สุดในการคำนวณสิ่งนี้ในบริบทของ OLS คืออะไร?σx¯

คำตอบ:


19

เมื่อทำการประมาณกำลังสองน้อยที่สุด (สมมติว่าเป็นองค์ประกอบสุ่มปกติ) การประมาณค่าพารามิเตอร์การถดถอยจะถูกกระจายด้วยค่าเฉลี่ยเท่ากับพารามิเตอร์การถดถอยที่แท้จริงและเมทริกซ์ความแปรปรวนร่วมโดยที่s 2คือความแปรปรวนที่เหลือX T Xคือเมทริกซ์การออกแบบ X Tคือการย้ายที่ของXและXถูกกำหนดโดยสมการโมเดลY = X β + ϵกับβΣ=s2(XTX)1s2XTXXTXXY=Xβ+ϵβพารามิเตอร์การถดถอยและเป็นคำผิดพลาด ค่าเบี่ยงเบนมาตรฐานโดยประมาณของพารามิเตอร์เบต้าจะได้รับโดยใช้คำที่สอดคล้องกันใน ( X T X ) - 1คูณด้วยการประมาณตัวอย่างของความแปรปรวนที่เหลือและจากนั้นนำสแควร์รูท นี่ไม่ใช่การคำนวณที่ง่ายมาก แต่แพคเกจซอฟต์แวร์ใด ๆ ที่จะคำนวณให้คุณและให้มันในผลลัพธ์ϵ(XTX)1

ตัวอย่าง

ในหน้า 134 ของผักและสมิ ธ (อ้างอิงในความคิดเห็นของฉัน) พวกเขาให้ข้อมูลต่อไปนี้สำหรับกระชับโดยสองน้อยที่สุดแบบที่ε ~ N ( 0 , ฉันσ 2 )Y=β0+β1X+εεN(0,Iσ2)

                      X                      Y                    XY
                      0                     -2                     0
                      2                      0                     0
                      2                      2                     4
                      5                      1                     5
                      5                      3                    15
                      9                      1                     9
                      9                      0                     0
                      9                      0                     0
                      9                      1                     9
                     10                     -1                   -10
                    ---                     --                   ---
Sum                  60                      5                    32
Sum of  Squares     482                     21                   528

ดูเหมือนว่าตัวอย่างที่ความชันควรอยู่ใกล้กับ 0

Xt=(111111111102255999910).

So

XtX=(nXiXiXi2)=(106060482)

and

(XtX)1=(Xi2n(XiX¯)2X¯(XiX¯)2X¯(XiX¯)21(XiX¯)2)=(48210(122)612261221122)=(0.3950.0490.0490.008)

where X¯=Xi/n=60/10=6.

Estimate for β=(XTX)1XTY = ( b0 ) =(Yb-b1 Xb) b1 Sxy/Sxx

b1 = 1/61 = 0.0163 and b0 = 0.5- 0.0163(6) = 0.402

From (XTX)1 above Sb1 =Se (0.008) and Sb0=Se(0.395) where Se is the estimated standard deviation for the error term. Se =√2.3085.

Sorry that the equations didn't carry subscripting and superscripting when I cut and pasted them. The table didn't reproduce well either because the spaces got ignored. The first string of 3 numbers correspond to the first values of X Y and XY and the same for the followinf strings of three. After Sum comes the sums for X Y and XY respectively and then the sum of squares for X Y and XY respectively. The 2x2 matrices got messed up too. The values after the brackets should be in brackets underneath the numbers to the left.


2
Not meant as a plug for my book but i go through the computations of the least squares solution in simple linear regression (Y=aX+b) and calculate the standard errors for a and b, pp.101-103, The Essentials of Biostatistics for Physicians, Nurses, and Clinicians, Wiley 2011. a more detailed description can be found In Draper and Smith Applied Regression Analysis 3rd Edition, Wiley New York 1998 page 126-127. In my answer that follows I will take an example from Draper and Smith.
Michael R. Chernick

8
When I started interacting with this site, Michael, I had similar feelings. With experience, they have changed. It's worthwhile knowing some TEX and once you do, it's (almost) as fast to type it in as it is to type in anything in English. I also learned, by studying exemplary posts (such as many replies by @chl, cardinal, and other high-reputation-per-post users), that providing references, clear illustrations, and well-thought out equations is usually highly appreciated and well received. High quality is one thing distinguishing this site from most others.
whuber

2
That is all nice Bill and it is nice that so many people are dedicated to give those high quality posts. I may use Latex for other purposes, like publishing papers. But I don't have the time to go to all the effort that people expect of me on this site. i am not going to invest the time just to provide service on this site.
Michael R. Chernick

4
I think the disconnect is here: "This is just one of many things about this site that requires those posting to put in extra time and effort" - @whuber and I are both saying that it, in fact, does not take extra time if you know how to do it. We don't learn TEX so that we can post on this site - we (at least I) learn TEX because it's an important skill to have as a statistician and happens to make posts much more readable on this site.
มาโคร

3
Like many of the people on here, yes, I work as a statistician, but I also happen to find it fun - this site is recreational for me and it's a nice bonus that others find some of my posts useful. If you find marking up your equations with TEX to be work and don't think it's worth learning then so be it, but know that some of your content will be overlooked.
Macro
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.