เหตุใด RSS จึงกระจายไคสแควร์ถึง np


28

ฉันต้องการที่จะเข้าใจว่าทำไมภายใต้รูปแบบ OLS ที่ RSS (ผลรวมที่เหลือของสี่เหลี่ยม) มีการกระจาย ( Pเป็นจำนวนของพารามิเตอร์ในรูปแบบที่nจำนวนสังเกต)

χ2(np)
pn

ฉันขอโทษที่ถามคำถามพื้นฐาน แต่ดูเหมือนว่าฉันจะไม่สามารถหาคำตอบออนไลน์ได้ (หรือในตำราเรียนที่เน้นการประยุกต์ใช้มากขึ้น)


3
โปรดทราบว่าคำตอบแสดงให้เห็นถึงการยืนยันที่ไม่ถูกต้อง: การกระจายของ RSS คือσ2 (ไม่ใช่np ) χ2(np)การกระจาย( 2 ( n - p )โดยที่σ2เป็นความแปรปรวนที่แท้จริงของข้อผิดพลาด
whuber

คำตอบ:


36

ผมคิดรูปแบบเชิงเส้นต่อไปนี้: y=Xβ+ϵ ε

เวกเตอร์ของส่วนที่เหลืออยู่ประมาณ

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

ที่Q=IX(XX)1X '

tr(Q)=npQ=Q=Q2Q01V

VQV=Δ=diag(1,,1np times,0,,0p times)

K=Vϵ^

ϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K2σ2=K2σ2χnp2

กับ{NP})'K=(K1,,Knp)

นอกจากนี้ในขณะที่เป็นเมทริกซ์รวมเราก็มีV

ϵ^2=K2=K2

ดังนั้น

RSSσ2χnp2

สุดท้ายสังเกตว่าผลลัพธ์นี้มีความหมายว่า

E(RSSnp)=σ2

ตั้งแต่ที่พหุนามน้อยที่สุดของแบ่งพหุนามZ ดังนั้นค่าลักษณะเฉพาะของอยู่ในหมู่และ1ตั้งแต่ยังเป็นผลรวมของค่าลักษณะเฉพาะคูณด้วยหลายหลากของพวกเขาที่เราจำเป็นต้องมีที่เป็นค่าเฉพาะกับหลายหลากและศูนย์เป็นค่าเฉพาะกับหลายหลากพีQ2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1) คำตอบที่ดี เราสามารถจำกัดความสนใจของ orthogonal แทนที่จะรวมกันเนื่องจากนั้นเป็นจริงและสมมาตร นอกจากนี้คืออะไร ฉันไม่เห็นมันกำหนดไว้ โดยการทบทวนข้อโต้แย้งเล็กน้อยเราสามารถหลีกเลี่ยงการใช้ความเสื่อมปกติในกรณีที่ทำให้เกิดความหวาดกลัวต่อผู้ที่ไม่คุ้นเคย VQSCR
พระคาร์ดินัล

2
@Cardinal จุดดี. SCR ('Somme des CarrésRésiduels' ในภาษาฝรั่งเศส) ควรเป็น RSS
ocram

ขอบคุณสำหรับคำตอบอย่างละเอียด Ocram! บางขั้นตอนจะทำให้ฉันต้องมองเพิ่มเติม แต่ฉันมีเค้าร่างที่จะคิดตอนนี้ - ขอบคุณ!
Tal Galili

@Glen_b: โอ้ฉันแก้ไขไปสองสามวันแล้วเพื่อเปลี่ยน SCR เป็น SRR ฉันจำไม่ได้ว่า SCR ถูกกล่าวถึงในความคิดเห็นของฉัน ขอโทษสำหรับความสับสน.
ocram

@Glen_b: มันควรจะหมายถึง RSS: -S แก้ไขอีกครั้ง ขอบคุณ
ocram

9

IMHO สัญกรณ์การแต่งงานทำให้สิ่งต่าง ๆ ซับซ้อนขึ้น ภาษาอวกาศเวกเตอร์ที่บริสุทธิ์นั้นสะอาดกว่า แบบจำลองสามารถเขียนได้โดยที่มีการแจกแจงแบบปกติมาตรฐานบนและถือว่าเป็นของเวกเตอร์สเปซย่อย nY=Xβ+ϵY=μ+σGGRnμWRn

ตอนนี้ภาษาของเรขาคณิตเบื้องต้นเข้ามาเล่น ตัวประมาณกำลังสองน้อยที่สุดของไม่ได้เป็นอะไรนอกจาก : การประมาณการมุมฉากของสังเกตได้บนพื้นที่ซึ่งถือเป็นของ เวกเตอร์ของเหลือคือ : ประมาณการ orthogonal ประกอบของในn} มิติของมี(W)μ^μPWYYWμPWYWWRnWdim(W)=ndim(W)

ในที่สุดและ มีการแจกแจงแบบปกติมาตรฐานในดังนั้นจึงเป็นมาตรฐานที่ยกกำลังสอง การพร้อมองศาความอิสระ

PWY=PW(μ+σG)=0+σPWG,
PWGWχ2dim(W)

การสาธิตนี้ใช้ทฤษฎีบทเพียงข้อเดียวจริงๆแล้วนิยามของทฤษฎีบท:

นิยามและทฤษฎีบท เวกเตอร์แบบสุ่มในมีการแจกแจงแบบปกติมาตรฐานบนปริภูมิเวกเตอร์หากใช้ค่าในและพิกัดในหนึ่ง (ทุกตัว) พื้นฐาน orthonormal ofเป็นอิสระการแจกแจงแบบปกติหนึ่งมิติมาตรฐานRnURnUU

(จากคำจำกัดความของทฤษฎีบทนี้ทฤษฎีบทของ Cochran เห็นได้ชัดว่าไม่คุ้มที่จะกล่าวถึง)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.