เพื่อให้เข้าใจว่าทำไมเราถึงใช้การแจกแจงแบบ T คุณต้องรู้ว่าอะไรคือการกระจายตัวของและผลรวมที่เหลือของกำลังสอง ( ) เนื่องจากทั้งสองนี้รวมกันจะทำให้คุณกระจายตัว RSSβˆRSS
ส่วนที่ง่ายกว่าคือการกระจายของซึ่งเป็นการกระจายแบบปกติ - เพื่อดูข้อความนี้ที่ =ดังนั้นจึงเป็นฟังก์ชันเชิงเส้นของที่{n}) ดังนั้นมันจึงถูกแจกจ่ายตามปกติ - แจ้งให้เราทราบหากคุณต้องการความช่วยเหลือ อันเกิดการกระจายตัวของเบต้า} β (XTX)-1XTYYY~N(Xβ,σ2ฉันn) β ~N(β,σ2(XTX)-1) ββˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)βˆ∼N(β,σ2(XTX)−1)βˆ
นอกจากนี้โดยที่คือจำนวนการสังเกตและคือจำนวนของพารามิเตอร์ที่ใช้ในการถดถอยของคุณ การพิสูจน์เรื่องนี้เกี่ยวข้องกับอีกเล็กน้อย แต่ก็ตรงไปตรงมาที่จะได้รับ (ดูข้อพิสูจน์ที่นี่เหตุใดจึงมีการแจกแจงข้อมูลไคสแควร์ไคสแควร์ np? ) n pRSS∼σ2χ2n−pnp
จนถึงจุดนี้ฉันได้พิจารณาทุกอย่างในรูปของเมทริกซ์ / เวคเตอร์ แต่เพื่อความง่ายให้ใช้และใช้การกระจายแบบปกติซึ่งจะให้เรา:
βฉัน-βฉันβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
นอกจากนี้จากการแจกแจงไคสแควร์ของเรามี:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
นี้เป็นเพียงการปรับปรุงใหม่ของการแสดงออกไคสแควร์เป็นครั้งแรกและเป็นอิสระจาก(0,1) นอกจากนี้เรากำหนดซึ่งเป็นประมาณการที่เป็นกลางสำหรับ{2} โดยคำจำกัดความของคำจำกัดความที่แบ่งการแจกแจงแบบปกติโดยอิสระไคสแควร์ (เหนือระดับความเป็นอิสระ) ให้การแจกแจงแบบ t (สำหรับหลักฐานดู: ปกติหารด้วยให้การแจกแจงแบบ t กับคุณคุณจะได้รับ:s 2 = R S SN(0,1) σ2tn-p√s2=RSSn−pσ2tn−pχ2(s)/s−−−−−−√
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
ที่ไหน{i})s(XTX)−1ii−−−−−−−−√=SE(βˆi)
แจ้งให้เราทราบหากเหมาะสม