ถ้าอยู่ในอันดับเต็มค่าผกผันของมีอยู่และเราจะได้ค่าประมาณกำลังสองน้อยที่สุด:
และX
เราจะอธิบายอย่างสังหรณ์ใจได้อย่างไรในสูตรผลต่าง เทคนิคของการได้มานั้นชัดเจนสำหรับฉัน(XTX)−1
ถ้าอยู่ในอันดับเต็มค่าผกผันของมีอยู่และเราจะได้ค่าประมาณกำลังสองน้อยที่สุด:
และX
เราจะอธิบายอย่างสังหรณ์ใจได้อย่างไรในสูตรผลต่าง เทคนิคของการได้มานั้นชัดเจนสำหรับฉัน(XTX)−1
คำตอบ:
พิจารณาการถดถอยอย่างง่าย ๆ โดยไม่มีค่าคงที่และที่ regressor เดียวมีศูนย์กลางอยู่ที่ค่าเฉลี่ยตัวอย่าง จากนั้น คือ ( ) ความแปรปรวนตัวอย่างของมันและ recirpocal ดังนั้นยิ่งค่าความแปรปรวน = ความแปรปรวนใน regressor ยิ่งสูงความแปรปรวนของตัวประมาณค่าสัมประสิทธิ์ก็จะยิ่งลดลงความแปรปรวนที่เรามีในตัวแปรอธิบายก็ยิ่งมากขึ้นเท่านั้น X′X
ทำไม? เนื่องจาก regressor มีความหลากหลายมากขึ้นข้อมูลก็จะมีมากขึ้น เมื่อ regressors มีจำนวนมากสิ่งนี้จะทำให้ค่าผกผันแปรปรวนร่วมกับเมทริกซ์ความแปรปรวนร่วมของพวกมันซึ่งคำนึงถึงความแปรปรวนร่วมของ regressors ด้วย ในกรณีที่สุดขีดที่เป็นแนวทแยงมุมดังนั้นความแม่นยำสำหรับค่าสัมประสิทธิ์โดยประมาณขึ้นอยู่กับความแปรปรวน / ความแปรปรวนของ regressor ที่เกี่ยวข้องเท่านั้น (ให้ค่าความแปรปรวนของคำผิดพลาด)X ′ X
วิธีง่ายๆในการดูเป็นเมทริกซ์ (หลายตัวแปร) อะนาล็อกของซึ่งเป็นความแปรปรวนของสัมประสิทธิ์ความชันในการถดถอย OLS แบบง่าย เราสามารถได้สำหรับความแปรปรวนนั้นโดยการตัดการสกัดกั้นในแบบจำลองเช่นโดยการถดถอยผ่านจุดกำเนิดσ 2 ( X T X ) - 1 σ 2
จากหนึ่งในสูตรเหล่านี้อาจเห็นได้ว่าความแปรปรวนของตัวแปรทำนายใหญ่กว่าจะนำไปสู่การประมาณค่าสัมประสิทธิ์ที่แม่นยำยิ่งขึ้น นี่คือความคิดที่มักใช้ในการออกแบบการทดลองโดยการเลือกค่าสำหรับการพยากรณ์ (ไม่ใช่ - สุ่ม) ใครจะทำให้ปัจจัยของมีขนาดใหญ่ที่สุดเท่าที่จะทำได้ปัจจัยที่เป็นตัววัดความแปรปรวน( X T X )
การแปลงเชิงเส้นของตัวแปรสุ่มแบบเกาส์นั้นช่วยได้หรือไม่? ใช้กฎว่าถ้าแล้วA)x ∼ N ( μ , Σ ) A x + b ∼ N ( A μ + b , A T Σ A )
สมมติว่าเป็นรุ่นพื้นฐานและ2)Y = X β + ϵ ϵ ∼ N ( 0 , σ 2 )
∴ Y ∼ N ( X β , σ 2 )X T Y ∼ N ( X T X β , X σ 2 X T )( X T X ) - 1 X T Y ∼ N [ β , ( X T X ) - 1 σ 2 ]
ดังนั้นเป็นเพียงการปรับเมทริกซ์ที่ซับซ้อนที่แปลงกระจายของY( X T X ) - 1 X T
หวังว่าจะเป็นประโยชน์
ผมจะใช้วิธีการที่แตกต่างกันต่อการพัฒนาสัญชาตญาณที่รองรับสูตร1} เมื่อพัฒนาสัญชาตญาณสำหรับตัวแบบการถดถอยพหุคูณมันจะเป็นประโยชน์ในการพิจารณาตัวแบบการถดถอยเชิงเส้นแบบไบวาเรียคือ ,มักถูกเรียกว่าการสนับสนุนที่กำหนดขึ้นเพื่อและเรียกว่าการสุ่มสุ่ม แสดงในรูปของการเบี่ยงเบนจากค่าเฉลี่ยตัวอย่างโมเดลนี้อาจถูกเขียนเป็นvarβ =σ2(X'X)-1ปีฉัน=α+βxฉัน+εฉัน,
เพื่อช่วยในการพัฒนาสัญชาตญาณเราจะสมมติว่าสมมติฐาน Gauss-Markov ที่ง่ายที่สุดพอใจ: nonstochastic,สำหรับทั้งหมดและสำหรับทุก n เมื่อคุณทราบดีแล้วเงื่อนไขเหล่านี้รับประกันว่าที่คือความแปรปรวนของตัวอย่างxในคำพูดสูตรนี้มีการอ้างสิทธิ์สามข้อ: "ความแปรปรวนของแปรผกผันกับขนาดตัวอย่างมันเป็นสัดส่วนโดยตรงกับความแปรปรวนของx i ∑ n i = 1 ( x i - ˉ x ) 2 > 0 n ε i ∼ iid ( 0 , σ 2 ) i = 1 , … , n Var
ทำไมต้องเป็นสองเท่าของขนาดตัวอย่างceteris paribusสาเหตุความแปรปรวนของจะถูกตัดในช่วงครึ่งปี? ผลลัพธ์นี้เชื่อมโยงอย่างใกล้ชิดกับข้อสันนิษฐานของ iid ที่นำไปใช้กับ : เนื่องจากข้อผิดพลาดของแต่ละบุคคลถูกสันนิษฐานว่าเป็น iid การสังเกตแต่ละครั้งจึงควรได้รับการปฏิบัติเช่นเดียวกับข้อมูล และการเพิ่มจำนวนการสังเกตเป็นสองเท่าจะเพิ่มจำนวนข้อมูลเกี่ยวกับพารามิเตอร์ที่อธิบายความสัมพันธ์ (เชิงเส้นสมมติ) ระหว่างและบีตา ε
เปิด Let 's แล้วคำถามหลักของคุณซึ่งเป็นเรื่องเกี่ยวกับการพัฒนาสัญชาตญาณสำหรับการเรียกร้องที่แปรปรวนของเป็นสัดส่วนผกผันการแปรปรวนของxในการทำให้เป็นระเบียบความคิดนั้นให้เราพิจารณาแบบจำลองการถดถอยเชิงเส้นแบบแยกสองส่วนที่เรียกว่าแบบจำลองและแบบจำลองนับจากนี้เป็นต้นไป เราจะคิดว่าทั้งสองรุ่นตอบสนองสมมติฐานของรูปแบบที่ง่ายของทฤษฎีบท Gauss-มาร์คอฟและว่ารูปแบบร่วมค่าเดียวกันแน่นอนของ , ,และ 2 ภายใต้สมมติฐานเหล่านี้มันง่ายที่จะแสดงให้เห็นว่าβ x(1)(2)อัลฟ่าβnσ2E
เนื่องจากโดยการสันนิษฐาน , โดยเฉลี่ยแต่ละจะอยู่ห่างจากกว่าเป็นกรณีโดยเฉลี่ยสำหรับ{(2)} ขอให้เราแสดงให้เห็นถึงความแตกต่างแน่นอนคาดว่าเฉลี่ยระหว่างและโดยd_xสมมติฐานที่หมายความว่า{(2)} รูปแบบการถดถอยเชิงเส้นแบบซึ่งแสดงเป็นค่าเบี่ยงเบนจากค่าเฉลี่ยระบุว่าสำหรับแบบจำลองและสำหรับแบบจำลองVarx(1)>Varx(2)
มันเป็นเรื่องตรงไปตรงมาพอสมควรที่จะพูดถึงสัญชาตญาณที่ได้จากการศึกษารูปแบบการถดถอยอย่างง่ายไปสู่รูปแบบการถดถอยเชิงเส้นหลายแบบทั่วไป ภาวะแทรกซ้อนที่สำคัญคือแทนที่จะเปรียบเทียบความแปรปรวนแบบสเกลาร์จึงจำเป็นต้องเปรียบเทียบ "ขนาด" ของเมทริกซ์ความแปรปรวนร่วมและความแปรปรวนร่วม การมีความรู้ในการทำงานที่ดีของดีเทอร์มิแนนต์, ร่องรอยและค่าลักษณะเฉพาะของเมทริกซ์สมมาตรจริงนั้นมีประโยชน์มากในตอนนี้ :-)
สมมติว่าเรามีการสังเกต (หรือขนาดตัวอย่าง) และพารามิเตอร์n
เมทริกซ์ความแปรปรวนร่วมของพารามิเตอร์โดยประมาณฯลฯ เป็นตัวแทนของความถูกต้องของพารามิเตอร์โดยประมาณVar(ˆβ)
ถ้าในโลกที่เหมาะข้อมูลสามารถอธิบายได้อย่างสมบูรณ์แบบแล้วเสียงจะเป็น0 ตอนนี้รายการในแนวทแยงของสอดคล้องกับเป็นต้น สูตรที่ได้จากการแปรปรวนเห็นด้วยกับสัญชาตญาณว่าถ้าเสียงต่ำกว่าการประมาณจะแม่นยำยิ่งขึ้นσ2=0
นอกจากนี้เมื่อจำนวนการวัดเพิ่มขึ้นความแปรปรวนของพารามิเตอร์โดยประมาณจะลดลง ดังนั้นโดยรวมค่าสัมบูรณ์ของรายการของจะสูงกว่าเนื่องจากจำนวนคอลัมน์ของคือและจำนวนแถวของคือและแต่ละรายการของเป็นผลรวมของคู่ผลิตภัณฑ์ ค่าสัมบูรณ์ของรายการของค่าผกผันจะลดลงXTX
ดังนั้นแม้ว่าจะมีเป็นจำนวนมากของเสียงเรายังคงประมาณการเข้าถึงที่ดี ของพารามิเตอร์ถ้าเราเพิ่มขนาดของกลุ่มตัวอย่างn^βi
ฉันหวังว่านี่จะช่วยได้.
การอ้างอิง: ส่วน 7.3 ในสี่เหลี่ยมจัตุรัสน้อยที่สุด: Cosentino, Carlo และ Declan Bates การควบคุมความคิดเห็นในชีววิทยาของระบบ Crc Press, 2011
สิ่งนี้สร้างขึ้นจากคำตอบของ @Alecos Papadopuolos
จำได้ว่าผลลัพธ์ของการถดถอยกำลังสองน้อยที่สุดไม่ได้ขึ้นอยู่กับหน่วยการวัดตัวแปรของคุณ สมมติว่าตัวแปร X ของคุณเป็นการวัดความยาวที่กำหนดเป็นนิ้ว จากนั้นการ rescaling X โดยการคูณด้วย 2.54 เพื่อเปลี่ยนหน่วยเป็นเซนติเมตร หากคุณดัดแปลงโมเดลใหม่การประมาณการการถดถอยใหม่จะเป็นการประมาณแบบเก่าหารด้วย 2.54
เมทริกซ์คือความแปรปรวนของ X และด้วยเหตุนี้สะท้อนให้เห็นถึงระดับของการวัดเอ็กซ์ถ้าคุณเปลี่ยนขนาดคุณจะต้องสะท้อนถึงนี้ในการประมาณการของคุณและนี้จะทำโดยการคูณโดยผกผันของ'XX′XβX′X