วิธีหาค่าแปรปรวน - ความแปรปรวนร่วมของสัมประสิทธิ์ในการถดถอยเชิงเส้น


36

ฉันกำลังอ่านหนังสือเกี่ยวกับการถดถอยเชิงเส้นและมีปัญหาในการเข้าใจเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมของ :b

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งที่เป็นแนวทแยงนั้นง่ายพอ แต่สิ่งที่อยู่นอกแนวทแยงนั้นยากกว่าเล็กน้อยสิ่งที่ไขปริศนาให้ฉันคือ

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

แต่ไม่มีร่องรอยของβ0และβ1ที่นี่


3
คำถามที่เกี่ยวข้อง: stats.stackexchange.com/questions/44838/…
ocram

2
หนังสือเล่มไหน
Konstantinos

คำตอบ:


53

นี่เป็นคำถามที่ยอดเยี่ยมที่ท้าทายความเข้าใจพื้นฐานของการถดถอย

ก่อนอื่นให้ลบความสับสนเบื้องต้นเกี่ยวกับสัญกรณ์ เรากำลังดูการถดถอย:

y=b0+b1x+u^

โดยที่และเป็นตัวประมาณของจริงและและเป็นค่าตกค้างของการถดถอย โปรดทราบว่าการถดถอยที่แท้จริงและไม่ได้รับการสนับสนุนจะแสดงเป็น:b0b1β0β1u^

y=β0+β1x+u

กับความคาดหวังของและความแปรปรวน 2 หนังสือบางเล่มแสดงว่าเป็นและเราปรับการประชุมนี้ที่นี่ นอกจากนี้เรายังให้ใช้รูปแบบเมทริกซ์ที่เป็นเวกเตอร์ 2x1 ที่ถือประมาณของคือb_1] (นอกจากนี้เพื่อความชัดเจนฉันถือว่า X เป็นค่าคงที่ในการคำนวณต่อไปนี้)E[u]=0E[u2]=σ2bβ^β=[β0,β1]b=[b0,b1]

ตอนนี้คำถามของคุณ สูตรของคุณสำหรับความแปรปรวนร่วมนั้นถูกต้องแน่นอนนั่นคือ:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

ฉันคิดว่าคุณต้องการที่จะรู้ว่าทำไมเราถึงมีสัมประสิทธิ์ที่แท้จริงที่ไม่ได้สังเกตในสูตรนี้? พวกเขาจะถูกยกเลิกจริงถ้าเราทำขั้นตอนต่อไปโดยการขยายสูตร หากต้องการดูสิ่งนี้โปรดทราบว่าความแปรปรวนประชากรของเครื่องมือประมาณนั้นมอบให้โดย:β0,β1

Var(β^)=σ2(XX)1

เมทริกซ์นี้มีค่าความแปรปรวนในองค์ประกอบทแยงมุมและค่าแปรปรวนร่วมในองค์ประกอบนอกแนวทแยงมุม

หากต้องการมาถึงสูตรข้างต้นเราขอสรุปการเรียกร้องของคุณโดยใช้สัญกรณ์เมทริกซ์ ขอให้เราแปรปรวนจึงแสดงว่ามีและความคาดหวังกับcdot]Var[]E[]

Var[b]=E[b2]E[b]E[b]

โดยพื้นฐานแล้วเรามีสูตรความแปรปรวนทั่วไปเพียงใช้สัญกรณ์เมทริกซ์ แก้สมการเมื่อแทนในการแสดงออกมาตรฐานสำหรับประมาณการขและสมมติว่าเป็นตัวประมาณที่ไม่มีอคติ ดังนั้นเราได้รับ:b=(XX)1XyE[b]=β

E[((XX)1Xy)2]β22×2

โปรดทราบว่าเรามีทางด้านขวา - 2x2 เมทริกซ์คือแต่คุณอาจมาถึงจุดนี้แล้วเดาว่าจะเกิดอะไรขึ้นกับคำนี้ในไม่ช้าβ2bb

การแทนที่ด้วยนิพจน์ของเราสำหรับกระบวนการสร้างข้อมูลพื้นฐานที่แท้จริงข้างต้นเรามี:y

E[((XX)1Xy)2]β2=E[((XX)1X(Xβ+u))2]β2=E[((XX)1XX=Iβ+(XX)1Xu)2]β2=E[(β+(XX)1Xu)2]β2=β2+E[(XX)1Xu)2]β2

ตั้งแต่ 0 นอกจากนี้เทอมกำลังสองจะถูกยกเลิกตามที่คาดการณ์ไว้E[u]=0β2

ดังนั้นเราจึงมี:

Var[b]=((XX)1X)2E[u2]

โดยเส้นตรงของความคาดหวัง โปรดทราบว่าโดยสมมติฐานและเนื่องจากเป็นเมทริกซ์และจึงเหมือนกับการแปลง ในที่สุดเราก็มาถึงE[u2]=σ2((XX)1X)2=(XX)1XX(XX)1=(XX)1XXK×K

Var[b]=σ2(XX)1

ตอนนี้เราได้กำจัดเงื่อนไขทั้งหมดความแปรปรวนของตัวประมาณนั้นไม่ขึ้นอยู่กับค่าของสัมประสิทธิ์พื้นฐานจริงเนื่องจากนี่ไม่ใช่ตัวแปรสุ่มต่อ se ผลลัพธ์จะใช้ได้สำหรับองค์ประกอบแต่ละรายการในเมทริกซ์ความแปรปรวนร่วมแปรปรวนดังที่แสดงในหนังสือดังนั้นจึงใช้ได้สำหรับองค์ประกอบนอกแนวทแยงมุมด้วยเพื่อยกเลิกตามลำดับ ปัญหาเดียวคือคุณได้ใช้สูตรทั่วไปสำหรับความแปรปรวนซึ่งไม่ได้สะท้อนถึงการยกเลิกนี้ในตอนแรกββ0β1

ในท้ายที่สุดความแปรปรวนของค่าสัมประสิทธิ์ที่ลดไปและเป็นอิสระจาก\แต่สิ่งนี้หมายความว่าอย่างไร (ฉันเชื่อว่าคุณถามถึงความเข้าใจโดยทั่วไปของเมทริกซ์ความแปรปรวนร่วมทั่วไปด้วย)σ2(XX)1β

ดูสูตรในหนังสือ มันก็แค่อ้างว่าความแปรปรวนของตัวประมาณเพิ่มขึ้นเมื่อคำผิดพลาดพื้นฐานที่แท้จริงนั้นมีเสียงดังมาก (เพิ่มขึ้น) แต่จะลดลงเมื่อการแพร่กระจายของ X เพิ่มขึ้น เนื่องจากการมีการสังเกตมากขึ้นแพร่กระจายไปรอบ ๆ ค่าที่แท้จริงช่วยให้คุณโดยทั่วไปสร้างตัวประมาณที่แม่นยำมากขึ้นและใกล้เคียงกับแท้จริง บนมืออื่น ๆ เงื่อนไขความแปรปรวนในการปิดเส้นทแยงมุมกลายเป็นจริงที่เกี่ยวข้องในการทดสอบสมมติฐานสมมติฐานร่วมกันเช่น 0 นอกเหนือจากนั้นพวกเขาเป็นเรื่องเหลวไหลจริง ๆ หวังว่านี่จะทำให้ทุกคำถามชัดเจนขึ้นσ2βb0=b1=0


และเมื่อรักษาค่าคงที่การแพร่กระจายและลดค่า x ของข้อผิดพลาดมาตรฐานของการสกัดกั้นจะมีขนาดเล็กลงซึ่งเหมาะสม
Theta30

ฉันไม่ทำตามการขยายตัวของสแควร์ เหตุใดจึงไม่ทำให้เป็นเรื่องง่าย ? ((XX)1X)2=((XX)1X)((XX)1X)=X2
เดวิด

2

ในกรณีของคุณเรามี

XX=[nXiXiXi2]

กลับเมทริกซ์นี้แล้วคุณจะได้ผลลัพธ์ที่ต้องการ


1

ดูเหมือนว่าเป็นค่าที่คาดการณ์ไว้ (ค่าที่คาดหวัง) พวกเขาทำให้สวิทช์ระหว่างและEβ0β1E(b0)=β0E(b1)=β1


β0โดยทั่วไปไม่รู้จักและพวกเขาสามารถสลับไปที่อะไรได้บ้าง β1
QED

ผมคิดว่าผมเข้าใจความสับสนและผมคิดว่าพวกเขาอาจจะควรที่จะเขียนมากกว่า\นี่เป็นอีกโพสต์ที่ต้องผ่านการคำนวณ: ลิงค์β0β0
Drew75

2
@qed: เพื่อสุ่มตัวอย่างปริมาณที่ไม่รู้จัก
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.