การแลกเปลี่ยนความแปรปรวนแบบอคติสำหรับสัมประสิทธิ์การถดถอยคืออะไรและทำอย่างไรจึงจะได้มา


9

ในบทความนี้ ( การอนุมานแบบเบย์สำหรับส่วนประกอบความแปรปรวนโดยใช้ข้อผิดพลาดเฉพาะฮาร์วิลล์ 2517) ผู้เขียนอ้างว่า เป็น "ที่รู้จักกันดี ความสัมพันธ์ ", สำหรับการถดถอยเชิงเส้น ที่ \ epsilon \ sim \ mathcal {N} (0, H)

(yXβ)H1(yXβ)=(yXβ^)H1(yXβ^)+(ββ^)(XH1X)(ββ^)
y=Xβ+ϵ,
ϵN(0,H).

สิ่งนี้เป็นที่รู้จักกันดีอย่างไร วิธีที่ง่ายที่สุดในการพิสูจน์สิ่งนี้คืออะไร?


1
มันอยู่ในวิกิพีเดียดู 'ได้รับ' ที่นั่น
user603

@ user603 คุณต้องการทำให้การเชื่อมโยงชัดเจนขึ้นหรือไม่? ขอบคุณ!
การพนัน Sibbs

@ user603 ขออภัยฉันไม่เห็นจริงๆว่าลิงก์แก้ปัญหาได้อย่างไร สำหรับฉันในกรณีของฉันสมการคือ Var (y) = bias + ... คุณอธิบายได้ไหม?
การพนัน Sibbs

4
@SibbsGambling ทราบว่าสมการของคุณมีสองแง่แปรปรวนที่เกี่ยวข้องในการกำหนดนี้การถดถอยเชิงเส้นถ่วงน้ำหนัก คำทางซ้ายเกี่ยวข้องกับความแปรปรวนรอบตัวแบบจริง (ถ่วงน้ำหนักด้วยเมทริกซ์ความแม่นยำ ) เทอมแรกทางด้านขวาสัมพันธ์กับความแปรปรวนของโมเดลที่ติดตั้งไว้ ระยะที่สองทางด้านขวาสัมพันธ์กับกำลังสองของความเอนเอียง นั่นคือความแปรปรวน -bias tradeoff H1
EdM

คำตอบ:


6

คำสุดท้ายในสมการสามารถเขียนเป็น

(XβXβ^)H1(XβXβ^).

ในรูปแบบนี้สมการกำลังพูดอะไรที่น่าสนใจ สมมติว่าเป็นค่าบวกแน่นอนและสมมาตรดังนั้นมันจึงกลับกัน ดังนั้นเราสามารถกำหนดผลิตภัณฑ์ภายในให้เราเรขาคณิต จากนั้นความเท่าเทียมกันที่กล่าวมาก็คือ H<x,y>H1=xH1y

(XβXβ^)(yXβ^).

ฉันต้องการให้สัญชาตญาณของคุณเล็กน้อยเพราะผู้แสดงความคิดเห็นได้ทิ้งลิงค์ไปยังแหล่งที่มา

แก้ไข: สำหรับลูกหลาน

LHS:

(yXβ)H1(yXβ)=yH1y2yH1Xβ+βXH1Xβ=(A)(B)+(C)

RHS:

(yXβ^)H1(yXβ^)+(ββ^)(XH1X)(ββ^)
=yH1y2yH1Xβ^+β^XH1Xβ^+βXH1Xβ2β^XH1Xβ+β^XH1Xβ^=(A)(D)+(E)+(C)(F)+(E)

ความสัมพันธ์:

β^=(XH1X)1XH1y

คุณสามารถแสดงให้เห็นว่า (B) = (F) และ 2 (E) = (D) ทุกอย่างเสร็จเรียบร้อย.


ขออภัยฉันไม่เห็นจริงๆว่าลิงก์แก้ปัญหาได้อย่างไร สำหรับฉันในกรณีของฉันสมการคือ Var (y) = bias + ... คุณอธิบายได้ไหม?
การพนัน Sibbs

@SibbsGambling แก้ไขคำตอบของฉันรวมถึงที่มา
jlimahaverford

@jlimahaverford คุณไม่ลืมในตอนท้ายของสูตรสำหรับใช่ไหม yβ^
Gumeo

7

พวกเขามาถึงตัวตนนี้ด้วยเทคนิคที่เรียกว่าการทำตารางให้สมบูรณ์ ด้านซ้ายมืออยู่ในรูปกำลังสองดังนั้นเริ่มจากการคูณมันออกมา

(yXβ)H1(yXβ)=yH1y2yH1Xβ+βXH1Xβ

ดำเนินการต่อแล้วเขียนในแง่ของ Y พีชคณิตนั้นยาวมาก แต่ googling เติมสี่เหลี่ยมในการถดถอยแบบเบย์และคุณจะพบคำใบ้มากมาย ตัวอย่างเช่นดูวิกิพีเดียในคชกรรมถดถอยเชิงเส้นและคำตอบ CrossValided อื่น ๆ เกี่ยวกับการกรอกตารางเหมือนที่นี่ β^=(XH1X)1XH1y


2

หากคุณรู้ว่าพีชคณิตเมทริกซ์ของคุณนี่ควรจะทำได้โดยการคูณทุกอย่างออกมาและตรวจสอบว่าคุณมีทั้งสองด้านเหมือนกัน นี่คือสิ่งที่ jlimahaverford แสดงให้เห็น

เพื่อให้สามารถทำเช่นนี้คุณต้องสูตรสำหรับประมาณการของเบต้า} เราสามารถหาสูตรในลักษณะที่คล้ายคลึงกับการถดถอยเชิงเส้นเมื่อเรามีข้อผิดพลาดที่ไม่เกี่ยวข้องกัน เคล็ดลับคือการสร้างมาตรฐานβ^

นี่คือข้อมูลบางส่วนเกี่ยวกับวิธีสร้างมาตรฐาน RV ที่มาจากการแจกแจงแบบหลายตัวแปรปกติ สมมติว่าคุณมี เป็นบวกที่ชัดเจนเพื่อให้คุณสามารถ factorize เป็น T ตอนนี้ตัวแปรสุ่ม มาจากการกระจายI) ตอนนี้เราสามารถใช้เคล็ดลับนี้สำหรับปัญหาของเราเพื่อค้นหาเบต้า} Let 's Factorize T เรามี Nowได้รับมาตรฐานเช่นนั้น

XN(μ,Σ).
ΣΣ=PPT
Y=P1(Xμ)
N(0,I)β^H=PPT
y=Xβ+ϵP1y=P1Xβ+P1ϵ
ϵcov(P1ϵ)=Iดังนั้นตอนนี้เราจึงสามารถปฏิบัติต่อสิ่งนี้เป็นรูปแบบการถดถอยเชิงเส้นแบบง่าย ๆ โดยที่: ดังนั้นเราจึงมีปัญหาการถดถอย: สูตรสำหรับคือ นี่คือกุญแจที่ต้องทำ นี่คือการจัดการพีชคณิตที่แสดงให้เห็นในการแก้ปัญหาโดย jlimahaverford
X~=P1X,y~=P1yandϵ~=P1ϵ.
y~=X~β+ϵ~
β^
β^=(X~TX~)1X~Ty~=((P1X)TP1X)1(P1X)TP1y=(XT(PPT)1X)1X(PPT)1y=(XTH1X)1XH1y
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.