โซลูชันการวิเคราะห์การประมาณค่าสัมประสิทธิ์การถดถอยเชิงเส้น


9

ฉันพยายามที่จะเข้าใจสัญลักษณ์ของเมทริกซ์และทำงานกับเวกเตอร์และเมทริกซ์

ตอนนี้ฉันต้องการที่จะเข้าใจว่าเวกเตอร์ของการประมาณค่าสัมประสิทธิ์ในการคำนวณหลายถดถอยβ^

สมการพื้นฐานดูเหมือนจะเป็น

ddβ(yXβ)(yXβ)=0.

ตอนนี้ฉันจะแก้ปัญหาสำหรับ vector βที่นี่ได้อย่างไร

แก้ไข : เดี๋ยวก่อนฉันติดอยู่ ฉันมาที่นี่แล้วและไม่รู้จะทำอย่างไรต่อ:

ddβ((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))

ddβi=1n(yi(1xi1xi2xip)(β0β1βp))2

ด้วยสำหรับทุกสิ่งที่ถูกดัก:xi0=1i

ddβi=1n(yik=0pxikβk)2

คุณช่วยชี้ฉันในทิศทางที่ถูกต้องได้ไหม?


@GaBorgulya ขอบคุณสำหรับการแก้ไขไม่ทราบsmallmatrixดังนั้นจึงไม่พยายามแก้ไขเนื่องจากการแก้ปัญหาตามปกติของการทำลายสูตรในหลายบรรทัดจะไม่ทำงานที่นี่
mpiktas

คำตอบ:


12

เรามี

ddβ(yXβ)(yXβ)=2X(yXβ)เบต้า)

มันสามารถแสดงได้โดยการเขียนสมการอย่างชัดเจนด้วยองค์ประกอบ ยกตัวอย่างเช่นการเขียนแทน\จากนั้นจดอนุพันธ์ที่เกี่ยวข้องกับ , , ... ,และรวบรวมทุกอย่างเพื่อรับคำตอบ สำหรับภาพที่ง่ายและรวดเร็วคุณสามารถเริ่มต้นด้วย2(β1,,βp)ββ1β2βpp=2

ด้วยประสบการณ์หนึ่งพัฒนากฎทั่วไปซึ่งบางอย่างจะได้รับเช่นในเอกสารนั้น

แก้ไขเพื่อเป็นแนวทางสำหรับส่วนที่เพิ่มของคำถาม

ด้วยเรามีp=2

(yXβ)(yXβ)=(y1x11β1x12β2)2+(y2x21β1x22β2)2

อนุพันธ์ที่เกี่ยวกับคือβ1

2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)

ในทำนองเดียวกันอนุพันธ์ที่เกี่ยวกับคือβ2

2x12(y1x11β1x12β2)2x22(y2x21β1x22β2)

ดังนั้นอนุพันธ์ที่เกี่ยวข้องกับคือβ=(β1,β2)

(2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)2x12(y1x11β1x12β2)2x22(y2x21β1x22β2))

ตอนนี้สังเกตว่าคุณสามารถเขียนนิพจน์สุดท้ายเป็น

2(x11x21x12x22)(y1x11β1x12β2y2x21β1x22β2)=2X(yXβ)

แน่นอนว่าทุกอย่างทำไปในทางเดียวกันสำหรับใหญ่ขึ้นp


เยี่ยมมากฉันกำลังมองหา pdf ประเภทนั้นอย่างแน่นอน ขอบคุณตัน!
Alexander Engelhardt

โอ้ฉันคิดว่าฉันสามารถทำได้ด้วยตัวเองตอนนี้ แต่ฉันทำไม่ได้ คุณช่วยบอกฉันได้ไหมว่าขั้นตอนของฉันถูกต้องหรือไม่ถ้าฉันใช้ "วิธีอื่น" เพื่อแก้ไขปัญหานี้?
Alexander Engelhardt

@Alexx Hardt: สมการแรกของฉันในการแก้ไขเป็นเช่นเดียวกับสมการสุดท้ายของคุณในกรณีเฉพาะที่ p = 2 ดังนั้นคุณสามารถเลียนแบบการคำนวณของฉันสำหรับส่วนประกอบ 3, 4, ... , p
ocram

ขอบคุณอีกครั้ง :) ฉันคิดว่าฉันจะใช้คำแนะนำทั้งสามนี้จริง ๆ ฉันกำลังสร้าง. pdf ซึ่งอธิบายและสรุปพีชคณิตเมทริกซ์สถิติพื้นฐานเพราะฉันไม่เคยต้องการที่จะเรียนรู้เมื่อฉันเรียนในชั้นเรียน เพื่อแก้ปัญหาด้วยวิธีที่แตกต่างกันสามวิธีจะช่วยให้ฉันเข้าใจได้ดีขึ้นฉันหวังว่า
Alexander Engelhardt

โอ้ แต่นี่สำหรับ p = 2 และ n = 2 ใช่ไหม ฉันจะเขียนมันด้วย n = 3 ฉันคิดว่า
Alexander Engelhardt

13

คุณยังสามารถใช้สูตรจากเมทริกซ์ตำราอาหารได้ เรามี

(yXβ)(yXβ)=yyβXyyXβ+βXXβ

ตอนนี้ใช้อนุพันธ์ของแต่ละเทอม คุณอาจต้องการที่จะแจ้งให้ทราบว่า\อนุพันธ์ของเทอมเทียบกับคือศูนย์ ระยะเวลาที่เหลือβXy=yXβyyβ

βXXβ2yXβ

เป็นรูปแบบของการทำงาน

f(x)=xAx+bx,

ในสูตร (88) ในหนังสือเล่มนี้ในหน้า 11 มี ,และขอนุพันธ์ได้รับในสูตร (89):x=βA=XXb=2Xy

fx=(A+A)x+b

ดังนั้น

β(yXβ)(yXβ)=(XX+(XX))β2Xy

ตอนนี้เนื่องจากเราได้คำตอบที่ต้องการ:(XX)=XX

XXβ=Xy

+1 mpiktas: ทางออกของคุณมีความเฉลียวฉลาดมากกว่าของฉันและฉันคิดว่าควรใช้ในสถานการณ์จริงที่ซับซ้อนกว่านี้
ocram

1
@ocram ขอบคุณ ฉันจะไม่เรียกมันว่าแยบยลมันเป็นแอปพลิเคชันมาตรฐานของสูตรที่มีอยู่ คุณเพียงแค่ต้องรู้สูตร :)
mpiktas

8

นี่เป็นเทคนิคในการลดผลรวมของกำลังสองในการถดถอยที่จริงแล้วมีแอปพลิเคชันสำหรับการตั้งค่าทั่วไปมากขึ้นและฉันพบว่ามีประโยชน์

ลองหลีกเลี่ยงแคลคูลัสเวกเตอร์เมทริกซ์โดยสิ้นเชิง

สมมติว่าเรามีความสนใจในการย่อให้เล็กสุด ที่ ,และพี เราคิดว่าสำหรับความเรียบง่ายและP

E=(yXβ)T(yXβ)=yXβ22,
yRnXRn×pβRppnrank(X)=p

สำหรับเราได้รับ β^Rp

E=yXβ^+Xβ^Xβ22=yXβ^22+X(ββ^)222(ββ^)TXT(yXβ^).

ถ้าเราสามารถเลือก (find!) เวกเตอร์เช่นนั้นคำสุดท้ายที่ด้านขวามือเป็นศูนย์สำหรับทุก ๆเราก็จะทำเสร็จเพราะนั่นจะแปลว่า 2β^ βminβEyXβ^22

แต่,สำหรับทั้งหมดและถ้าหากและ สมการนี้เป็นจริงถ้าหากว่า\ ดังนั้นจะลดลงโดยการ\(ββ^)TXT(yXβ^)=0βXT(yXβ^)=0XTXβ^=XTyEβ^=(XTX)1XTy


แม้ว่านี่อาจดูเหมือน "เคล็ดลับ" เพื่อหลีกเลี่ยงแคลคูลัส แต่จริงๆแล้วมันมีแอพพลิเคชั่นที่กว้างขึ้นและมีรูปทรงเรขาคณิตที่น่าสนใจ

ตัวอย่างหนึ่งที่เทคนิคนี้ทำให้มามากง่ายกว่าเมทริกซ์เวกเตอร์แคลคูลัสวิธีการใด ๆ คือเมื่อเราคุยกับกรณีเมทริกซ์ ปล่อย ,และp} สมมติว่าเราต้องการย่อ ทั่วทั้งเมทริกซ์ของพารามิเตอร์ . ที่นี่เป็นเมทริกซ์ความแปรปรวนร่วมYRn×pXRn×qBRq×p

E=tr((YXB)Σ1(YXB)T)
BΣ

วิธีการที่คล้ายกันทั้งหมดที่กล่าวมาข้างต้นอย่างรวดเร็วพิสูจน์ได้ว่าการบรรลุข้อขั้นต่ำคือ นั่นคือในการตั้งค่าการถดถอยที่การตอบสนองเป็นเวกเตอร์ที่มีความแปรปรวนร่วมและการสังเกตมีความเป็นอิสระจากนั้นประมาณการ OLS จะบรรลุได้โดยการทำถดถอยเชิงเส้นแยกต่างหากในองค์ประกอบของการตอบสนองE

B^=(XTX)1XTY.
Σp

โชคดีที่กฎฟอรัมอนุญาตให้เพิ่ม +1 ในทุกคำตอบ ขอบคุณสำหรับการศึกษาพวก!
DWIN

@DWin คุณหมายถึงโพสต์สิ่งนี้ภายใต้ความคิดเห็นต่อคำถามหรือไม่
พระคาร์ดินัล

ฉันคิดว่าฉันสามารถมี ฉันได้ผ่านคำถามไปแล้วตามลำดับจากนั้นคำตอบทั้งหมด (หลังจากการประมวลผลของ MathML หยุดการกระตุก) และพบคำตอบที่ให้ข้อมูลแต่ละคำ ฉันเพิ่งแสดงความคิดเห็นของคุณกับคุณเพราะเป็นที่ที่ฉันหยุดอ่าน
DWIN

1
@DWin ใช่การเรนเดอร์ค่อนข้างขี้ขลาด ฉันคิดว่าคุณอาจต้องการแสดงความคิดเห็นสำหรับโพสต์อื่นเนื่องจากโพสต์นี้ไม่มีการลงคะแนน (ขึ้นหรือลง) ดังนั้นความคิดเห็นจึงดูเหมือนไม่เหมาะสม ไชโย
พระคาร์ดินัล

1
@cardinal +1 เคล็ดลับที่มีประโยชน์ คำถามนี้กลายเป็นการอ้างอิงที่ดีทีเดียว
mpiktas

6

วิธีหนึ่งที่อาจช่วยให้คุณเข้าใจคือการไม่ใช้พีชคณิตเมทริกซ์และแยกแยะแต่ละส่วนที่เกี่ยวข้องกับแต่ละองค์ประกอบจากนั้น "จัดเก็บ" ผลลัพธ์ในคอลัมน์เวกเตอร์ ดังนั้นเราจึงมี:

βki=1N(Yij=1pXijβj)2=0

ทีนี้คุณมีของสมการเหล่านี้หนึ่งอันสำหรับแต่ละเบต้า นี่เป็นแอปพลิเคชันอย่างง่ายของกฎลูกโซ่:p

i=1N2(Yij=1pXijβj)1(βk[Yij=1pXijβj])=0
2i=1NXik(Yij=1pXijβj)=0

ตอนนี้เราสามารถเขียนผลรวมอีกครั้งในวงเล็บได้ที่ ดังนั้นคุณจะได้รับ:j=1pXijβj=xiTβ

i=1NXikYii=1NXikxiTβ=0

ทีนี้เรามีของสมการเหล่านี้แล้วเราจะ "สแต็กพวกมัน" ในเวกเตอร์คอลัมน์ โปรดสังเกตว่าเป็นคำศัพท์เดียวที่ขึ้นอยู่กับดังนั้นเราจึงสามารถซ้อนสิ่งนี้ลงใน vectorและเราได้รับ:pXikkxi

i=1NxiYi=i=1NxixiTβ

ตอนนี้เราสามารถใช้เบต้านอกผลรวม (แต่ต้องอยู่ที่ RHS ของผลรวม) แล้วจึงใช้อินเวอร์เวีย:

(i=1NxixiT)1i=1NxiYi=β
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.