สัญชาตญาณด้านหลังในรูปแบบปิดของ w ในการถดถอยเชิงเส้น


10

รูปแบบปิดของ w ในการถดถอยเชิงเส้นสามารถเขียนได้

w^=(XTX)1XTy

เราจะอธิบายบทบาทของในสมการนี้ได้อย่างไร(XTX)1


2
คุณสามารถอธิบายอย่างละเอียดเกี่ยวกับสิ่งที่คุณหมายถึงโดย "สังหรณ์ใจ"? ตัวอย่างเช่นมีคำอธิบายที่ใช้งานง่ายอย่างน่าพิศวงในแง่ของพื้นที่ภายในของผลิตภัณฑ์ที่แสดงในคำถามตอบคำถามเชิงซ้อนสำหรับคำถามเชิงซ้อนของ Christensen แต่ทุกคนไม่ได้ชื่นชมวิธีการดังกล่าว อีกตัวอย่างหนึ่งมีคำอธิบายทางเรขาคณิตในคำตอบของฉันที่stats.stackexchange.com/a/62147/919แต่ไม่ใช่ทุกคนที่มองว่าความสัมพันธ์เชิงเรขาคณิตเป็น "สัญชาตญาณ"
whuber

อย่างสังหรณ์ใจเป็นเช่นไร $ (X ^ TX) ^ {- 1} หมายถึงอะไร มันคือการคำนวณระยะทางหรือสิ่งที่ฉันไม่เข้าใจ
Darshak

1
นั่นคือคำอธิบายทั้งหมดในคำตอบที่ฉันเชื่อมโยง
whuber

คำถามนี้มีอยู่แล้วที่นี่แม้ว่าอาจจะไม่ใช่คำตอบที่น่าพอใจmath.stackexchange.com/questions/2624986/ …
Sextus Empiricus

คำตอบ:


5

ฉันพบว่าข้อความเหล่านี้มีประโยชน์เป็นพิเศษ:

จะหาค่าตัวประมาณกำลังสองน้อยที่สุดสำหรับการถดถอยเชิงเส้นหลายเส้นได้อย่างไร

ความสัมพันธ์ระหว่าง SVD และ PCA วิธีการใช้ SVD เพื่อทำ PCA

http://www.math.miami.edu/~armstrong/210sp13/HW7notes.pdf

ถ้าเป็นเมทริกซ์แล้วเมทริกซ์กำหนดฉายลงบนพื้นที่คอลัมน์ของXสังหรณ์ใจคุณมีระบบ overdetermined ของสมการ แต่ยังคงต้องการที่จะใช้ในการกำหนดเส้นแผนที่ที่จะ map แถวของเพื่อสิ่งที่ใกล้เคียงกับมูลค่า ,\} ดังนั้นเราจึงตัดสินใจส่งไปยังสิ่งที่ใกล้เคียงที่สุดไปยังซึ่งสามารถแสดงเป็นการรวมเชิงเส้นของคุณสมบัติของคุณ (คอลัมน์ของ ) n × p X ( X T X ) - 1 X T X R pR x ฉัน X y ฉันฉัน{ 1 , , n } X y XXn×pX(XTX)1XTXRpRxiXyii{1,,n}XyX

เท่าที่การตีความของฉันยังไม่มีคำตอบที่น่าอัศจรรย์ ฉันรู้ว่าคุณสามารถนึกถึงว่าเป็นเมทริกซ์ความแปรปรวนร่วมของชุดข้อมูล ( X T X )(XTX)1(XTX)


(XTX)บางครั้งเรียกว่า "เมทริกซ์กระจาย" และเป็นเพียงเมทริกซ์ความแปรปรวนร่วมที่ปรับขนาดขึ้น
JacKeown

4

มุมมองทางเรขาคณิต

มุมมองที่รูปทรงเรขาคณิตอาจจะเป็นเหมือนเวกเตอร์ n มิติและจุดอยู่ใน n มิติพื้นที่Vที่ไหนยังอยู่ในสเปซทอดเวกเตอร์x_mX β V X β W x 1 , x 2 , , x เมตรyXβVXβ^Wx1,x2,,xm

ติ่ง

พิกัดสองประเภท

สำหรับพื้นที่ย่อยเราสามารถนึกภาพพิกัดสองแบบที่แตกต่างกัน :W

  • βเป็นเช่นพิกัดสำหรับพื้นที่ประสานงานปกติ เวกเตอร์ในพื้นที่เป็นชุดเชิงเส้นของเวกเตอร์W x ฉัน Z = β 1 x 1 + β 2 x 1 + . . . β m x mzWxi
    z=β1x1+β2x1+....βmxm
  • αไม่ได้พิกัดในความรู้สึกปกติ แต่พวกเขาจะกำหนดจุดในสเปซWแต่ละเกี่ยวข้องกับตั้งฉากประมาณการบนเวกเตอร์x_iถ้าเราใช้เวกเตอร์หน่วย (สำหรับความเรียบง่าย) แล้ว "พิกัด"สำหรับเวกเตอร์สามารถแสดงเป็น:α i x i x i α i zWαixixiαiz

    αi=xiTz

    และชุดของพิกัดทั้งหมดเป็น:

α=XTz

การจับคู่ระหว่างพิกัดและบีตาαβ

สำหรับนิพจน์ของ "พิกัด"กลายเป็นการแปลงจากพิกัดเป็น "พิกัด"z=Xβαβα

α=XTXβ

คุณสามารถเห็นเป็นการแสดงว่าแต่ละโครงการมีจำนวนเท่าใดต่ออีกหนึ่ง(XTX)ijxixj

จากนั้นการตีความทางเรขาคณิตของสามารถมองเห็นได้จากแผนที่จากเวกเตอร์ฉาย "พิกัด"กับพิกัดเชิงเส้น .(XTX)1αβ

β=(XTX)1α

นิพจน์ให้การฉาย "พิกัด" ของและเปลี่ยนเป็น .XTyy(XTX)1β


หมายเหตุ : การฉาย "พิกัด" ของจะเหมือนกับการฉาย "พิกัด" ของตั้งแต่X}y y^(yy^)X


บัญชีที่คล้ายกันมากของหัวข้อstats.stackexchange.com/a/124892/3277
ttnphns

คล้ายกันมากแน่นอน สำหรับฉันมุมมองนี้เป็นสิ่งใหม่มากและฉันต้องใช้เวลาหนึ่งคืนเพื่อคิดถึงมัน ฉันมักจะดูการถดถอยกำลังสองน้อยที่สุดในแง่ของการฉายภาพ แต่ในมุมมองนี้ฉันไม่เคยพยายามที่จะเข้าใจความหมายที่เข้าใจง่ายในส่วนหรือฉันมักจะเห็นมันในทางอ้อมมากกว่าX X T y = X T X β(XTX)1XTy=XTXβ
Sextus Empiricus

3

สมมติว่าคุณคุ้นเคยกับการถดถอยเชิงเส้นอย่างง่าย: และวิธีแก้ปัญหา : β = c o v [ x i , y i ]

yi=α+βxi+εi
β=cov[xi,yi]var[xi]

มันง่ายที่จะดูว่าตรงกับตัวเศษด้านบนและแผนที่กับตัวส่วน เนื่องจากเรากำลังจัดการกับเมทริกซ์ลำดับสำคัญ เป็น KxK matrix และเป็น Kx1 เวกเตอร์ ดังนั้นลำดับคือ:X X X X X y ( X X ) - 1 X yXyXXXXXy(XX)1Xy


แต่การเปรียบเทียบนั้นไม่ได้บอกคุณว่ามีการผกผันก่อนหรือหลัง
kjetil b halvorsen

@kjetilbhalvorsen ฉันใส่คำสั่งของการดำเนินงาน
Aksakal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.