เหตุใดเศษที่เหลือในการถดถอยเชิงเส้นจึงรวมเป็นศูนย์เสมอเมื่อมีการสกัดกั้น?


14

ฉันกำลังเรียนหลักสูตรรูปแบบการถดถอยและหนึ่งในคุณสมบัติที่มีให้สำหรับการถดถอยเชิงเส้นคือส่วนที่เหลือจะรวมเป็นศูนย์เสมอเมื่อมีการสกัดกั้น

ใครสามารถให้คำอธิบายที่ดีว่าทำไมถึงเป็นเช่นนี้


3
คุณอาจต้องการไตร่ตรองคำถามที่เกี่ยวข้องอย่างใกล้ชิด แต่ง่ายกว่าว่าทำไมในตัวอย่างที่ไม่มีการเปลี่ยนแปลงส่วนที่เหลือที่คุณได้รับโดยการลบค่าเฉลี่ยตัวอย่างจากแต่ละค่ายังรวมเป็น 0 (ลองทำตามพีชคณิตผ่านถ้าทำได้)
Glen_b - Reinstate Monica

3
ทันทีที่คุณรับรู้ว่า "ผลรวมเป็นศูนย์" หมายถึง "มุมฉากของตัวแปรอธิบายอย่างใดอย่างหนึ่ง" คำตอบจะชัดเจนทางเรขาคณิต
whuber

คำตอบ:


18

สิ่งนี้ติดตามโดยตรงจากสมการปกตินั่นคือสมการที่ตัวประมาณ OLS แก้

X(yXb)e=0

เวกเตอร์ที่อยู่ในวงเล็บคือเวกเตอร์ที่เหลือหรือการฉายไปยังส่วนประกอบมุมฉากของพื้นที่คอลัมน์ของหากคุณชอบพีชคณิตเชิงเส้น ทีนี้การรวมเวกเตอร์ของวัตถุในเมทริกซ์ซึ่งไม่จำเป็นต้องอยู่ในคอลัมน์แรกเหมือนทำตามอัตภาพนำไปสู่ X XyXX

1e=0i=1nei=0

ในปัญหาสองตัวแปรนี้เห็นได้ง่ายกว่าเช่นการลดจำนวนรวมของส่วนที่เหลือกำลังสองให้เหลือน้อยที่สุด

i=1n(yiabxi)=0

เมื่อเราหาอนุพันธ์เทียบกับการสกัดกั้น จากนี้เราจะดำเนินการขอรับตัวประมาณที่คุ้นเคย

a=y¯bx¯

อีกครั้งที่เราเห็นว่าการสร้างตัวประมาณของเรากำหนดเงื่อนไขนี้


17

ในกรณีที่คุณกำลังมองหาคำอธิบายที่ค่อนข้างง่าย

ในบางแง่มุมตัวแบบการถดถอยเชิงเส้นคืออะไร แต่หมายถึงแฟนซี ในการหาค่าเฉลี่ยเลขคณิตในบางค่าเราจะพบค่าที่วัดจากศูนย์กลางในแง่ที่ว่าผลรวมของการเบี่ยงเบนทั้งหมด (โดยที่แต่ละส่วนเบี่ยงเบนถูกกำหนดเป็น ) ทางด้านขวาของค่าเฉลี่ยเท่ากับผลรวมของการเบี่ยงเบนทั้งหมดทางซ้ายของค่าเฉลี่ยนั้น ไม่มีเหตุผลโดยธรรมชาติที่ว่าทำไมการวัดนี้จึงเป็นวิธีที่ดีที่สุดในการอธิบายค่าเฉลี่ยของตัวอย่าง แต่เพียงผู้เดียว จุดสำคัญคือว่าโดยการกำหนดค่าเฉลี่ยเลขคณิตด้วยวิธีนี้เราจำเป็นต้องทำตามนั้นเมื่อเราสร้างค่าเฉลี่ยเลขคณิตการเบี่ยงเบนทั้งหมดจากค่าเฉลี่ยนั้นจะต้องเท่ากับศูนย์โดยการกำหนด!x¯x1,x2,,xnui=xix¯

ในการถดถอยเชิงเส้นนี่ไม่แตกต่างกัน เราพอดีกับเส้นดังกล่าวว่าผลรวมของความแตกต่างระหว่างค่านิยมของเราติดตั้ง (ซึ่งอยู่ในบรรทัดถดถอย) และค่าที่แท้จริงที่มีอยู่เหนือเส้นตรงเท่ากับผลรวมของความแตกต่างระหว่างเส้นถดถอยและค่าทั้งหมดด้านล่างไลน์. อีกครั้งไม่มีเหตุผลโดยธรรมชาติว่าทำไมนี่คือวิธีที่ดีที่สุดในการสร้างแบบเต็ม แต่มันตรงไปตรงมาและน่าสนใจอย่างสังหรณ์ใจ เช่นเดียวกับค่าเฉลี่ยเลขคณิต: โดยการสร้างค่าติดตั้งของเราในลักษณะนี้มันจำเป็นต้องตามด้วยการก่อสร้างว่าความเบี่ยงเบนทั้งหมดจากบรรทัดนั้นต้องรวมกันเป็นศูนย์มิฉะนั้นนี่จะไม่ใช่การถดถอยของ OLS


2
+1 สำหรับคำตอบที่ตรงไปตรงมาเรียบง่ายและใช้งานง่าย!

คำอธิบายที่ยอดเยี่ยม แต่ฉันไม่แน่ใจ "อีกครั้งไม่มีเหตุผลโดยธรรมชาติทำไมนี่คือวิธีที่ดีที่สุดในการสร้างความฟิต แต่มันก็ตรงไปตรงมาและน่าสนใจ ถูกต้อง เป็นที่รู้จักกันดีโดยทฤษฎีบท Gauss-Markov ที่ตัวประมาณ OLS เป็นสีน้ำเงิน: ดีที่สุด (ความแปรปรวนต่ำสุด) การประมาณแบบไม่เอนเอียงแบบเส้นตรง บ่อยครั้งที่ "ความรู้สึก" ที่ใช้งานง่ายของเราเกี่ยวกับสิ่งที่น่าดึงดูด / สมเหตุสมผลนั้นได้รับการสำรองทางคณิตศาสตร์เช่นเดียวกับกรณีที่นี่
Meg

3

เมื่อมีการสกัดกั้นในการถดถอยเชิงเส้นหลายเส้น ในการถดถอยกำลังสองน้อย ผลรวมของกำลังสองของข้อผิดพลาดจะลดลง ใช้บางส่วน อนุพันธ์ของ SSE เทียบกับและตั้งค่าเป็นศูนย์

y^i=β0+β1xi,1+β2xi,2++βpxi,p
SSE=i=1n(ei)2=i=1n(yiyi^)2=i=1n(yiβ0β1xi,1β2xi,2βpxi,p)2
β0
SSEβ0=i=1n2(yiβ0β1xi,1β2xi,2βpxi,p)1(1)=2i=1nei=0
ดังนั้นส่วนที่เหลือจะรวมเป็นศูนย์เสมอเมื่อมีการสกัดกั้นในการถดถอยเชิงเส้น


1

การสังเกตที่สำคัญคือเนื่องจากโมเดลมีจุดตัดซึ่งเป็นคอลัมน์แรกของเมทริกซ์การออกแบบสามารถเขียนเป็น ที่คือเวกเตอร์คอลัมน์ที่มีศูนย์ทั้งหมด แต่เป็นองค์ประกอบแรก นอกจากนี้ยังทราบในสัญกรณ์เมทริกซ์ผลรวมของเหลือเป็นเพียง{y})1X

1=Xe,
e1T(yy^)

ดังนั้น

1T(yy^)=1T(IH)y=eTXT(IX(XTX)1XT)y=eT(XTXTX(XTX)1XT)y=eT(XTXT)y=0.


0

การสืบทอดอย่างง่ายโดยใช้พีชคณิตเมทริกซ์:

eสามารถเขียนเป็น1Te

แล้วก็

1Te=1T(Mxy)โดยที่คือเมทริกซ์มุมฉาก เนื่องจากมีความสมมาตรเราจึงสามารถจัดเรียงใหม่เพื่อให้ MxMx(Mx1)Ty

ซึ่งเท่ากับศูนย์ถ้าและเป็น orthogonal ซึ่งเป็นกรณีที่เมทริกซ์ของ regressorsมีจุดตัด (เวกเตอร์ของ , แน่นอน)Mx1x1


ฉันไม่คิดว่ามันถูกต้อง
Michael R. Chernick

หากคุณอธิบายว่าทำไมฉันยินดีที่จะเรียนรู้บางสิ่งบางอย่าง
Mino

0
  1. ei=yi[1,X][a,b]=yiXba=via
  2. ddaei2ei1=via=0ดังนั้นa^=1nvi
  3. ei=ivia=ivinnivi=0

..

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.