ฉันกำลังเรียนหลักสูตรรูปแบบการถดถอยและหนึ่งในคุณสมบัติที่มีให้สำหรับการถดถอยเชิงเส้นคือส่วนที่เหลือจะรวมเป็นศูนย์เสมอเมื่อมีการสกัดกั้น
ใครสามารถให้คำอธิบายที่ดีว่าทำไมถึงเป็นเช่นนี้
ฉันกำลังเรียนหลักสูตรรูปแบบการถดถอยและหนึ่งในคุณสมบัติที่มีให้สำหรับการถดถอยเชิงเส้นคือส่วนที่เหลือจะรวมเป็นศูนย์เสมอเมื่อมีการสกัดกั้น
ใครสามารถให้คำอธิบายที่ดีว่าทำไมถึงเป็นเช่นนี้
คำตอบ:
สิ่งนี้ติดตามโดยตรงจากสมการปกตินั่นคือสมการที่ตัวประมาณ OLS แก้
เวกเตอร์ที่อยู่ในวงเล็บคือเวกเตอร์ที่เหลือหรือการฉายไปยังส่วนประกอบมุมฉากของพื้นที่คอลัมน์ของหากคุณชอบพีชคณิตเชิงเส้น ทีนี้การรวมเวกเตอร์ของวัตถุในเมทริกซ์ซึ่งไม่จำเป็นต้องอยู่ในคอลัมน์แรกเหมือนทำตามอัตภาพนำไปสู่ X X
ในปัญหาสองตัวแปรนี้เห็นได้ง่ายกว่าเช่นการลดจำนวนรวมของส่วนที่เหลือกำลังสองให้เหลือน้อยที่สุด
เมื่อเราหาอนุพันธ์เทียบกับการสกัดกั้น จากนี้เราจะดำเนินการขอรับตัวประมาณที่คุ้นเคย
อีกครั้งที่เราเห็นว่าการสร้างตัวประมาณของเรากำหนดเงื่อนไขนี้
ในกรณีที่คุณกำลังมองหาคำอธิบายที่ค่อนข้างง่าย
ในบางแง่มุมตัวแบบการถดถอยเชิงเส้นคืออะไร แต่หมายถึงแฟนซี ในการหาค่าเฉลี่ยเลขคณิตในบางค่าเราจะพบค่าที่วัดจากศูนย์กลางในแง่ที่ว่าผลรวมของการเบี่ยงเบนทั้งหมด (โดยที่แต่ละส่วนเบี่ยงเบนถูกกำหนดเป็น ) ทางด้านขวาของค่าเฉลี่ยเท่ากับผลรวมของการเบี่ยงเบนทั้งหมดทางซ้ายของค่าเฉลี่ยนั้น ไม่มีเหตุผลโดยธรรมชาติที่ว่าทำไมการวัดนี้จึงเป็นวิธีที่ดีที่สุดในการอธิบายค่าเฉลี่ยของตัวอย่าง แต่เพียงผู้เดียว จุดสำคัญคือว่าโดยการกำหนดค่าเฉลี่ยเลขคณิตด้วยวิธีนี้เราจำเป็นต้องทำตามนั้นเมื่อเราสร้างค่าเฉลี่ยเลขคณิตการเบี่ยงเบนทั้งหมดจากค่าเฉลี่ยนั้นจะต้องเท่ากับศูนย์โดยการกำหนด!
ในการถดถอยเชิงเส้นนี่ไม่แตกต่างกัน เราพอดีกับเส้นดังกล่าวว่าผลรวมของความแตกต่างระหว่างค่านิยมของเราติดตั้ง (ซึ่งอยู่ในบรรทัดถดถอย) และค่าที่แท้จริงที่มีอยู่เหนือเส้นตรงเท่ากับผลรวมของความแตกต่างระหว่างเส้นถดถอยและค่าทั้งหมดด้านล่างไลน์. อีกครั้งไม่มีเหตุผลโดยธรรมชาติว่าทำไมนี่คือวิธีที่ดีที่สุดในการสร้างแบบเต็ม แต่มันตรงไปตรงมาและน่าสนใจอย่างสังหรณ์ใจ เช่นเดียวกับค่าเฉลี่ยเลขคณิต: โดยการสร้างค่าติดตั้งของเราในลักษณะนี้มันจำเป็นต้องตามด้วยการก่อสร้างว่าความเบี่ยงเบนทั้งหมดจากบรรทัดนั้นต้องรวมกันเป็นศูนย์มิฉะนั้นนี่จะไม่ใช่การถดถอยของ OLS
เมื่อมีการสกัดกั้นในการถดถอยเชิงเส้นหลายเส้น
ในการถดถอยกำลังสองน้อย ผลรวมของกำลังสองของข้อผิดพลาดจะลดลง
ใช้บางส่วน อนุพันธ์ของ SSE เทียบกับและตั้งค่าเป็นศูนย์
การสังเกตที่สำคัญคือเนื่องจากโมเดลมีจุดตัดซึ่งเป็นคอลัมน์แรกของเมทริกซ์การออกแบบสามารถเขียนเป็น
ที่คือเวกเตอร์คอลัมน์ที่มีศูนย์ทั้งหมด แต่เป็นองค์ประกอบแรก นอกจากนี้ยังทราบในสัญกรณ์เมทริกซ์ผลรวมของเหลือเป็นเพียง{y})
ดังนั้น
การสืบทอดอย่างง่ายโดยใช้พีชคณิตเมทริกซ์:
สามารถเขียนเป็น
แล้วก็
โดยที่คือเมทริกซ์มุมฉาก เนื่องจากมีความสมมาตรเราจึงสามารถจัดเรียงใหม่เพื่อให้
ซึ่งเท่ากับศูนย์ถ้าและเป็น orthogonal ซึ่งเป็นกรณีที่เมทริกซ์ของ regressorsมีจุดตัด (เวกเตอร์ของ , แน่นอน)
..