การประมาณค่าสัมประสิทธิ์การถดถอยไม่เกี่ยวข้องกันหรือไม่?


11

พิจารณาการถดถอยง่าย (ปกติไม่ได้สันนิษฐาน):ที่คือมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน\ประมาณการสแควร์น้อยที่สุดของและไม่เกี่ยวข้องกันหรือไม่?

Yi=a+bXi+ei,
ei0σab

2
คุณคิดอย่างไร? en.wikipedia.org/wiki/Ordinary_least_squaresส่วน "คุณสมบัติตัวอย่าง จำกัด " คำถามนี้ได้รับคำตอบหลายครั้งในเว็บไซต์นี้
mpiktas

คำตอบ:


15

นี่คือการพิจารณาที่สำคัญในการออกแบบการทดลองที่จะสามารถเป็นที่น่าพอใจจะไม่มี (หรือน้อยมาก) ความสัมพันธ์ระหว่างประมาณการและข ขาดดังกล่าวของความสัมพันธ์สามารถทำได้โดยการควบคุมค่าของx_ia^b^Xi


ในการวิเคราะห์ผลกระทบของในการประมาณค่า (ซึ่งเป็นเวกเตอร์แถวของความยาว ) จะถูกรวมเข้าในแนวตั้งเป็นเมทริกซ์ซึ่งเป็นเมทริกซ์การออกแบบซึ่งมีแถวมากเท่าที่มีข้อมูลและ ) สองคอลัมน์ สอดคล้องกันจะถูกรวมเป็นเวกเตอร์ยาวหนึ่งคอลัมน์ ( ) ในข้อตกลงเหล่านี้การเขียนสำหรับค่าสัมประสิทธิ์การประกอบโมเดลคือXi(1,Xi)2XYiyβ=(a,b)

E(Y)=Xβ

กำลัง (ปกติ) สันนิษฐานว่าจะเป็นตัวแปรสุ่มอิสระที่มีความแปรปรวนเป็นค่าคงที่สำหรับบางอย่างไม่ทราบ0 ขึ้นอยู่กับการสำรวจจะถูกนำไปเป็นหนึ่งในสำนึกของเวกเตอร์ตัวแปรสุ่มYYiσ2σ>0yY

โซลูชัน OLS คือ

β^=(XX)1Xy,

สมมติว่าเมทริกซ์ผกผันนี้มีอยู่ ดังนั้นการใช้คุณสมบัติพื้นฐานของการคูณเมทริกซ์และความแปรปรวนร่วม

Cov(β^)=Cov((XX)1XY)=((XX)1Xσ2X(XX)1)=σ2(XX)1.

เมทริกซ์มีเพียงสองแถวและคอลัมน์ที่สองที่สอดคล้องกับพารามิเตอร์แบบB) ความสัมพันธ์ของกับเป็นสัดส่วนกับองค์ประกอบปิดเส้นทแยงมุมของซึ่งตามกฎของ Cramerเป็นสัดส่วนกับผลิตภัณฑ์จุดของทั้งสองคอลัมน์ของXเนื่องจากหนึ่งในคอลัมน์คือทั้งหมดวินาทีซึ่งผลคูณดอทกับคอลัมน์อื่น ๆ (ประกอบด้วย ) คือผลรวมของพวกเขาเราจึงพบ(XX)1(a,b)a^b^(XX)1,X1Xi

a^และไม่เกี่ยวข้องถ้าเพียงผลรวม (หรือเท่ากับค่าเฉลี่ย) ของเป็นศูนย์b^Xi

สภาพตั้งฉากนี้มักจะทำได้โดยrecentering (โดยการลบของพวกเขาเฉลี่ยจากกัน) แม้ว่านี่จะไม่เปลี่ยนแปลงประมาณลาดก็ไม่เปลี่ยนประมาณตัดหมวก ไม่ว่าจะมีความสำคัญหรือไม่นั้นขึ้นอยู่กับแอพพลิเคชั่นXib^a^


การวิเคราะห์นี้นำไปใช้กับการถดถอยหลายครั้ง: เมทริกซ์การออกแบบจะมีคอลัมน์สำหรับตัวแปรอิสระ (คอลัมน์เพิ่มเติมประกอบด้วยวินาที) และจะเป็นเวกเตอร์ที่มีความยาวแต่ไม่เช่นนั้นทุกอย่างจะผ่านเหมือนเดิม p+1p1βp+1

ในภาษาทั่วไปสองคอลัมน์ของเรียกว่าorthogonalเมื่อผลคูณของจุดเป็นศูนย์ เมื่อคอลัมน์หนึ่งของ (พูดคอลัมน์ ) เป็น orthogonal สำหรับคอลัมน์อื่น ๆ ทั้งหมดมันเป็นความจริงเกี่ยวกับพีชคณิตที่แสดงให้เห็นได้อย่างง่ายดายว่ารายการนอกแนวทแยงมุมทั้งหมดในแถวและคอลัมน์ของเป็นศูนย์ (นั่นคือองค์ประกอบของและสำหรับทั้งหมดเป็นศูนย์) ดังนั้นXXiii(XX)1ijjiji

ค่าสัมประสิทธิ์การถดถอยสองค่าประมาณและไม่ได้รับการเมื่อใดก็ตาม (หรือทั้งสองอย่าง) ของคอลัมน์ที่สอดคล้องกันของเมทริกซ์การออกแบบนั้นมีมุมฉากกับคอลัมน์อื่นทั้งหมดβ^iβ^j

การออกแบบการทดลองมาตรฐานจำนวนมากประกอบด้วยการเลือกค่าของตัวแปรอิสระเพื่อสร้างคอลัมน์มุมฉากร่วมกัน สิ่งนี้ "แยก" การประมาณผลลัพธ์ที่เกิดจากการรับประกัน - ก่อนที่จะมีการรวบรวมข้อมูลใด ๆ ! - ว่าการประมาณการนั้นจะไม่เกี่ยวข้องกัน (เมื่อคำตอบมีการแจกแจงแบบปกติสิ่งนี้แสดงถึงการประมาณการจะเป็นอิสระซึ่งทำให้การตีความของพวกเขาง่ายขึ้นมาก)


คำตอบบอกว่า "[... ] องค์ประกอบนอกแนวทแยงมุมซึ่งเป็นเพียงผลิตภัณฑ์ดอทของสองคอลัมน์ของ X" นี้เป็นจริงสำหรับไม่อย่างไร? XX(XX)1
ไฮเซนเบิร์ก

@ ไฮเซนเบิร์กนั่นเป็นจุดที่ดี ฉันไม่แน่ใจเกี่ยวกับเรื่องนี้ ไม่มีความกำกวมในกรณีของสองคอลัมน์ แต่ฉันต้องคิดวิธีการปรับปรุงงานนำเสนอสำหรับกรณีของคอลัมน์เพิ่มเติม
whuber

@ ไฮเซนเบิร์กฉันรู้สึกซาบซึ้งที่คุณสังเกตการสังเกตการณ์: มันทำให้ฉันสามารถแก้ไขข้อผิดพลาดมากมายในการอภิปรายกรณีการถดถอยหลายครั้ง
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.