มีวิธีการเฉพาะกิจหนึ่งอย่างที่ฉันเคยใช้มาก่อน ฉันไม่แน่ใจว่าขั้นตอนนี้มีชื่อ แต่มันสมเหตุสมผลหรือไม่
สมมติว่าเป้าหมายของคุณคือให้พอดีกับโมเดล
Yi=β0+β1Xi+β2Zi+εi
โดยที่ตัวทำนายสองตัว - - มีความสัมพันธ์สูง ในขณะที่คุณได้ชี้ให้เห็นการใช้พวกเขาทั้งในรูปแบบเดียวกันสามารถทำสิ่งแปลกที่จะประมาณการค่าสัมประสิทธิ์และ -values อีกทางเลือกหนึ่งคือเพื่อให้พอดีกับรูปแบบ pXi,Zip
Zi=α0+α1Xi+ηi
แล้วที่เหลือจะ uncorrelated กับและสามารถในความรู้สึกบางอย่างที่จะคิดว่าเป็นส่วนหนึ่งของที่ไม่ได้วิทยสัมพันธ์เชิงเส้นกับx_iจากนั้นคุณสามารถดำเนินการให้พอดีกับโมเดลX ฉันZ ฉันX ฉันηiXiZiXi
Yi=θ0+θ1Xi+θ2ηi+νi
ซึ่งจะจับเอฟเฟกต์ทั้งหมดของโมเดลแรก (และแน่นอนจะมีเหมือนกันทุกประการกับโมเดลแรก) แต่ตัวทำนายไม่ได้ collinear อีกต่อไปR2
แก้ไข: OP ได้ขอคำอธิบายว่าทำไมส่วนที่เหลือไม่มีคำจำกัดความมีตัวอย่างสหสัมพันธ์ของศูนย์กับตัวทำนายเมื่อคุณละเว้นการดักเหมือนที่ทำเมื่อรวมการสกัดกั้น นี่นานเกินไปที่จะโพสต์ในความคิดเห็นดังนั้นฉันจึงทำการแก้ไขที่นี่ การได้มานี้ไม่ได้ให้ความกระจ่างเป็นพิเศษ (น่าเสียดายที่ฉันไม่สามารถหาข้อโต้แย้งที่สมเหตุสมผลได้) แต่มันแสดงให้เห็นว่า OP ต้องการอะไร :
เมื่อตัดถูกละไว้ในการถดถอยเชิงเส้นอย่างง่าย ,ดังนั้น2} ความสัมพันธ์ตัวอย่างระหว่างและนั้นเป็นสัดส่วนกับโดยที่แสดงถึงค่าเฉลี่ยตัวอย่างของปริมาณภายใต้แถบ ตอนนี้ฉันจะแสดงสิ่งนี้ไม่จำเป็นต้องเท่ากับศูนย์β^=∑xiyi∑x2iei=yi−xi∑xiyi∑x2ixiei
xe¯¯¯¯¯−x¯¯¯e¯¯¯
⋅¯
ก่อนอื่นเรามี
xe¯¯¯¯¯=1n(∑xiyi−x2i⋅∑xiyi∑x2i)=xy¯¯¯¯¯(1−∑x2i∑x2i)=0
แต่
x¯¯¯e¯¯¯=x¯¯¯(y¯¯¯−x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯)=x¯¯¯y¯¯¯−x¯¯¯2⋅xy¯¯¯¯¯x2¯¯¯¯¯
ดังนั้นเพื่อให้และที่จะมีความสัมพันธ์ที่ตัวอย่างของว่า 0 เราต้องจะเป็น0นั่นคือเราต้องการeixix¯¯¯e¯¯¯0
y¯¯¯=x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯
ซึ่งไม่ได้ถือโดยทั่วไปสำหรับสองชุดโดยพลการของข้อมูล yx,y