ในมาตรฐานการถดถอยเชิงเส้นหลายความสามารถเพื่อให้พอดีกับสามัญอย่างน้อยสี่เหลี่ยม (OLS) ประมาณการในสองขั้นตอนมาจากทฤษฎีบท Frisch-Waugh-โลเวลล์ ทฤษฎีบทนี้แสดงให้เห็นว่าประมาณการของค่าสัมประสิทธิ์การทำนายโดยเฉพาะอย่างยิ่งในรูปแบบเชิงเส้นหลายเท่ากับประมาณการที่ได้จากการถอยเหลือการตอบสนอง (ที่เหลือจากการถดถอยของตัวแปรตอบสนองกับที่อื่น ๆ ที่อธิบายตัวแปร) กับเหลือทำนาย (ที่เหลือ จากการถดถอยของตัวแปรทำนายกับตัวแปรอธิบายอื่น ๆ ) เห็นได้ชัดว่าคุณกำลังมองหาการเปรียบเทียบกับทฤษฎีบทนี้ที่สามารถใช้ในรูปแบบการถดถอยโลจิสติก
สำหรับคำถามนี้จะเป็นประโยชน์ในการจำลักษณะที่แฝง - ตัวแปรของการถดถอยโลจิสติก :
Yผม= ฉัน (Y* * * *ผม> 0 )Y* * * *ผม=β0+βXxผม+βZZผม+εผมεผม~ IID โลจิสติก( 0 , 1 )
ในลักษณะของแบบจำลองนี้ตัวแปรการตอบสนองที่แฝงนั้นไม่สามารถสังเกตได้และเราสังเกตเห็นตัวบ่งชี้ซึ่งบอกเราว่าการตอบสนองที่แฝงนั้นเป็นค่าบวกหรือไม่ รูปแบบของแบบจำลองนี้มีลักษณะคล้ายกับการถดถอยเชิงเส้นหลายเส้นยกเว้นว่าเราใช้การแจกแจงข้อผิดพลาดที่แตกต่างกันเล็กน้อย (การกระจายโลจิสติกแทนการแจกแจงแบบปกติ) และที่สำคัญกว่านั้นเราสังเกตเฉพาะตัวบ่งชี้ที่แสดงว่า .Y* * * *ผมYผม
สิ่งนี้จะสร้างปัญหาสำหรับความพยายามในการสร้างแบบจำลองสองขั้นตอน ทฤษฎีบท Frisch-Waugh-Lovell นี้ขึ้นอยู่กับความสามารถในการได้รับสารตกค้างระดับกลางสำหรับการตอบสนองและการทำนายผลประโยชน์ซึ่งนำมาเปรียบเทียบกับตัวแปรอธิบายอื่น ๆ ในกรณีปัจจุบันเราสามารถได้รับส่วนที่เหลือจากตัวแปรตอบสนอง "หมวดหมู่" เท่านั้น การสร้างกระบวนการการปรับสองขั้นตอนสำหรับการถดถอยโลจิสติกจะทำให้คุณต้องใช้การตอบสนองที่เหลือจากตัวแปรตอบสนองที่จัดหมวดหมู่นี้โดยไม่ต้องเข้าถึงการตอบสนองแฝงที่แฝงอยู่ นี่ดูเหมือนว่าฉันจะเป็นอุปสรรค์สำคัญและแม้ว่ามันจะไม่สามารถพิสูจน์ได้ว่าเป็นไปไม่ได้ แต่ก็ไม่น่าเป็นไปได้ที่จะติดตั้งโมเดลในสองขั้นตอน
ด้านล่างฉันจะให้บัญชีของคุณเกี่ยวกับสิ่งที่จะต้องใช้ในการค้นหากระบวนการสองขั้นตอนเพื่อให้เหมาะสมกับการถดถอยโลจิสติก ฉันไม่แน่ใจว่ามีวิธีแก้ไขปัญหานี้หรือไม่หรือมีข้อพิสูจน์ว่าเป็นไปไม่ได้ แต่วัสดุที่นี่ควรช่วยให้คุณเข้าใจสิ่งที่ต้องการ
การถดถอยโลจิสติกสองขั้นตอนจะมีลักษณะอย่างไร สมมติว่าเราต้องการสร้างแบบสองขั้นตอนสำหรับตัวแบบการถดถอยโลจิสติกซึ่งพารามิเตอร์จะถูกประเมินผ่านการประมาณค่าความน่าจะเป็นสูงสุดในแต่ละขั้นตอน เราต้องการให้กระบวนการเกี่ยวข้องกับขั้นตอนกลางที่เหมาะกับสองโมเดลต่อไปนี้:
Yผม= ฉัน (Y∗ ∗ผม> 0 )Y∗ ∗ผม=α0+αXxผม+τผม Zผม=γ0+γXxผม+δผมτผม~ IID โลจิสติก( 0 , 1 ) ,δผม∼ IID กรัม.
เราประเมินว่าค่าสัมประสิทธิ์ของแบบจำลองเหล่านี้ (ผ่าน MLEs) และอัตราผลตอบแทนนี้ค่าติดตั้งกลาง\ จากนั้นในขั้นตอนที่สองเราพอดีกับรุ่น:α^0,α^X,γ^0,γ^X
Yผม= โลจิสติก(α^0+α^1xผม) +βZ(Zผม-γ^0-γ^Xxผม) +εผมεผม∼ IID f.
ตามที่ระบุไว้โพรซีเดอร์มีองค์ประกอบคงที่จำนวนมาก แต่ฟังก์ชันความหนาแน่นและในขั้นตอนเหล่านี้ไม่ได้ระบุไว้ (แม้ว่าพวกเขาควรจะเป็นศูนย์กระจายเฉลี่ยที่ไม่ได้ขึ้นอยู่กับข้อมูล) เพื่อให้ได้วิธีการปรับสองขั้นตอนภายใต้ข้อ จำกัด เหล่านี้เราจำเป็นต้องเลือกและเพื่อให้แน่ใจว่า MLE สำหรับในอัลกอริธึมแบบพอดีสองขั้นตอนนี้เหมือนกับ MLE ที่ได้จากแบบจำลองการถดถอยโลจิสติกแบบหนึ่งขั้นตอน ข้างบน.ก.ฉก.ฉβZ
หากต้องการดูว่าเป็นไปได้หรือไม่เราจะเขียนพารามิเตอร์ที่ประมาณไว้ทั้งหมดจากขั้นตอนแรก:
ℓy|x(α^0,α^X)ℓz|x(γ^0,γ^X)=maxα0,αX∑i=1nlnBern(yi|logistic(α0+αXxi)),=maxγ0,γX∑i=1nlng(zi−γ0−γXxi).
ปล่อยดังนั้นฟังก์ชัน log-likelihood สำหรับขั้นตอนที่สองคือ:ϵi=yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)
ℓy|z|x(βZ)=∑i=1nlnf(yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)).
เราต้องการให้ค่าสูงสุดของฟังก์ชั่นนี้คือ MLE ของรูปแบบการถดถอยโลจิสติกหลาย กล่าวอีกนัยหนึ่งเราต้องการ:
arg max βXℓy|z|x(βZ)=arg max βXmaxβ0,βZ∑i=1nlnBern(yi|logistic(β0+βXxi+βZzi)).
ฉันปล่อยให้คนอื่นตรวจสอบว่ามีวิธีแก้ไขปัญหานี้หรือไม่ไม่มีข้อพิสูจน์ ฉันสงสัยว่า "การจัดหมวดหมู่" ของตัวแปรตอบกลับแฝงในการถดถอยโลจิสติกจะทำให้ไม่สามารถหากระบวนการสองขั้นตอนได้