หัวข้อ "ข้อผิดพลาดในตัวแปร" และเนื้อหาของคำถามดูเหมือนจะแตกต่างกันตามที่ถามเกี่ยวกับสาเหตุที่เราไม่คำนึงถึงความแปรปรวนในเมื่อสร้างแบบจำลองการตอบสนองตามเงื่อนไขนั่นคือการอนุมานสำหรับพารามิเตอร์การถดถอย ความลุ่มหลงสองอย่างนั้นดูเหมือนว่าเป็นมุมฉากสำหรับฉันดังนั้นที่นี่ฉันจึงตอบสนองต่อเนื้อหาX
ฉันได้ตอบคำถามที่คล้ายกันก่อนหน้านี้อะไรคือความแตกต่างระหว่างการเพิ่มประสิทธิภาพของ regressors กับการปฏิบัติตามที่กำหนด? ดังนั้นฉันจะคัดลอกคำตอบที่นี่:
ฉันจะพยายามโต้เถียงสำหรับเงื่อนไขใน regressors ค่อนข้างเป็นทางการมากขึ้น Letเป็นเวกเตอร์สุ่มและที่น่าสนใจคือในการถดถอยบนที่ถดถอยจะนำไปหมายถึงความคาดหวังที่มีเงื่อนไขของบนXภายใต้สมมติฐานพหุคูณที่จะเป็นฟังก์ชันเชิงเส้น แต่ข้อโต้แย้งของเราไม่ได้ขึ้นอยู่กับว่า เราเริ่มต้นด้วยการแยกความหนาแน่นของข้อต่อตามปกติ
แต่ฟังก์ชั่นเหล่านั้นไม่เป็นที่รู้จักดังนั้นเราจึงใช้พารามิเตอร์แบบจำลอง
โดยที่ parameterizes การแจกแจงแบบมีเงื่อนไขและ(Y,X)YXYXf(y,x)=f(y∣x)f(x)
f(y,x;θ,ψ)=fθ(y∣x)fψ(x)
θψการกระจายส่วนเพิ่มของXในโมเดลเชิงเส้นปกติเราสามารถมีแต่นั่นไม่ได้สันนิษฐาน พื้นที่พารามิเตอร์แบบเต็มของคือ , ผลิตภัณฑ์คาร์ทีเซียนและพารามิเตอร์ทั้งสองไม่มีส่วนร่วมXθ=(β,σ2)(θ,ψ)Θ×Ψ
สิ่งนี้สามารถตีความได้ว่าเป็นการแยกตัวประกอบของการทดลองทางสถิติ (หรือกระบวนการสร้างข้อมูล, DGP),แรกถูกสร้างขึ้นตามและเป็นขั้นตอนที่สองถูกสร้างขึ้นตามความหนาแน่นของเงื่อนไขx) โปรดทราบว่าขั้นตอนแรกไม่ได้ใช้ความรู้ใด ๆ เกี่ยวกับที่เข้ามาในขั้นตอนที่สองเท่านั้น สถิติคือเสริมสำหรับดูhttps://en.wikipedia.org/wiki/Ancillary_statisticXfψ(x)Yfθ(y∣X=x)θXθ
แต่ขึ้นอยู่กับผลลัพธ์ของขั้นตอนแรกขั้นตอนที่สองอาจให้ข้อมูลเกี่ยวกับมากหรือน้อยθfψ(x)xθθX=x
ในการออกแบบการทดลองสมมติฐานส่วนใหญ่จะมีขึ้นบ่อยครั้งที่ไม่มีข้อมูลเชิงสังเกต ตัวอย่างของปัญหาจะเป็น: การถดถอยที่มีการตอบสนองล่าช้าเป็นตัวทำนาย การปรับเงื่อนไขในตัวทำนายในกรณีนี้จะเป็นเงื่อนไขในการตอบสนองด้วย! (ฉันจะเพิ่มตัวอย่างเพิ่มเติม)
§4.3
θXθXθ
อาร์กิวเมนต์การแยกนี้มีประโยชน์เช่นกันเพราะมันชี้ไปที่กรณีที่ไม่สามารถใช้งานได้เช่นการถดถอยที่มีการตอบสนองล่าช้าเป็นตัวทำนาย