ที่นี่ฉันอยู่ในน้ำแข็งบาง แต่ให้ฉันลอง: ฉันมีความรู้สึก (โปรดแสดงความคิดเห็น!) ว่าความแตกต่างที่สำคัญระหว่างสถิติและเศรษฐมิติก็คือในสถิติที่เรามักจะพิจารณา regressors เป็นคงที่ดังนั้นเมทริกซ์การออกแบบคำศัพท์ซึ่งมาจาก การออกแบบการทดลองโดยที่เราต้องเลือกก่อนอื่นจากนั้นจึงแก้ไขตัวแปรอธิบาย
แต่สำหรับชุดข้อมูลส่วนใหญ่สถานการณ์ส่วนใหญ่นี่เป็นแบบที่ไม่ดี เรากำลังสังเกตตัวแปรอธิบายและในแง่ที่ว่าพวกเขายืนอยู่ในตำแหน่งเดียวกับตัวแปรตอบสนองพวกเขาทั้งคู่ถูกกำหนดโดยกระบวนการสุ่มบางอย่างที่อยู่นอกการควบคุมของเรา ด้วยการพิจารณาว่าเป็น "แก้ไข" เราตัดสินใจที่จะไม่พิจารณาปัญหามากมายที่อาจทำให้เกิด x
ในทางกลับกันเมื่อพิจารณาจาก regressors ว่าเป็น Stochastic ในทางกลับกันเราเปิดโอกาสที่จะสร้างแบบจำลองซึ่งพยายามพิจารณาปัญหาดังกล่าว รายการสั้น ๆ ของปัญหาที่เราอาจพิจารณาและรวมเข้ากับแบบจำลองคือ:
- ข้อผิดพลาดการวัดใน regressors
- ความสัมพันธ์ระหว่าง regressors และข้อผิดพลาด
- lagged response เป็น regressor
- ...
อาจเป็นไปได้ว่าควรจะทำบ่อยครั้งกว่าที่เป็นอยู่ในปัจจุบัน?
EDIT
ฉันจะพยายามโต้เถียงสำหรับเงื่อนไขใน regressors ค่อนข้างเป็นทางการมากขึ้น Letเป็นเวกเตอร์สุ่มและที่น่าสนใจคือในการถดถอยบนที่ถดถอยจะนำไปหมายถึงความคาดหวังที่มีเงื่อนไขของบนXภายใต้สมมติฐานพหุคูณที่จะเป็นฟังก์ชันเชิงเส้น แต่ข้อโต้แย้งของเราไม่ได้ขึ้นอยู่กับว่า เราเริ่มต้นด้วยการแยกความหนาแน่นของข้อต่อตามปกติ
แต่ฟังก์ชั่นเหล่านั้นไม่เป็นที่รู้จักดังนั้นเราจึงใช้พารามิเตอร์แบบจำลอง
โดยที่ parameterizes การแจกแจงแบบมีเงื่อนไขและ( Y, X)YXYXฉ( y, x ) = f( y∣ x ) f(x )
ฉ( y, x ; θ , ψ ) =ฉθ( y∣ x )ฉψ( x )
θψการกระจายส่วนเพิ่มของXในโมเดลเชิงเส้นปกติเราสามารถมีแต่นั่นไม่ได้สันนิษฐาน พื้นที่พารามิเตอร์แบบเต็มของคือ , ผลิตภัณฑ์คาร์ทีเซียนและพารามิเตอร์ทั้งสองไม่มีส่วนร่วมXθ = ( β,σ2)( θ , ψ )Θ × Ψ
สิ่งนี้สามารถตีความได้ว่าเป็นการแยกตัวประกอบของการทดลองทางสถิติ (หรือกระบวนการสร้างข้อมูล DGP)แรกถูกสร้างขึ้นตามและเป็นขั้นตอนที่สองถูกสร้างขึ้นตามความหนาแน่นของเงื่อนไขx) โปรดทราบว่าขั้นตอนแรกไม่ได้ใช้ความรู้ใด ๆ เกี่ยวกับที่เข้ามาในขั้นตอนที่สองเท่านั้น สถิติคือเสริมสำหรับดูhttps://en.wikipedia.org/wiki/Ancillary_statisticXฉψ( x )Yฉθ(y| X= x )θXθ
แต่ทั้งนี้ขึ้นอยู่กับผลของการเป็นขั้นตอนแรกที่ขั้นตอนที่สองอาจจะมากหรือน้อยให้ข้อมูลเกี่ยวกับ\หากการจัดจำหน่ายที่ได้รับจากมีความแปรปรวนต่ำมากการพูดการสังเกต 's จะกระจุกตัวอยู่ในพื้นที่เล็ก ๆ ดังนั้นมันจะเป็นเรื่องยากมากขึ้นในการประเมิน\ดังนั้นส่วนแรกของการทดสอบสองขั้นตอนนี้จะกำหนดความแม่นยำซึ่งสามารถประมาณได้ ดังนั้นจึงเป็นเรื่องปกติที่จะมีเงื่อนไขบนอนุมานเกี่ยวกับพารามิเตอร์การถดถอย นั่นคือการโต้แย้งตามเงื่อนไขและโครงร่างด้านบนทำให้ข้อสมมติฐานชัดเจนθฉψ( x )xθθX= x
ในการออกแบบการทดลองสมมติฐานส่วนใหญ่จะมีขึ้นบ่อยครั้งที่ไม่มีข้อมูลเชิงสังเกต ตัวอย่างของปัญหาคือ: การถดถอยด้วยการตอบสนองล่าช้าในฐานะผู้ทำนาย การปรับเงื่อนไขของตัวทำนายในกรณีนี้จะเป็นเงื่อนไขในการตอบสนองด้วย! (ฉันจะเพิ่มตัวอย่างเพิ่มเติม)
หนังสือเล่มหนึ่งที่กล่าวถึงปัญหานี้ในรายละเอียดจำนวนมากคือข้อมูลและครอบครัวชี้แจง: ในทฤษฎีทางสถิติโดย O. E Barndorff-Nielsen ดูบทที่ 4 โดยเฉพาะผู้เขียนกล่าวว่าตรรกะการแยกในสถานการณ์นี้ไม่ค่อยมีการอธิบายแต่ให้การอ้างอิงต่อไปนี้: RA Fisher (1956) วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์ และ Sverdrup (1966) สถานะปัจจุบันของทฤษฎีการตัดสินใจและ ทฤษฎี§ 4.3