อะไรคือความแตกต่างระหว่างการปรับสภาพของ regressors กับการรักษามันให้คงที่?


9

บางครั้งเราคิดว่า regressors ได้รับการแก้ไขนั่นคือมันไม่ได้สุ่ม ฉันคิดว่านั่นหมายถึงตัวทำนายของเราการประมาณค่าพารามิเตอร์และอื่น ๆ ทั้งหมดนั้นไม่มีเงื่อนไขใช่ไหม? ฉันอาจไปได้ไกลขนาดนั้นว่าพวกเขาจะไม่เป็นตัวแปรสุ่มอีกต่อไป?

หากในอีกทางหนึ่งเรายอมรับว่าผู้ถดถอยส่วนใหญ่ในสาขาเศรษฐศาสตร์พูดว่าสุ่มเพราะไม่มีแรงภายนอกกำหนดพวกเขาด้วยการทดลองในใจ จากนั้นนักเศรษฐศาสตร์ก็ให้ความสำคัญกับการถดถอยแบบสุ่ม

สิ่งนี้แตกต่างจากการปฎิบัติตามที่ได้รับการแก้ไขอย่างไร

ฉันเข้าใจว่าการปรับสภาพคืออะไร ศาสตร์มันหมายความว่าเราให้ข้อสังเกตและเงื่อนไขในการอนุมานว่าชุดใดชุดหนึ่งของ regressors และมีความทะเยอทะยานที่จะบอกว่าการหาข้อสรุปที่ประมาณการพารามิเตอร์ประมาณการแปรปรวน ฯลฯ ไม่มีจะได้รับเหมือนกันได้เราเห็นแตกต่างกันของการก่อให้เกิด regressors ของเรา (เช่นมี crux ในอนุกรมเวลาซึ่งแต่ละชุดเวลาจะเห็นเพียงครั้งเดียว)

อย่างไรก็ตามเพื่อให้เข้าใจถึงความแตกต่างระหว่าง regressors คงที่และการปรับเงื่อนไขในการถดถอยแบบสุ่มฉันสงสัยว่าถ้าใครที่นี่รู้จักตัวอย่างของการประมาณค่าหรือขั้นตอนการอนุมานที่ถูกต้องสำหรับการพูดคง regressors แต่แตกสลายเมื่อพวกเขาสุ่ม เปิดรับ)

ฉันรอคอยที่จะเห็นตัวอย่างเหล่านั้น!


2
คุณคุ้นเคยกับโมเดลข้อผิดพลาดในตัวแปรหรือไม่?
robin.datadrivers

เฮ้ @ robin.datadrivers ไม่ฉันไม่จริง
Hirek

1
เหล่านี้เป็นรุ่นที่ได้รับการออกแบบมาโดยเฉพาะเพื่อปรับประมาณการความคลาดเคลื่อนในการวัดในตัวแปรอิสระ ไม่เหมือนกันกับการถดถอยแบบสุ่ม แต่อาจเป็นประโยชน์สำหรับคุณที่จะดู นอกจากนี้การวิจัยเชิงสำรวจโดยทั่วไปมักจะสมมติว่าตัวแปรอิสระที่รวบรวมโดยการสำรวจมีข้อผิดพลาดในการสุ่มตัวอย่าง
robin.datadrivers

1
อีกความคิดที่ฉันเจอคือใช้โมเดลเบย์ แบบจำลองเบย์สามารถรักษาแบบสุ่มได้โดยระบุการกระจายก่อนหน้านี้สำหรับพวกเขา โดยทั่วไปหากพวกเขาได้รับการปฏิบัติที่คงที่คุณระบุการกระจายก่อนหน้านี้เฉพาะสำหรับพารามิเตอร์ (ค่าสัมประสิทธิ์หมายถึงความแปรปรวน) แต่เมื่อคุณมีตัวแปรหรือผลลัพธ์ที่ขาดหายไปคุณจะต้องระบุการกระจายก่อนหน้าสำหรับพวกเขา ฉันไม่รู้แน่ชัดว่าจะใช้งานอย่างไรโดยไม่ต้องคิดอะไรมากมาย แต่อาจมีวิธีระบุการแจกแจงก่อนหน้าสำหรับตัวแปรอิสระแต่ละตัว
robin.datadrivers

คำตอบ:


3

ที่นี่ฉันอยู่ในน้ำแข็งบาง แต่ให้ฉันลอง: ฉันมีความรู้สึก (โปรดแสดงความคิดเห็น!) ว่าความแตกต่างที่สำคัญระหว่างสถิติและเศรษฐมิติก็คือในสถิติที่เรามักจะพิจารณา regressors เป็นคงที่ดังนั้นเมทริกซ์การออกแบบคำศัพท์ซึ่งมาจาก การออกแบบการทดลองโดยที่เราต้องเลือกก่อนอื่นจากนั้นจึงแก้ไขตัวแปรอธิบาย

แต่สำหรับชุดข้อมูลส่วนใหญ่สถานการณ์ส่วนใหญ่นี่เป็นแบบที่ไม่ดี เรากำลังสังเกตตัวแปรอธิบายและในแง่ที่ว่าพวกเขายืนอยู่ในตำแหน่งเดียวกับตัวแปรตอบสนองพวกเขาทั้งคู่ถูกกำหนดโดยกระบวนการสุ่มบางอย่างที่อยู่นอกการควบคุมของเรา ด้วยการพิจารณาว่าเป็น "แก้ไข" เราตัดสินใจที่จะไม่พิจารณาปัญหามากมายที่อาจทำให้เกิด x

ในทางกลับกันเมื่อพิจารณาจาก regressors ว่าเป็น Stochastic ในทางกลับกันเราเปิดโอกาสที่จะสร้างแบบจำลองซึ่งพยายามพิจารณาปัญหาดังกล่าว รายการสั้น ๆ ของปัญหาที่เราอาจพิจารณาและรวมเข้ากับแบบจำลองคือ:

  • ข้อผิดพลาดการวัดใน regressors
  • ความสัมพันธ์ระหว่าง regressors และข้อผิดพลาด
  • lagged response เป็น regressor
  • ...

อาจเป็นไปได้ว่าควรจะทำบ่อยครั้งกว่าที่เป็นอยู่ในปัจจุบัน?

EDIT 

ฉันจะพยายามโต้เถียงสำหรับเงื่อนไขใน regressors ค่อนข้างเป็นทางการมากขึ้น Letเป็นเวกเตอร์สุ่มและที่น่าสนใจคือในการถดถอยบนที่ถดถอยจะนำไปหมายถึงความคาดหวังที่มีเงื่อนไขของบนXภายใต้สมมติฐานพหุคูณที่จะเป็นฟังก์ชันเชิงเส้น แต่ข้อโต้แย้งของเราไม่ได้ขึ้นอยู่กับว่า เราเริ่มต้นด้วยการแยกความหนาแน่นของข้อต่อตามปกติ แต่ฟังก์ชั่นเหล่านั้นไม่เป็นที่รู้จักดังนั้นเราจึงใช้พารามิเตอร์แบบจำลอง โดยที่ parameterizes การแจกแจงแบบมีเงื่อนไขและ(Y,X)YXYX

f(y,x)=f(yx)f(x)
f(y,x;θ,ψ)=fθ(yx)fψ(x)
θψการกระจายส่วนเพิ่มของXในโมเดลเชิงเส้นปกติเราสามารถมีแต่นั่นไม่ได้สันนิษฐาน พื้นที่พารามิเตอร์แบบเต็มของคือ , ผลิตภัณฑ์คาร์ทีเซียนและพารามิเตอร์ทั้งสองไม่มีส่วนร่วมXθ=(β,σ2)(θ,ψ)Θ×Ψ

สิ่งนี้สามารถตีความได้ว่าเป็นการแยกตัวประกอบของการทดลองทางสถิติ (หรือกระบวนการสร้างข้อมูล DGP)แรกถูกสร้างขึ้นตามและเป็นขั้นตอนที่สองถูกสร้างขึ้นตามความหนาแน่นของเงื่อนไขx) โปรดทราบว่าขั้นตอนแรกไม่ได้ใช้ความรู้ใด ๆ เกี่ยวกับที่เข้ามาในขั้นตอนที่สองเท่านั้น สถิติคือเสริมสำหรับดูhttps://en.wikipedia.org/wiki/Ancillary_statisticXfψ(x)Yfθ(yX=x)θXθ

แต่ทั้งนี้ขึ้นอยู่กับผลของการเป็นขั้นตอนแรกที่ขั้นตอนที่สองอาจจะมากหรือน้อยให้ข้อมูลเกี่ยวกับ\หากการจัดจำหน่ายที่ได้รับจากมีความแปรปรวนต่ำมากการพูดการสังเกต 's จะกระจุกตัวอยู่ในพื้นที่เล็ก ๆ ดังนั้นมันจะเป็นเรื่องยากมากขึ้นในการประเมิน\ดังนั้นส่วนแรกของการทดสอบสองขั้นตอนนี้จะกำหนดความแม่นยำซึ่งสามารถประมาณได้ ดังนั้นจึงเป็นเรื่องปกติที่จะมีเงื่อนไขบนอนุมานเกี่ยวกับพารามิเตอร์การถดถอย นั่นคือการโต้แย้งตามเงื่อนไขและโครงร่างด้านบนทำให้ข้อสมมติฐานชัดเจนθfψ(x)xθθX=x

ในการออกแบบการทดลองสมมติฐานส่วนใหญ่จะมีขึ้นบ่อยครั้งที่ไม่มีข้อมูลเชิงสังเกต ตัวอย่างของปัญหาคือ: การถดถอยด้วยการตอบสนองล่าช้าในฐานะผู้ทำนาย การปรับเงื่อนไขของตัวทำนายในกรณีนี้จะเป็นเงื่อนไขในการตอบสนองด้วย! (ฉันจะเพิ่มตัวอย่างเพิ่มเติม)

หนังสือเล่มหนึ่งที่กล่าวถึงปัญหานี้ในรายละเอียดจำนวนมากคือข้อมูลและครอบครัวชี้แจง: ในทฤษฎีทางสถิติโดย O. E Barndorff-Nielsen ดูบทที่ 4 โดยเฉพาะผู้เขียนกล่าวว่าตรรกะการแยกในสถานการณ์นี้ไม่ค่อยมีการอธิบายแต่ให้การอ้างอิงต่อไปนี้: RA Fisher (1956) วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์ และ Sverdrup (1966) สถานะปัจจุบันของทฤษฎีการตัดสินใจและ ทฤษฎี§4.3

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.