การกระจายตัวของค่าสัมประสิทธิ์การถดถอย


9

สมมติว่าเรามีโมเดลเชิงเส้น yi=β0+β1xi+ϵiที่ตรงตามสมมติฐานการถดถอยมาตรฐาน (Gauss-Markov) ทั้งหมด เราสนใจθ=1/β1.

คำถามที่ 1:ข้อสมมติฐานอะไรที่จำเป็นสำหรับการแจกแจงθ^ ที่จะกำหนดไว้อย่างดี? β10 จะมีความสำคัญ --- คนอื่น ๆ ?

คำถามที่ 2:เพิ่มการสันนิษฐานว่าข้อผิดพลาดเป็นไปตามการแจกแจงแบบปกติ เรารู้ว่าถ้าβ^1 คือ MLE และ g() เป็นฟังก์ชั่นโมโนโทน g(β^1) เป็น MLE สำหรับ g(β1). เป็นสิ่งที่จำเป็นต้องมีเพียงอย่างเดียวในพื้นที่ใกล้เคียงของβ1? ในคำอื่น ๆ คือθ^=1/β^MLE ทฤษฎีการทำแผนที่แบบต่อเนื่องอย่างน้อยบอกเราว่าพารามิเตอร์นี้สอดคล้องกัน

คำถามที่ 3: มีทั้งวิธี Delta และ bootstrap ทั้งสองวิธีที่เหมาะสมสำหรับการค้นหาการกระจายของθ^?

คำถามที่ 4:คำตอบเหล่านี้เปลี่ยนแปลงสำหรับพารามิเตอร์อย่างไรγ=β0/β1?

นอกเหนือ:เราอาจพิจารณาจัดเรียงปัญหาที่จะให้ใหม่

xi=β0β1+1β1yi+1β1ϵi=γ+θyi+1β1ϵi
เพื่อประมาณค่าพารามิเตอร์โดยตรง สิ่งนี้ดูเหมือนจะไม่ได้ผลสำหรับฉันเนื่องจากสมมติฐานของ Gauss-Markov ไม่สมเหตุสมผลอีกต่อไป เราไม่สามารถพูดคุยเกี่ยวกับE[ϵy], ตัวอย่างเช่น. การตีความนี้ถูกต้องหรือไม่

ทำสมมติฐาน "มาตรฐาน" รวมถึงความปกติของ ϵiหรือไม่?
whuber

จุดดี; ฉันเพิ่มข้อสันนิษฐานนั้นให้กับส่วนที่เกี่ยวกับ MLE ไม่ควรจำเป็นสำหรับคนอื่น ๆ
Charlie

1
การกระจายตัวตัวอย่างของ β1 เป็นเรื่องปกติ θเป็นส่วนกลับของค่าปกติ นี่คือbimodal ที่มีค่าเฉลี่ยแตกต่างกัน (ไม่ จำกัด ) ไม่ว่าค่าเฉลี่ยของอะไรβ1อาจจะเป็นและแบนไม่สิ้นสุดที่ 0 วิธีเดลต้าจะน่ากลัวการประมาณค่า MLE แบบ asymptotic โดยทั่วไปจะไม่ดีและแม้แต่บูตสแตรปอาจต้องสงสัย
whuber

@whuber คุณสามารถขยายได้หรือไม่ ปรีชาญาณของฉันไม่เห็นว่าการตอบแทนตามปกติควรเป็นอย่างไร ฉันเดาว่าคงเป็นที่ว่ามวลทั้งหมดจะอยู่ที่ส่วนกลับของค่าเฉลี่ยปกติ (ตรงนี้1/β^1) ฉันกังวลเกี่ยวกับความเป็นไปได้ของค่าเฉลี่ยอนันต์เนื่องจากมวลที่อยู่ใกล้ 0 ผลลัพธ์ของ bootstrap และ asymptotic ต้องมีอยู่ในช่วงเวลาที่ถูกประเมินดังนั้นท้ายที่สุดสิ่งที่คำถามนี้ขึ้น
Charlie

1
PDF ของค่าปกติซึ่งกันและกันคือ exp((1/xμ)2/(2σ2))/(2πx2σ)dx. ที่ 0 อนุพันธ์ทั้งหมดเท่ากับ 0; การหาจุดวิกฤติของลอการิทึมระบุโหมดบวกและลบ (คำนวณได้ง่ายในแง่ของσ และ μ/σ); อินทิกรัลของ|x| diverges เหมือนอินทิกรัลของ |x|/x2=1/|x|. ปัญหาของช่วงเวลาแรกที่ไม่มีที่สิ้นสุดจะแนบไปกับส่วนกลับของตัวแปรสุ่มใด ๆ ที่มีความหนาแน่นของความน่าจะเป็นบวกที่ 0 ซึ่งรวมถึงบรรทัดฐานทั้งหมด
whuber

คำตอบ:


3

ไตรมาสที่ 1 ถ้าβ^1 คือ MLE ของ β1จากนั้น θ^ คือ MLE ของ θ และ β10 เป็นเงื่อนไขที่เพียงพอสำหรับตัวประมาณนี้ที่จะถูกกำหนดอย่างดี

ไตรมาสที่ 2 θ^=1/β^ คือ MLE ของ θโดยคุณสมบัติ invariance ของ MLE นอกจากนี้คุณไม่จำเป็นต้องมีการพูดซ้ำซากของgหากคุณไม่จำเป็นต้องได้รับอินเวอร์ส มีความต้องการเท่านั้นgจะถูกกำหนดอย่างดีในแต่ละจุด คุณสามารถตรวจสอบได้ในทฤษฎีบท 7.2.1 หน้า 350ของ "ความน่าจะเป็นและการอนุมานเชิงสถิติ" โดย Nitis Mukhopadhyay

ไตรมาสที่ 3 ใช่คุณสามารถใช้ทั้งสองวิธีฉันจะตรวจสอบความน่าจะเป็นของโปรไฟล์ด้วยθ.

ไตรมาสที่ 4 ที่นี่คุณสามารถแก้ไขพารามิเตอร์ของโมเดลในแง่ของพารามิเตอร์ที่น่าสนใจ(θ,γ). ตัวอย่างเช่น MLE ของγ คือ γ^=β^0/β^1 และคุณสามารถคำนวณความน่าจะเป็นของโปรไฟล์ของพารามิเตอร์นี้หรือการกระจาย bootstrap ได้ตามปกติ

วิธีการที่คุณกล่าวถึงในตอนท้ายนั้นไม่ถูกต้องคุณกำลังพิจารณา "แบบจำลองการสอบเทียบ" ซึ่งคุณสามารถตรวจสอบได้ในเอกสารประกอบ สิ่งเดียวที่คุณต้องการคือการแก้ไขพารามิเตอร์ในแง่ของพารามิเตอร์ที่น่าสนใจ

ฉันหวังว่านี่จะช่วยได้.

ขอแสดงความนับถือ.


3
ขอบคุณสำหรับคำตอบ ฉันไม่มีหนังสือที่คุณอ้างถึง แต่บ่อยครั้งที่คุณสมบัติเหล่านี้ต้องการการมีอยู่ของช่วงเวลาที่ประมาณไว้ ฉันไม่แน่ใจว่าการกลับเป็นปกติมีช่วงเวลาที่จำเป็น ฉันควรทำให้ประเด็นนี้ชัดเจนยิ่งขึ้นในคำถามของฉัน
Charlie
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.