โอกาสใดดีกว่าหรือโอกาสเกิดขึ้นเล็กน้อยและดีที่สุด


13

ขณะดำเนินการถดถอยหากเราดำเนินการตามคำจำกัดความจาก: ความแตกต่างระหว่างความน่าจะเป็นบางส่วน, ความน่าจะเป็นของโปรไฟล์และความเป็นไปได้ที่จะเกิดอะไรขึ้น

นั่นคือการ
ค้นหาความน่าจะเป็นสูงสุด βและθที่เพิ่ม L (β, θ | data) ให้สูงสุด

ในขณะที่ความ
เป็นไปได้ที่จะเกิดขึ้นเราได้รวมθจากสมการความน่าจะเป็นโดยการใช้ประโยชน์จากความจริงที่ว่าเราสามารถระบุการกระจายความน่าจะเป็นของθเงื่อนไขบน on

วิธีใดที่ดีที่สุดในการเพิ่มประสิทธิภาพและเพราะเหตุใด

คำตอบ:


14

แต่ละเหล่านี้จะให้ผลลัพธ์ที่แตกต่างกับการตีความที่แตกต่างกัน ครั้งแรกที่พบคู่β ,ซึ่งเป็นไปได้มากที่สุดในขณะที่สองพบว่าซึ่งเป็น (เล็กน้อย) น่าจะเป็นมากที่สุด ลองนึกภาพว่าการกระจายของคุณมีลักษณะดังนี้:บีตาθβ

    β=1β=2
θ=10.0 0.2 
θ=20.1 0.2 
θ=30.3 0.2 

จากนั้นคำตอบที่เป็นไปได้สูงสุดคือ ( ) ในขณะที่คำตอบของความเป็นไปได้สูงสุดที่จะเกิดคือ (เนื่องจากการลดความกว้างของ , )θ = 3 β = 2 θ P ( β = 2 ) = 0.6β=1θ=3β=2θP(β=2)=0.6

ฉันมักจะบอกว่าโดยทั่วไปความเป็นไปได้ที่จะเกิดขึ้นมักจะเป็นสิ่งที่คุณต้องการ - ถ้าคุณไม่สนใจค่าของพารามิเตอร์คุณควรยุบมันลงไป แต่ในทางปฏิบัติวิธีการเหล่านี้อาจไม่ได้ผลลัพธ์ที่แตกต่างกันมาก - ถ้าเป็นเช่นนั้นมันอาจชี้ไปที่ความไม่แน่นอนพื้นฐานในการแก้ปัญหาของคุณเช่นโหมดหลายโหมดที่มีการรวม ,ที่แตกต่างกันทั้งหมดบีตาθθβθ


ฉันพบผลลัพธ์ที่แตกต่างกันสำหรับวิธีความน่าจะเป็นสูงสุด / ไม่แน่นอนและด้วยเหตุนี้คำถาม ฉันจะบอกว่าทั้งสองผลลัพธ์ในกรณีของฉันให้ตีความที่แตกต่างกัน แต่ผลลัพธ์ที่เป็นไปได้
Ankit Chiplunkar

5

ฉันกำลังต่อสู้กับคำถามนี้เองตอนนี้ นี่คือผลลัพธ์ที่อาจเป็นประโยชน์ พิจารณาโมเดลเชิงเส้น

y=Xβ+ϵ,ϵN(0,σ2)

ที่และβและσ 2พารามิเตอร์ที่น่าสนใจ โอกาสร่วมกันคือyRn,βRp,βσ2

L(β,σ2)=(2πσ2)n/2exp(||yXβ||22σ2)

การเพิ่มความน่าจะเป็นของการมีส่วนร่วมให้เกิดประโยชน์สูงสุด

β^=X+y

σ^2=1n||r||2

ที่เป็น pseudoinverse ของXและR = Y - X βเป็นเวกเตอร์ที่เหลือพอดี ทราบว่าในσ 2เรามี1 / nแทนองศาของเสรีภาพคุ้นเคยแก้ไขอัตราส่วน1 / ( n - P ) ทราบว่าตัวประมาณนี้มีอคติในกรณีตัวอย่าง จำกัดX+Xr=yXβ^σ^21/n1/(np)

βσ2βσ2

σ^2=maxσ2RpL(β,σ2)dβ

การใช้พีชคณิตเชิงเส้นเบื้องต้นและสูตรอินทิกรัลเกาส์คุณสามารถแสดงได้

σ^2=1np||r||2

สิ่งนี้มีการปรับแก้องศาอิสระซึ่งทำให้เป็นกลางและเป็นที่นิยมมากกว่าการประเมิน ML ร่วมกัน

จากผลลัพธ์นี้อาจถามว่ามีบางสิ่งที่เป็นประโยชน์โดยธรรมชาติเกี่ยวกับความน่าจะเป็นแบบบูรณาการ แต่ฉันไม่ทราบผลลัพธ์ทั่วไปใด ๆ ที่ตอบคำถามนั้น ฉันทามติดูเหมือนว่า ML ในตัวจะทำบัญชีได้ดีกว่าสำหรับความไม่แน่นอนในปัญหาการประมาณค่าส่วนใหญ่ โดยเฉพาะอย่างยิ่งหากคุณกำลังประเมินปริมาณที่ขึ้นอยู่กับการประมาณการพารามิเตอร์อื่น ๆ (แม้โดยปริยาย) การรวมพารามิเตอร์อื่น ๆ จะทำให้บัญชีมีความไม่แน่นอนได้ดีขึ้น


1
β

1
ββ

อันที่จริงตามโพสต์และความคิดเห็นในที่นี้ฉันคิดว่า ML แบบรวมไม่ใช่ส่วนเสริม ML เป็นคำศัพท์ที่เหมาะสมสำหรับสิ่งที่เราทำที่นี่ แก้ไขตามนั้น
พอล

1
+1 ฉันรู้ว่าฉันค่อนข้างช้าไปงานปาร์ตี้นี้ แต่ไม่ได้รวมเอฟเฟกต์คงที่ด้วยการใส่เครื่องแบบที่ไม่เหมาะสมก่อนหน้าพวกเขาในสิ่งที่ REML ทำดังนั้นคุณเพิ่งได้รับการประมาณการ REML และการแก้ไข df นี้คือ เหตุผลที่นี่ที่ REML ดีกว่าสำหรับตัวอย่างขนาดเล็ก
jld

@Chaconne ใช่โพสต์นี้ได้รับแรงบันดาลใจจากการพยายามที่จะเข้าใจ REML! ฉันมี (เกือบ) ไม่มีการศึกษาสถิติอย่างเป็นทางการดังนั้นการได้รับสิ่งนี้เป็นเรื่องใหม่สำหรับฉัน
พอล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.