ทำไมการกระจายด้านหลังในการอนุมานแบบเบย์มักจะดื้อดึง?


15

ฉันมีปัญหาในการทำความเข้าใจว่าเหตุใดการอนุมานแบบเบย์นำไปสู่ปัญหาที่ยากลำบาก ปัญหามักได้รับการอธิบายเช่นนี้:

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งที่ฉันไม่เข้าใจคือสาเหตุที่อินทิกรัลนี้ต้องถูกประเมินในตอนแรกดูเหมือนว่าสำหรับฉันที่ผลลัพธ์ของอินทิกรัลนั้นเป็นแค่ค่าคงที่การทำให้เป็นมาตรฐาน (ตามที่ชุดข้อมูล D มอบให้) เหตุใดจึงไม่สามารถคำนวณการกระจายหลังเป็นตัวเศษทางด้านขวาแล้วอนุมานค่าคงที่การทำให้เป็นมาตรฐานนี้โดยกำหนดให้อินทิกรัลเหนือการแจกแจงหลังต้องเป็น 1?

ฉันกำลังคิดถึงอะไร

ขอบคุณ!


6
ผู้ที่อาจกังวล: คำถามนี้อยู่ในหัวข้ออย่างเต็มที่เนื่องจากเป็นเรื่องเกี่ยวกับสถิติ
Sycorax พูดว่า Reinstate Monica

3
ข้อความที่ตัดตอนมาเขียนไม่ดี โปรดทราบว่าคือไม่ได้การกระจายหลัง; มันเป็นความน่าจะเป็นที่ไม่มีเงื่อนไขของข้อมูล (เช่นโดยไม่คำนึงถึงที) เนื่องจากจะเหมือนกันสำหรับทุกรุ่นที่พิจารณาสำหรับชุดข้อมูลเดียวกันจึงไม่จำเป็นต้องคำนวณ หากคุณไม่ทำคุณต้องเปลี่ยนเครื่องหมายเท่ากับ 'สัดส่วน' ( ) P(D)P(D)α
gung - Reinstate Monica

คุณสามารถให้การอ้างอิงของสไลด์นั้นเมื่อฉันคิดว่ามันถูกเขียนโดยคนอื่นได้หรือไม่?
ซีอาน

3
ข้อกำหนดในการคำนวณจะเกิดขึ้นเฉพาะเมื่อเปรียบเทียบแบบจำลอง (บางครั้งเรียกว่าหลักฐาน ) เมื่อพิจารณาถึงรูปแบบเดียวตัวเศษ "พอเพียง" เพื่อกำหนดหลัง อย่างไรก็ตามหากคุณต้องการคำนวณตัวประมาณค่าเช่นความคาดหวังหลังหรือปริมาณคุณจะพบว่าคุณต้องการตัวหารอย่างรวดเร็ว พี(D)
ซีอาน

ขณะนี้เรากำลังประชุมเชิงปฏิบัติการเรื่องค่าคงที่normalizingซึ่งคุณอาจพบรายการที่น่าสนใจสำหรับตอบคำถามนี้
ซีอาน

คำตอบ:


7

เหตุใดจึงไม่สามารถคำนวณการกระจายหลังเป็นตัวเศษทางด้านขวาแล้วอนุมานค่าคงที่การทำให้เป็นมาตรฐานนี้โดยกำหนดให้อินทิกรัลเหนือการแจกแจงหลังต้องเป็น 1?

นี่คือสิ่งที่กำลังทำ การกระจายหลังคือ

P(θ|D)=พี(D|θ)P(θ)P(D).

เศษอยู่ทางด้านขวามือเป็นtheta) นี่คือฟังก์ชันเหนือและเพื่อเป็นการกระจายความน่าจะเป็นมันต้องรวมกับ 1 ดังนั้นเราต้องหาค่าคงที่เช่นนั้นP(D|θ)P(θ)θc

θcP(D|θ)P(θ)dθ=1θcP(D,θ)dθ=1cP(D)=1c=1P(D).

ดังนั้นค่าคงที่ normalizing คือซึ่งมักจะรักษาไม่ได้หรือซับซ้อนเกินไปP(D)


วิธีการที่จะคิดเกี่ยวกับมันก็คือ: ที่ดีที่สุดคือ? คุณต้องดูพวกเขาทั้งหมด! θ
information_interchange

0

ฉันมีคำถามเดียวกัน โพสต์ที่ยอดเยี่ยมนี้อธิบายได้ดีจริงๆ

โดยสังเขป. มันเป็นเรื่องยากเพราะตัวหารต้องประเมินความน่าจะเป็นสำหรับค่าที่เป็นไปได้ทั้งหมดของ 𝜃; ในกรณีที่น่าสนใจที่สุดทั้งหมดเป็นจำนวนมาก ในขณะที่ตัวเศษใช้สำหรับการรับรู้ single เพียงครั้งเดียว

ดูสมการ 4-8 ในการโพสต์ ภาพหน้าจอของลิงค์:

นี่คือภาพหน้าจอของลิงค์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.