เหตุใดจึงจำเป็นต้องสุ่มตัวอย่างจากการแจกแจงหลังถ้าเรารู้การกระจายตัวหลังแล้ว?


19

ความเข้าใจของฉันคือเมื่อใช้วิธีการแบบเบย์เพื่อประเมินค่าพารามิเตอร์:

  • การกระจายหลังคือการรวมกันของการกระจายก่อนหน้าและการกระจายโอกาส
  • เราจำลองสิ่งนี้โดยการสร้างตัวอย่างจากการแจกแจงด้านหลัง (เช่นการใช้อัลกอริทึม Metropolis-Hasting เพื่อสร้างค่าและยอมรับถ้าพวกเขาอยู่เหนือขีดจำกัดความน่าจะเป็นที่แน่นอนที่จะเป็นของการแจกแจงหลัง)
  • เมื่อเราสร้างตัวอย่างนี้เราจะใช้มันเพื่อประมาณการกระจายตัวของหลังและสิ่งต่าง ๆ เช่นค่าเฉลี่ย

แต่ฉันรู้สึกว่าฉันต้องเข้าใจผิดบางอย่าง ดูเหมือนว่าเรามีการแจกแจงด้านหลังแล้วสุ่มตัวอย่างจากนั้นใช้ตัวอย่างนั้นเป็นค่าประมาณของการแจกแจงหลัง แต่ถ้าเรามีการกระจายด้านหลังเพื่อเริ่มต้นด้วยเหตุใดเราจึงต้องสุ่มตัวอย่างจากมันถึงค่าประมาณ

คำตอบ:


20

คำถามนี้ได้รับการพิจารณาแล้วในฟอรัมนี้

เมื่อคุณระบุว่าคุณ "มีการกระจายด้านหลัง" คุณหมายถึงอะไร? "มี" ฟังก์ชั่นของที่ฉันรู้ว่าเป็นสัดส่วนกับหลังคือπ ( θ | x ) π ( θ ) × f ( x | θ )เช่นเป้าหมายเทียมทั้งหมดπ ( θ | x ) exp { - | | θ - x | | 2 - | | θ + xθ

π(θ|x)απ(θ)×(x|θ)
ไม่บอกฉันว่าเป็น
π(θ|x)αประสบการณ์{-||θ-x||2-||θ+x||4-||θ-2x||6},  x,θR18,
  1. ความคาดหวังหลังของฟังก์ชันเช่นE [ h ( θ ) | x ] , ค่าเฉลี่ยหลังที่ทำงานเป็นตัวประมาณค่าแบบเบส์ภายใต้การสูญเสียมาตรฐาน;θE[ชั่วโมง(θ)|x]
  2. การตัดสินใจที่ดีที่สุดภายใต้ฟังก์ชั่นยูทิลิตี้โดยพลการการตัดสินใจที่ช่วยลดการสูญเสียหลังที่คาดว่าจะ;
  3. ช่วงความไม่แน่นอน 90% หรือ 95% ของพารามิเตอร์ (s), sub-vector ของพารามิเตอร์ (s), หรือฟังก์ชั่นของพารามิเตอร์ (s), หรือที่รู้จักในภูมิภาค HPD
    {ชั่วโมง=ชั่วโมง(θ); πชั่วโมง(ชั่วโมง)ชั่วโมง_}
  4. โมเดลที่น่าจะเป็นไปได้มากที่สุดในการเลือกระหว่างการตั้งค่าส่วนประกอบบางส่วนของพารามิเตอร์เป็นค่าเฉพาะเมื่อเทียบกับการทำให้ไม่ทราบ (และสุ่ม)

นี่เป็นเพียงตัวอย่างของประเพณีการแจกแจงหลัง ๆ มากมาย ในทุกกรณี แต่วิธีที่ง่ายที่สุดฉันไม่สามารถให้คำตอบด้วยการจ้องมองที่ความหนาแน่นของการกระจายหลังและต้องดำเนินการผ่านวิธีแก้ปัญหาตัวเลขเช่น Monte Carlo และ Markov chain Monte Carlo วิธีการ


ขอบคุณมากสำหรับคำตอบที่ซีอาน ฉันแน่ใจว่านี่ตอบคำถามของฉัน แต่ฉันยังคงมีปัญหาเล็กน้อยที่จะเข้าใจ ฉันถูกต้องหรือไม่ที่เรามีฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่สอดคล้องกับด้านหลัง (เช่นโดยการรวมค่าก่อนหน้าและโอกาส)? ทำไมเราถึงไม่สามารถหา 95% CI ได้โดยตรงจากสิ่งนี้แทนที่จะมาจากการกระจายตัวอย่างหลัง?
เดฟ

2
@Dave ฉันคิดว่ากุญแจที่นี่คือสิ่งที่คุณหมายถึงโดย "มี" โดยทั่วไปคุณจะไม่มีโซลูชันแบบปิดดังนั้นคุณจะไม่ "มี" ฟังก์ชั่นในแง่ที่เป็นประโยชน์
พระภิกษุ

@monk ขอบคุณสำหรับการตอบกลับ! คุณสนใจที่จะอธิบายถึงสิ่งที่ทำให้โซลูชั่นแบบฟอร์มไม่ปิดใช่หรือไม่?
เดฟ

2
สมมติว่าก่อนหน้าของคุณคือเบต้า (a, b) และโอกาสของคุณคือทวินาม (n, p) คุณคำนวณค่าที่คาดหวังของลูกหลังของคุณได้อย่างไร ลองใช้ส่วนประกอบสำคัญของผลิตภัณฑ์นั้นด้วยปากกาและกระดาษ โดยทั่วไปอินทิกรัลดังกล่าวจะเป็นสิ่งที่ต้องใช้คอมพิวเตอร์ในการรับค่าที่แม่นยำสำหรับ อีกทางหนึ่งคุณสามารถค้นพบว่าเบต้าเป็นคอนจูเกตก่อน Binomial และดังนั้นหลังจะเป็นเบต้า (พร้อมพารามิเตอร์ที่คำนวณได้ง่าย) แต่บ่อยครั้งที่คุณจะไม่โชคดี การปักคำจำกัดความของ "รูปแบบปิด" เป็นเรื่องยากและควรค่าแก่การอ่านด้วยตัวเอง
พระภิกษุสงฆ์

4

ใช่คุณอาจมีการกระจายหลังวิเคราะห์ แต่แกนกลางของการวิเคราะห์แบบเบย์คือการทำให้การกระจายพารามิเตอร์ด้านหลังด้อยลงเพื่อให้คุณได้ผลลัพธ์การทำนายที่ดีขึ้นทั้งในแง่ของความแม่นยำและความสามารถในการวางนัยทั่วไป โดยทั่วไปคุณต้องการได้การแจกแจงการทำนายซึ่งมีแบบฟอร์มต่อไปนี้

พี(x|D)=พี(x|W)พี(W|D)dW

พี(W|D)พี(W|D)พี(x|W)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.