ทำความเข้าใจเกี่ยวกับการทำนายแบบเบย์


9

ฉันกำลังเรียนหลักสูตร Intro to Bayes และฉันมีความยากลำบากในการเข้าใจการกระจายการทำนาย ฉันเข้าใจว่าทำไมพวกเขาถึงมีประโยชน์และฉันคุ้นเคยกับคำจำกัดความ แต่มีบางสิ่งที่ฉันไม่ค่อยเข้าใจ

1) วิธีรับการแจกแจงการทำนายที่ถูกต้องสำหรับเวกเตอร์ของการสังเกตใหม่

สมมติว่าเราได้สร้างแบบจำลองตัวอย่าง p(yi|θ) สำหรับข้อมูลและก่อน p(θ). สมมติว่าข้อสังเกตyi มีความเป็นอิสระตามเงื่อนไข θ.

เราสังเกตข้อมูลบางอย่างแล้ว D={y1,y2,...,yk}และเราอัปเดตก่อนหน้าของเรา p(θ) เพื่อหลัง p(θ|D).

หากเราต้องการทำนายเวกเตอร์ของการสังเกตใหม่ N={y~1,y~2,...,y~n}ฉันคิดว่าเราควรพยายามทำนายการใช้สูตรนี้

p(N|D)=p(θ|D)p(N|θ)dθ=p(θ|D)i=1np(y~i|θ)dθ,
ซึ่งไม่เท่ากับ
i=1np(θ|D)p(y~i|θ)dθ,
ดังนั้นการสังเกตการณ์ที่คาดการณ์ไว้จะไม่เป็นอิสระใช่มั้ย

บอกว่า θ|D เบต้า (a,b) และ p(yi|θ) ทวินาม (n,θ) สำหรับการแก้ไข n. ในกรณีนี้ถ้าฉันต้องการจำลองใหม่ 6y~ถ้าฉันเข้าใจสิ่งนี้ถูกต้องมันคงผิดที่จะจำลอง 6 การจับฉลากเป็นอิสระจากการแจกแจงแบบเบต้า - ทวินาม ถูกต้องหรือไม่ ฉันไม่รู้ว่าจะตีความได้อย่างไรว่าข้อสังเกตนั้นไม่ได้เกิดขึ้นอย่างอิสระและฉันไม่แน่ใจว่าฉันเข้าใจสิ่งนี้อย่างถูกต้อง

จำลองจากคำทำนายหลัง

หลายครั้งเมื่อเราจำลองข้อมูลจากตัวทำนายหลังเราทำตามรูปแบบนี้:

สำหรับ b จาก 1 ถึง B:

1) ตัวอย่าง θ(b) จาก p(θ|D).

2) จากนั้นจำลองข้อมูลใหม่ N(b) จาก p(N|θ(b)).

ฉันไม่ค่อยรู้วิธีพิสูจน์โครงร่างนี้ทำงานแม้ว่าจะดูเป็นธรรมชาติ นอกจากนี้ยังมีชื่อหรือไม่ ฉันพยายามค้นหาข้ออ้างและลองใช้ชื่ออื่น แต่ฉันไม่มีโชค

ขอบคุณ!


ฉันถามคำถามที่คล้ายกันที่stats.stackexchange.com/questions/72570/แต่ดูเหมือนว่าคุณจะได้รับคะแนนโหวตเพิ่มขึ้นจนถึงตอนนี้
จอห์น

คำตอบ:


4

สมมติว่า X1,,Xn,Xn+1 เป็นอิสระตามเงื่อนไขที่ระบุว่า Θ=θ. จากนั้น

fXn+1X1,,Xn(xn+1x1,,xn)=fXn+1,ΘX1,,Xn(xn+1,θx1,,xn)dθ
=fXn+1Θ,X1,,Xn(xn+1θ,x1,,xn)fΘX1,,Xn(θx1,,xn)dθ
=fXn+1Θ(xn+1θ)fΘX1,,Xn(θx1,,xn)dθ,
ซึ่งความเท่าเทียมกันครั้งแรกตามมาจากกฎความน่าจะเป็นทั้งหมดข้อที่สองตามจากกฎผลิตภัณฑ์และส่วนที่สามจากความเป็นอิสระตามเงื่อนไขที่สันนิษฐาน: กำหนดมูลค่าของ Θเราไม่ต้องการค่าของ X1,,Xn เพื่อตรวจสอบการกระจายของ Xn+1.

รูปแบบการจำลองนั้นถูกต้อง: สำหรับ i=1,,Nวาด θ(i) จากการกระจายของ ΘX1=x1,,Xn=xnแล้ววาด xn+1(i) จากการกระจายของ Xn+1Θ=θ(i). นี่เป็นตัวอย่างให้คุณ{xn+1(i)}i=1N จากการกระจายของ Xn+1X1=x1,,Xn=xn.


จะเป็นอย่างไรถ้าคุณได้รับการคาดการณ์ด้านหลังหลายช่วงเวลา? ฉันได้ใช้θ(i) แต่ละ xn+jแต่ฉันเห็นได้ว่าทำไมการวาดทีต้าใหม่
John

2

ฉันจะพยายามไปตามสัญชาตญาณที่อยู่เบื้องหลังการสร้างการกระจายการทำนายหลังทีละขั้นตอน

ปล่อย y เป็นเวกเตอร์ของข้อมูลที่สังเกตได้ซึ่งมาจากการแจกแจงความน่าจะเป็น p(y|θ) และปล่อยให้ y~เป็นเวกเตอร์ของค่านิยมในอนาคต (หรือตัวอย่างหมด) ที่เราต้องการทำนาย เราคิดว่าy~ มาจากการกระจายตัวเช่นเดียวกับ y. อาจเป็นการดึงดูดให้ใช้การประมาณการที่ดีที่สุดของเราθ--- เช่นการประเมิน MLE หรือ MAP --- เพื่อรับข้อมูลเกี่ยวกับการแจกจ่ายนี้ อย่างไรก็ตามการทำเช่นนั้นย่อมเพิกเฉยต่อความไม่แน่นอนของเราเกี่ยวกับθ. ดังนั้นวิธีการที่เหมาะสมในการดำเนินการคือการเฉลี่ยมากกว่าการกระจายหลังθคือ p(θ|y). แจ้งให้ทราบด้วยว่าy~ เป็นอิสระจาก y รับ θเนื่องจากถือว่าเป็นตัวอย่างอิสระที่ดึงมาจากการแจกแจงแบบเดียวกันกับ y. ดังนั้น,

p(y~|θ,y)=p(y~,y|θ)p(θ)p(θ,y)=p(y~|θ)p(y|θ)p(θ)p(y|θ)p(θ)=p(y~|θ).

การกระจายการทำนายหลังของ y~ ดังนั้น

p(y~|y)=Θp(y~|θ,y)p(θ|y)dθ=Θp(y~|θ)p(θ|y)dθ

ที่ไหน Θ คือการสนับสนุนจาก θ.

ตอนนี้เราจะได้ตัวอย่างจาก p(y~|y)? บางครั้งวิธีที่คุณอธิบายบางครั้งเรียกว่าวิธีการจัดองค์ประกอบซึ่งทำงานดังนี้:


สำหรับ s = 1,2, ... , S ทำ

วาด θ(s) จาก p(θ|y)

วาด y~(s) จาก p(y~|θ(s))


ในสถานการณ์ส่วนใหญ่เราได้รับความสนใจ p(θ|y)เพื่อให้มีเพียงขั้นตอนที่สองเท่านั้น

เหตุผลที่ทำให้งานนี้ค่อนข้างง่าย: โปรดทราบก่อนว่า p(y~,θ|y)=p(y~|θ,y)p(θ|y). ดังนั้นการสุ่มตัวอย่างพารามิเตอร์เวกเตอร์θ(s) จาก p(θ|y) และจากนั้นใช้เวกเตอร์นี้เพื่อสุ่มตัวอย่าง y~(s) จาก p(y~|θ(s))=p(y~|θ(s),y) ผลผลิตตัวอย่างจากการกระจายข้อต่อ p(y~,θ|y). มันตามมาว่าค่าตัวอย่างy~(s),s=1,2,...,S เป็นตัวอย่างจากการกระจายส่วนต่าง p(y~|y).


1

เพื่อตอบคำถามแรกของคุณ: ใช่การสังเกตนั้นไม่เป็นอิสระหากคุณไม่ทราบคุณค่าของ θ. บอกเด็ก ๆ ว่าคุณสังเกตเห็นว่าy~1มีค่าค่อนข้างสูง มันอาจเป็นข้อบ่งชี้ว่าค่าที่ไม่รู้จักของθ ตัวเองนั้นสุดขีดและดังนั้นคุณควรคาดหวังว่าการสังเกตอื่น ๆ จะสุดขั้วเช่นกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.