มีวิธีการแบบเบย์ในการประมาณความหนาแน่นหรือไม่


22

ผมสนใจที่จะประเมินความหนาแน่นต่อเนื่องสุ่มตัวแปรXวิธีหนึ่งในการทำสิ่งนี้ที่ฉันได้เรียนรู้คือการใช้การประมาณความหนาแน่นของเคอร์เนลX

แต่ตอนนี้ฉันสนใจวิธีการแบบเบย์ที่อยู่ในบรรทัดต่อไปนี้ ผมเริ่มเชื่อว่าต่อไปนี้การกระจายFฉันใช้เวลาอ่านXมีวิธีการอัพเดตตามการอ่านใหม่ของฉันหรือไม่?F n X FXFnXF

ฉันรู้ว่าฉันดูเหมือนว่าฉันจะขัดแย้งกับตัวเอง: ถ้าฉันเชื่อว่าในเป็นการกระจายก่อนหน้านี้ของฉันเท่านั้นไม่มีข้อมูลควรโน้มน้าวฉันเป็นอย่างอื่น แต่สมมติว่ามีและจุดข้อมูลของฉันเป็นเหมือน1.7) เมื่อดูที่เห็นได้ชัดว่าฉันไม่สามารถยึดติดกับรุ่นก่อนหน้าได้ แต่ฉันควรอัปเดตอย่างไรF u n i f [ 0 , 1 ] ( 0.3 , 0.5 , 0.9 , 1.7 ) 1.7FFUnif[0,1](0.3,0.5,0.9,1.7)1.7

อัปเดต:ตามคำแนะนำในความคิดเห็นที่ฉันได้เริ่มดูกระบวนการ Dirichlet ให้ฉันใช้สัญลักษณ์ต่อไปนี้:

GDP(α,H)θi|GGxi|θiN(θi,σ2)

หลังจากทำกรอบปัญหาดั้งเดิมของฉันในภาษานี้ฉันเดาว่าฉันสนใจต่อไปนี้:x_1,คนเราจะทำสิ่งนี้ได้อย่างไรθn+1|x1,...,xn

ในบันทึกย่อชุดนี้ (หน้า 2) ผู้เขียนทำตัวอย่างของ (โครงการ Polya Urn) ฉันไม่แน่ใจว่าสิ่งนี้เกี่ยวข้องหรือไม่θn+1|θ1,...,θn

อัปเดต 2:ฉันต้องการถามด้วย (หลังจากได้เห็นโน้ต): ผู้คนเลือกสำหรับ DP ได้อย่างไร ดูเหมือนเป็นตัวเลือกที่สุ่ม นอกจากนี้คนจะเลือกก่อนหน้าสำหรับ DP ได้อย่างไร ฉันควรจะใช้อันก่อนเพื่อเป็นแบบของฉันล่วงหน้าสำหรับหรือไม่H θ HαHθH


2
"ถ้าฉันเชื่อว่า F เป็นการกระจายก่อนหน้านี้ของฉันเท่านั้นไม่มีข้อมูลควรโน้มน้าวฉันเป็นอย่างอื่น" นี่คือสิ่งที่ตรงกันข้ามของการอนุมานแบบเบย์ซึ่งมีมากขึ้นตามแนวรับสิ่งที่คุณเชื่อในมือข้างหนึ่งและโลกในมืออื่น ๆ และข้าวต้มพวกเขาเข้าด้วยกันและดูสิ่งที่ออกมา ล้าง, ล้าง, ทำซ้ำ
Alexis

คุณรู้อะไรเกี่ยวกับกระบวนการดีริชเล็ตหรือไม่?
niandra82

ไม่สนใจย่อหน้าสุดท้ายของคุณ: มีสองตัวเลือกทั่วไปสำหรับปัญหานี้ หนึ่งคือการผสมผสานของกฎเกณฑ์ปกติ (คุณสามารถเลือกจำนวนบรรทัดฐานที่อิงตามความน่าจะเป็นในการตรวจสอบข้าม) หรือการผสมผสานของบรรทัดฐานที่ไม่มีที่สิ้นสุดในขณะที่ @ niandra82 แนะนำ สิ่งเหล่านี้สามารถทำได้ด้วยบางสิ่งเช่นการสุ่มตัวอย่างของกิ๊บส์หรือการอนุมานแบบแปรผัน .. คุณคุ้นเคยกับวิธีการเหล่านี้หรือไม่?

ฉันควรถามด้วยว่าคุณตั้งใจจะใช้ KDE นี้อย่างไร วิธีการที่เลือกและขนาด (ไม่ จำกัด จำกัด ) อาจขึ้นอยู่กับเป้าหมายของคุณ

ฟังดูเหมือนปัญหาเลือกรูปแบบหรือปัญหาทางปรัชญา ในความเป็นจริงการเลือกของเราที่โอกาสที่จะใช้ในการอนุมานแบบเบย์เรียกร้องความเชื่อก่อนหน้านี้เช่นกัน ...
Zoë Clark

คำตอบ:


2

เนื่องจากคุณต้องการแนวทางแบบเบย์คุณจำเป็นต้องมีความรู้ล่วงหน้าเกี่ยวกับสิ่งที่คุณต้องการประเมิน นี่จะอยู่ในรูปของการแจกแจง

ทีนี้มีปัญหาที่ตอนนี้เป็นการกระจายตัวของการแจกแจง อย่างไรก็ตามนี่จะไม่มีปัญหาหากคุณสันนิษฐานว่าการแจกแจงผู้สมัครมาจากคลาสการแจกแจงแบบมีพารามิเตอร์บางตัว

ตัวอย่างเช่นหากคุณต้องการสมมติว่าข้อมูลนั้นเป็นแบบเกาส์นแจกด้วยค่าเฉลี่ยที่ไม่ทราบ แต่ความแปรปรวนที่ทราบแล้วสิ่งที่คุณต้องมีก็คือค่าเฉลี่ยก่อนหน้า

การประมาณค่า MAP ของพารามิเตอร์ที่ไม่รู้จัก (เรียกมันว่าθ ) สามารถดำเนินการได้โดยสมมติว่าจุดสังเกต / จุดข้อมูลทั้งหมดนั้นไม่ขึ้นอยู่กับเงื่อนไขตามที่ได้รับจากพารามิเตอร์ที่ไม่รู้จัก จากนั้นประมาณการ MAP คือ

,θ^=argmaxθ(Pr[x1,x2,...,xn,θ])

ที่ไหน

]Pr[x1,x2,...,xn,θ]=Pr[x1,x2,...,xn|θ]Pr[θ]=Pr[θ]i=1nPr[xi|θ]

มันควรจะตั้งข้อสังเกตว่ามีการผสมโดยเฉพาะอย่างยิ่งของความน่าจะเป็นก่อนและการแจกแจงผู้สมัครPr [ x | θ ]ที่ก่อให้เกิดการอัปเดตที่ง่าย (ฟอร์มปิด) เมื่อได้รับจุดข้อมูลมากขึ้นPr[θ]Pr[x|θ]


1

เพื่อการประมาณความหนาแน่นสิ่งที่คุณต้องการไม่ใช่

nθn+1|x1,,xn

สูตรในบันทึกถึงการกระจายการทำนายของกระบวนการ Dirichletθn+1|θ1,,θn

สำหรับการประมาณความหนาแน่นคุณต้องสุ่มตัวอย่างจากการแจกแจงการทำนาย

π(dxn+1|x1,,xn)

การสุ่มตัวอย่างจากการแจกแจงข้างต้นสามารถทำได้ด้วยวิธีการแบบมีเงื่อนไขเช่นเดียวกับวิธีการส่วนเพิ่ม สำหรับวิธีการแบบมีเงื่อนไขให้ดูที่กระดาษของ Stephen Walker [1] สำหรับวิธีการส่วนเพิ่มคุณควรตรวจสอบที่ Radford Neal paper [2]

αααα

[1] SG, Walker (2006) สุ่มตัวอย่าง Dirichlet Mixture model ด้วยสไลซ์ การสื่อสารทางสถิติ (การจำลองและการคำนวณ)

[2] RM, Neal (2000) วิธีมาร์คอฟเชนมอนติคาร์โลสำหรับโมเดล Dirichlet Process Mixture วารสารการคำนวณและสถิติแบบกราฟิก เล่มที่ 9, หมายเลข 2, หน้า 249-265

[3] M. , ตะวันตก (1992) การประมาณค่าพารามิเตอร์ในแบบจำลองกระบวนการผสมไดริชเลต รายงานทางเทคนิค


-1

มีวิธีการอัพเดต F ตามการอ่านใหม่ของฉันหรือไม่?

มีบางอย่างที่แม่นยำสำหรับสิ่งนั้น มันเป็นแนวคิดหลักของการอนุมานแบบเบย์

p(θ|y)p(y|θ)p(θ)

p(θ)Fp(y|θ)θ

p(θ)


3
FX1,,XniidFFL(F)=i=1NdFdx|x=xiF
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.