ทำไมดิริเคิลถึงกระจายก่อนหน้านี้สำหรับการกระจายแบบหลายส่วน


36

ในอัลกอริทึมแบบจำลองหัวข้อ LDA ฉันเห็นสมมติฐานนี้ แต่ฉันไม่รู้ว่าทำไมจึงเลือกการกระจาย Dirichlet ฉันไม่รู้ว่าเราสามารถใช้การกระจายแบบเครื่องแบบผ่าน Multinomial เป็นคู่ได้หรือไม่?


5
การแจกแจงแบบสม่ำเสมอเป็นกรณีพิเศษของการแจกแจงไดริชเล็ต
Stumpy Joe Pete

คำตอบ:


60

การแจกแจงไดริชเลตเป็นคอนจูเกตก่อนหน้านี้สำหรับการแจกแจงพหุนาม นี่หมายความว่าหากการแจกแจงก่อนหน้าของพารามิเตอร์หลายค่าคือ Dirichlet การกระจายหลังนั้นก็เป็นการกระจายแบบ Dirichlet (ด้วยพารามิเตอร์ที่แตกต่างจากพารามิเตอร์ก่อนหน้า) ประโยชน์ของสิ่งนี้คือ (a) การกระจายด้านหลังนั้นง่ายต่อการคำนวณและ (b) ในบางแง่มุมเป็นไปได้ที่จะคำนวณปริมาณความเชื่อของเราที่มีการเปลี่ยนแปลงหลังจากรวบรวมข้อมูล

สามารถกล่าวได้อย่างแน่นอนว่าสิ่งเหล่านี้เป็นเหตุผลที่ดีในการเลือกมาก่อนหรือไม่เนื่องจากเกณฑ์เหล่านี้ไม่เกี่ยวข้องกับความเชื่อที่เกิดขึ้นจริงก่อนหน้านี้ ... .

สำหรับกรณีพิเศษของการแจกแจงพหุนามให้เป็นเวกเตอร์ของพารามิเตอร์พหุนาม (เช่นความน่าจะเป็นสำหรับหมวดหมู่ที่แตกต่างกัน) ถ้า( p 1 , , p k ) Dirichlet ( α 1 , , α k )ก่อนที่จะรวบรวมข้อมูลจากนั้นได้รับการสังเกต( x 1 , , x k )ในหมวดหมู่ที่แตกต่างกัน, ((p1,,pk)

(p1,,pk)Dirichlet(α1,,αk)
(x1,,xk)
(p1,,pk)|(x1,,xk)Dirichlet(α1+x1,,αk+xk).

α1=α2==αk=1α1==αk=1/2


ดังนั้นเราจึงเลือกแจกจ่าย Dirichlet เพื่อประโยชน์เหล่านั้น
ColinBinWang

1
+1: คุณอาจต้องการบอกอย่างชัดเจนว่าความน่าจะเป็นคือดิริชเล็ตซึ่งเป็นเหตุผลว่าทำไมการแจกแจงหลังจึงง่ายต่อการคำนวณ
Neil G

18

นอกเหนือจากความขัดแย้งกับคำตอบของMåns Tฉันเพียงแค่ชี้ให้เห็นว่าไม่มีสิ่งเช่น "ก่อน" ในการสร้างแบบจำลองแบบเบย์! การแจกแจง Dirichlet เป็นตัวเลือกที่สะดวกเนื่องจากการเชื่อมต่อ (a) conjugacy, (b) และ (c) กับสถิติที่ไม่ใช่พารามิเตอร์ (เนื่องจากนี่เป็นเวอร์ชั่นที่แยกส่วนของกระบวนการ Dirichlet)

อย่างไรก็ตาม (i) สิ่งที่ก่อนหน้านี้คุณวางน้ำหนักของ multinomial คือคำตอบที่ถูกต้องตามกฎหมายในระดับ Bayes แบบอัตนัยและ (ii) ในกรณีที่มีข้อมูลก่อนการใช้งานไม่มีเหตุผลที่ทำให้การแจกแจง Dirichlet ง่ายขึ้น โปรดทราบว่าการผสมและการโน้มน้าวใจของการแจกแจง Dirichlet สามารถใช้เป็นนักบวชได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.