คำเตือน: ฉันไม่เคยทำงานกับการกระจายนี้มาก่อน คำตอบนี้อยู่บนพื้นฐานนี้บทความวิกิพีเดียและการตีความของฉันมัน
การแจกแจง Dirichlet เป็นการกระจายความน่าจะเป็นหลายตัวแปรที่มีคุณสมบัติคล้ายกับการแจกแจงแบบเบต้า
PDF ถูกกำหนดดังนี้:
{x1,…,xK}∼1B(α)∏i=1Kxαi−1i
กับ ,และ1K≥2xi∈(0,1)∑Ki=1xi=1
หากเราดูการแจกแจงเบต้าที่เกี่ยวข้องอย่างใกล้ชิด:
{x1,x2(=1−x1)}∼1B(α,β)xα−11xβ−12
เราจะเห็นว่าทั้งสองจะมีการแจกแจงเดียวกันถ้า 2 ดังนั้นขอให้ยึดการตีความของเราในครั้งแรกแล้วคุยไป 2K=2K>2
ในสถิติแบบเบย์การแจกแจงแบบเบต้าจะใช้เป็นคอนจูเกตก่อนหน้าสำหรับพารามิเตอร์ทวินาม (ดูการแจกแจงแบบเบต้า ) ก่อนหน้านี้สามารถกำหนดเป็นความรู้ก่อนหน้านี้ในและ (หรือสอดคล้องกับการแจกแจง Dirichletและ ) หากมีการทดลองใช้ทวินามแล้วมีความสำเร็จและความล้มเหลวของการกระจายหลังเป็นแล้วเป็นดังนี้:และB (ฉันจะไม่ทำสิ่งนี้เพราะนี่อาจเป็นสิ่งแรกที่คุณเรียนรู้ด้วยสถิติแบบเบย์)αβα1α2ABα1,pos=α1+Aα2,pos=α2+B
ดังนั้นการแจกแจงแบบเบต้าจึงแทนการแจกแจงแบบหลังบางส่วนบนและซึ่งสามารถตีความได้ว่าเป็นความน่าจะเป็นของความสำเร็จและความล้มเหลวตามลำดับในการแจกแจงแบบทวินาม และยิ่งมีข้อมูล (และ ) มากเท่าไหร่การกระจายของหลังนี้ก็จะแคบลงเท่านั้นx1x2(=1−x1)AB
ตอนนี้เรารู้วิธีการแจกแจงแบบแล้วเราสามารถทำให้การกระจายแบบมัลติโนเมียลเป็นแบบกระจายแทนที่จะเป็นแบบทวินาม ซึ่งหมายความว่าแทนที่จะเป็นสองผลลัพธ์ที่เป็นไปได้ (ความสำเร็จหรือความล้มเหลว) เราจะอนุญาตให้มีผลลัพธ์ (ดูว่าทำไมมันถึง generalizes เพื่อ Beta / Binom ถ้า ?) ผลลัพธ์แต่ละค่าเหล่านี้จะมีความน่าจะเป็นซึ่งเท่ากับ 1 ตามความน่าจะเป็นK=2KK=2Kxi
αiจากนั้นจะมีบทบาทคล้ายกับและในการกระจายเบต้าก่อนหน้านี้สำหรับและได้รับการอัปเดตในลักษณะที่คล้ายกันα1α2xi
ดังนั้นตอนนี้เพื่อรับคำถามของคุณ:
การalphas
กระจายมีผลต่ออย่างไร
การกระจายเป็นที่สิ้นสุดโดยข้อ จำกัดและ1 ตรวจสอบว่าส่วนของพื้นที่มิติได้รับมวลมากที่สุด คุณสามารถเห็นสิ่งนี้ในภาพนี้ (ไม่ฝังที่นี่เพราะฉันไม่ได้เป็นเจ้าของภาพ) ยิ่งข้อมูลมีอยู่ในส่วนหลัง (โดยใช้การตีความนั้น) ยิ่งดังนั้นยิ่งแน่ใจว่าคุณมีค่าของหรือความน่าจะเป็นสำหรับผลลัพธ์แต่ละรายการ ซึ่งหมายความว่าความหนาแน่นจะเข้มข้นมากขึ้น∑xi∈(0,1)∑Ki=1xi=1αiK∑Ki=1αixi
การเป็นalphas
มาตรฐานได้อย่างไร
การทำให้เป็นมาตรฐานของการแจกแจง (ทำให้แน่ใจว่าอินทิกรัลเท่ากับ 1) ต้องผ่านเทอม :B(α)
B(α)=∏Ki=1Γ(αi)Γ(∑Ki=1αi)
อีกครั้งถ้าเราดูที่กรณีเราจะเห็นว่าตัวประกอบ normalizing นั้นเหมือนกับในการแจกแจงแบบเบต้าซึ่งใช้สิ่งต่อไปนี้:K=2
B(α1,α2)=Γ(α1)Γ(α2)Γ(α1+α2)
สิ่งนี้ขยายไปถึง
B(α)=Γ(α1)Γ(α2)…Γ(αK)Γ(α1+α2+⋯+αK)
จะเกิดอะไรขึ้นเมื่ออัลฟาไม่ใช่จำนวนเต็ม?
การตีความที่ไม่เปลี่ยนแปลงสำหรับแต่อย่างที่คุณเห็นในภาพที่ผมเชื่อมโยงก่อนถ้ามวลของการกระจายสะสมที่ขอบของช่วงสำหรับx_iในมืออื่น ๆ ที่จะเป็นจำนวนเต็มและมีKα i < 1 x i K K ≥ 2αi>1αi<1xiKK≥2