ค่าที่คาดหวังของการกระจาย Dirichlet ที่แก้ไขคืออะไร (ปัญหาการรวม)


14

มันง่ายในการสร้างตัวแปรสุ่มที่มีการแจกแจงไดริชเลตโดยใช้ตัวแปรแกมม่าที่มีพารามิเตอร์สเกลเดียวกัน ถ้า:

XiGamma(αi,β)

แล้ว:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

ปัญหา จะเกิดอะไรขึ้นถ้าพารามิเตอร์ของสเกลไม่เท่ากัน

XiGamma(αi,βi)

แล้วการกระจายตัวของตัวแปรนี้คืออะไร?

(X1jXj,,XnjXj)?

สำหรับฉันมันคงเพียงพอที่จะรู้คุณค่าที่คาดหวังของการกระจายตัวนี้
ฉันต้องการสูตรพีชคณิตแบบปิดโดยประมาณที่สามารถประเมินได้อย่างรวดเร็วโดยคอมพิวเตอร์
สมมุติว่าการประมาณด้วยความเที่ยงตรง 0.01 นั้นเพียงพอแล้ว
คุณสามารถสันนิษฐานได้ว่า:

αi,βiN

หมายเหตุในระยะสั้นงานคือการหาการประมาณของอินทิกรัลนี้:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
@ Łukaszคุณพูดอะไรเพิ่มเติมเกี่ยวกับพารามิเตอร์ , α i , และβ i ได้ไหม? เป็นไปได้ที่จะได้รับนิพจน์ที่แน่นอนสำหรับj X jและด้วยเหตุนี้จึงประมาณความคาดหวังของอัตราส่วน แต่สำหรับการรวมกันของพารามิเตอร์หนึ่งสามารถใช้ประโยชน์จากการประมาณปกติหรือการอานม้าด้วยการทำงานที่น้อยลง ฉันไม่คิดว่าจะมีวิธีการประมาณสากลซึ่งเป็นเหตุผลว่าทำไมจึงยินดีต้อนรับข้อ จำกัด เพิ่มเติม nαiβijXj
whuber

และj X jมีความสัมพันธ์กันดังนั้นเราต้องประมาณอินทิกรัลเอง α ฉันมักจะเป็นขนาดเล็กจำนวนมากเช่น 1 หรือ 2 และบางครั้งเป็นใหญ่เป็น 10000 ในทำนองเดียวกัน wih β ฉันแต่ก็มักจะเป็น 10 ครั้งมีขนาดใหญ่กว่า αฉัน X1jXjαiβiαi
Łukasz Lew

ปัญหาคือมีขนาดเล็กฉัน ถ้าα iทั้งหมดใหญ่แล้วค่าประมาณที่ดีของอินทิกรัลทั้งหมดคือ: α 1 / β 1αiαiα1/β1jαj/βj
Łukasz Lew

@ Łukaszหากคุณต้องการประเมินการแสดงออกของความคาดหวังเหตุใดคุณจึงต้องใช้สูตรพีชคณิต ฉันคิดว่าจะใช้เคล็ดลับเชิงตัวเลขเพื่อให้ได้ความคาดหวัง แต่ฉันต้องการความคิดเห็น :)
deps_stats

ฉันต้องประเมินมันหลายครั้งในโปรแกรมของฉัน มันจะต้องเร็วมากเช่นไม่มีลูปและควรมีหน่วยงานไม่มากเกินไป
Łukasz Lew

คำตอบ:


2

เป็นเพียงคำพูดเริ่มต้นหากคุณต้องการความเร็วในการคำนวณคุณมักจะต้องเสียสละความแม่นยำ "More precision" = "เวลามากขึ้น" โดยทั่วไป อย่างไรก็ตามนี่คือการประมาณอันดับสองควรปรับปรุงประมาณ "น้ำมันดิบ" ที่คุณแนะนำในความคิดเห็นของคุณด้านบน:

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT An explanation for the above expansion was requested. The short answer is wikipedia. The long answer is given below.

write f(x,y)=xy. Now we need all the "second order" derivatives of f. The first order derivatives will "cancel" because they will all involve multiples XE(X) and YE(Y) which are both zero when taking expectations.

2fx2=0
2fxy=1y2
2fy2=2xy3

And so the taylor series up to second order is given by:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Taking expectations yields:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Which is the answer I gave. (although I initially forgot the minus sign in the second term)


This looks like exactly what I need. Can you explain how you got this expansion? I tried in a lot of ways and was unable to do that ...
Łukasz Lew
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.