เหตุใดปัญหารกรุงรังจึงไม่สามารถทำได้สำหรับตัวอย่างขนาดใหญ่


13

สมมติว่าเรามีชุดของจุด\} แต่ละจุดถูกสร้างขึ้นโดยใช้การกระจาย เพื่อให้ได้มาซึ่งหลังสำหรับเราเขียน ตามที่กระดาษ Minka ฯ เมื่อวันที่คาดว่าจะมีการขยายพันธุ์ที่เราต้องการคำนวณที่จะได้รับหลังและดังนั้นปัญหาจะกลายเป็นยากสำหรับตัวอย่างที่มีขนาดใหญ่ขนาดNอย่างไรก็ตามฉันไม่สามารถเข้าใจได้ว่าทำไมเราถึงต้องคำนวณจำนวนนี้ในกรณีนี้เพราะสำหรับเดี่ยวy ฉัน p ( y i | x ) = 1y={y1,y2,,yN}yixP(x|Y)αP(Y|x)P(x)=P(x) N Πฉัน=1P(Yฉัน|x) 2Np(x|y)Nyi

p(yi|x)=12N(x,1)+12N(0,10).
x
p(x|y)p(y|x)p(x)=p(x)i=1Np(yi|x).
2Np(x|y)Nyiความน่าจะเป็นมีรูปแบบ
p(yi|x)=122π(exp{12(yix)2}+110exp{120yi2}).

การใช้สูตรนี้เราได้รับหลังโดยการคูณอย่างง่ายของดังนั้นเราต้องการเพียงการดำเนินการและดังนั้นเราจึงสามารถแก้ปัญหานี้สำหรับตัวอย่างขนาดใหญ่ได้อย่างแน่นอนp(yi|x)N

ฉันจะทำให้ตัวเลขการทดลองเพื่อเปรียบเทียบไม่ผมได้รับหลังเดียวกันในกรณีที่ฉันคำนวณแต่ละระยะแยกต่างหากและในกรณีการใช้สินค้าที่ผมมีความหนาแน่นสำหรับแต่ละy_iผู้โพสต์เหมือนกัน ดู ว่าฉันผิดตรงไหน ทุกคนสามารถทำให้มันชัดเจนกับผมทำไมเราต้องการดำเนินงานเพื่อการคำนวณหลังสำหรับให้และตัวอย่าง ?2 N x Yyiป้อนคำอธิบายรูปภาพที่นี่2Nxy


การดำเนินการหนึ่งครั้งต่อเทอมและเงื่อนไขดังนั้นเราจึงต้องการการดำเนินงานนอกจากนี้ฉันดูกระดาษของ Minka และบทของ Bishop ในการอนุมานโดยประมาณอีกครั้ง ทั้งสองแสดงให้เห็นว่าเราต้องการประมาณการและได้รับหลังสำหรับxNO(N)x
Alexey Zaytsev

ฉันเข้าใจถูกต้องหรือไม่ว่าของคุณไม่ได้รับการแก้ไข ถ้าเป็นเช่นนั้นคุณสามารถแก้ปัญหานี้ได้ในซึ่งถือว่าสามารถใช้งานได้โดยไม่คำนึงถึงyiO(nlog(n))n
user603

1
@Alexey หลังจากอ่านย่อหน้านี้อีกครั้งฉันคิดว่าผู้เขียนไม่ได้กล่าวถึงการดำเนินงานเขาเพียง แต่ชี้ให้เห็นว่า"รัฐเชื่อสำหรับเป็นส่วนผสมของ Gaussians" 2Nx2N

1
@Procrastinator ตามกระดาษที่เราต้องการใช้การเผยแพร่ความเชื่อ แต่ไม่สามารถใช้เพราะเราต้องดำเนินการผสมกับ gaussians ถ้าอย่างนั้นคำถามคือทำไมเราถึงต้องการใช้ BP? อีกคำถามหนึ่งที่เกิดขึ้นในกรณีที่เราอ่านบท 10.7.1 ในบิชอป PRML หรือนาฬิกาvideolecture โดย Minka หลังจากนั้นคำตอบยังไม่ชัดเจน 2N
Alexey Zaytsev

1
@ Alexey ฉันคิดว่าตรรกะเบื้องหลังนี้แตกต่างกัน ผู้เขียนอธิบายว่าจะเกิดอะไรขึ้นถ้าคุณใช้การเผยแพร่ความเชื่อเพื่อเน้นปัญหาบางอย่างเมื่อมีขนาดใหญ่แล้วจึงส่งเสริม "การเผยแผ่ความคาดหวัง" ของเขา เขากล่าวว่าการเผยแผ่ความเชื่อต้องใช้ส่วนผสมของ Gaussians สำหรับสถานะความเชื่อสำหรับซึ่งจะซับซ้อนเมื่อมีขนาดใหญ่ มีการกล่าวถึงจำนวนของการดำเนินงานที่จำเป็นต้องใช้ แต่ความซับซ้อนของรัฐเชื่อสำหรับการไม่เป็นx2 N x N xN2NxNx

คำตอบ:


4

คุณพูดถูกว่ากระดาษผิด คุณสามารถประเมินการกระจายตัวด้านหลังของที่ตำแหน่งที่ทราบโดยใช้การดำเนินการปัญหาคือเมื่อคุณต้องการคำนวณช่วงเวลาของคนหลัง ในการคำนวณค่าเฉลี่ยด้านหลังของอย่างแน่นอนคุณจะต้องใช้การดำเนินงานนี่เป็นปัญหาที่กระดาษพยายามแก้ไขO ( n ) x 2 NxO(n)x2N


2

คุณพลาดจุดที่การแจกแจงนั้นเป็นส่วนผสมของ Gaussians: แต่ละตัวอย่างนั้นกระจายตามด้วยความน่าจะเป็นและเป็น (การแจกแจงความยุ่งเหยิงสำหรับ , อิสระจาก ) . p ( y i | x ) 1 - w p c ( y ) y x wyip(yi|x)1wpc(y)yxw

ให้เป็นตัวแปรตัวบ่งชี้ที่แสดงว่าตัวอย่างที่วาดจากการกระจายของความยุ่งเหยิง ดังนั้นถ้าหากมันเป็นก็แสดงว่าตัวอย่างที่ถูกดึงออกมาจากx) แน่นอนถ้าตัวอย่างถูกดึงออกมาจากการกระจายความยุ่งเหยิงมูลค่าของมันจะไม่เกี่ยวข้องในการประมาณการของx i 0 p ( y | x ) xcii0p(y|x)x

มันคือสถานะของสถานะร่วมที่เป็นไปได้สำหรับตัวแปรตัวบ่งชี้เหล่านี้ที่ทำให้เกิดปัญหา2N


อย่างไรก็ตามเราสามารถวางตัวแปรเพิ่มเติมได้เนื่องจากเราจำเป็นต้องได้รับการแก้ไขปัญหาหลังสูงสุด ด้านหลังของมีรูปแบบที่ชัดเจนดังนั้นเราจึงไม่ถูกบังคับให้คำนึงถึงสถานะปัจจุบันทั้งหมดดังนั้นคำถามคือ "ทำไมเราต้องคำนวณจำนวนนี้ในกรณีที่เราต้องการหาวิธีการแก้ปัญหาหลังสูงสุด?" x 2 Ncix2N
Alexey Zaytsev

การขยายให้ใหญ่สุดจะต้องดำเนินการแทนสถานะสำหรับตัวแปรc
เดฟ

เราไม่ทราบว่าดังนั้นเราจึงบูรณาการ (รวมขึ้นไป) C_iวิธีนี้สามารถทำได้โดยตรงใช่ไหม? c icici
Alexey Zaytsev

สั่งใช่ แต่จำนวนรัฐ (คำศัพท์) เพิ่มขึ้นเช่นซึ่งอาจเป็นปัญหาในการคำนวณ 2N
เดฟ

เราสามารถทำสิ่งนี้สำหรับแต่ละการสังเกตด้วยวิธีอิสระดังนั้นเราจึงมีไม่ใช่ความซับซ้อนO ( 2 n )O(n)O(2n)
Alexey Zaytsev
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.