การวาดตัวอย่างจากส่วนผสม จำกัด ของการแจกแจงแบบปกติ?


10

หลังจากขั้นตอนการอัพเดตแบบเบย์บางครั้งฉันถูกทิ้งไว้กับการกระจายหลังของรูปแบบของส่วนผสมของการแจกแจงปกตินั่นคือพารามิเตอร์\ thetaถูกดึงมาจากการกระจายที่มีการให้ PDF เป็นส่วนผสมน้ำหนักของ PDF ปกติและไม่ใช่ผลรวมของ RVs ปกติ ฉันต้องการวาดตัวอย่าง\ theta \ sim \ Pr (\ theta | \ text {data})เพื่อใช้ในการสุ่มตัวอย่างความสำคัญโดยประมาณของด้านหลัง ในทางปฏิบัติยอดรวมฉันสามารถมีจำนวนเทอมได้ดังนั้นมันจึงเป็นไปไม่ได้ที่จะเลือกเทอมiตามน้ำหนัก\ {w_i \}แล้วจึงดึง\ theta \ sim N (\ mu_i, \ sigma ^ 2)θ θ ~ Pr ( θ |ข้อมูล) ฉันฉัน{ W ฉัน } θ ~ N ( μ ฉัน , σ 2 )

Pr(θ|data)=i=1kwiN(μi,σ2).
θθPr(θ|data)ii{wi}θN(μi,σ2). มีวิธีที่มีประสิทธิภาพในการวาดตัวอย่างจากด้านหลังของแบบฟอร์มนี้หรือไม่?

คุณลองเลือกวิธีแล้วโยนหรือไม่? การเลือกสามารถทำได้อย่างรวดเร็วตามขั้นตอนของ O (k)
dmckee --- ผู้ดูแลอดีตลูกแมว

1
หากวิธีการแก้ปัญหาของ Barron ไม่ถูกต้องจริง ๆ แล้วและคุณหมายถึง "แบบผสม" คุณสามารถใช้คำนั้นได้ไหม?
Neil G

1
Neil G: ฉันไม่ใช่นักสถิติจากการค้าขาย แต่เป็นนักฟิสิกส์ที่บางครั้งจำเป็นต้องใช้ประโยชน์จากสถิติ เช่นนี้ฉันไม่ทราบคำที่เหมาะสมเพื่ออธิบายสิ่งที่ฉันต้องการ อย่างไรก็ตามฉันสามารถดำเนินการต่อและแก้ไขคำถามได้ในตอนนี้เพื่อให้ชัดเจนยิ่งขึ้นว่า PDF กำลังถูกรวมเข้าด้วยกันไม่ใช่ RVs
Chris Granade

1
@ChrisGranade: ฉันไม่ได้พยายามลงมาหาคุณ ฉันแค่ต้องการให้แน่ใจว่านั่นคือสิ่งที่คุณหมายถึงและเพื่อแนะนำการแก้ไข
Neil G

1
เหตุใดจึงไม่สามารถเลือกตามน้ำหนักและตัวอย่างจากการแจกแจงเครื่องแบบใน , จากนั้นตัวอย่าง ? สิ่งนี้มีราคาแพงกว่าการสุ่มตัวอย่างแบบกระจายเพียงครั้งเดียวในระดับปานกลางค่าใช้จ่ายขึ้นอยู่กับจำนวนการแจกแจงแบบผสมและไม่ขึ้นอยู่กับการแจกแจงแบบปกติ { w i } [ 0 , 1 ] N ( μ i , σ 2 ) ki{wi}[0,1]N(μi,σ2)k
Jed Brown

คำตอบ:


6

ในหลักการหนึ่งสามารถเลือกจำนวนตัวอย่างล่วงหน้าที่จะดึงจากแต่ละการกระจายย่อยจากนั้นเยี่ยมชมแต่ละการกระจายย่อยเพียงครั้งเดียวและดึงกว่าจำนวนคะแนน

นั่นคือ

  1. ค้นหาชุดสุ่มซึ่งและเคารพน้ำหนักn = k i = 1 n i<n1,n2,,nk>n=i=1kni

    ผมเชื่อว่าคุณทำเช่นนี้โดยการวาดภาพการกระจาย Poissonกระจายพหุนาม (ดูความคิดเห็น) ค่าเฉลี่ยสำหรับแต่ละย่อยกระจายแล้ว normalizing รวมไปnnwinn

    งานที่นี่คือO(k)O(n)

  2. จากนั้นทำ

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    งานที่นี่คือO(n)

แม้ว่านี่จะหมายความว่าคุณจะไม่ได้รับการสุ่ม หากจำเป็นต้องมีคำสั่งแบบสุ่มคุณต้องสลับการจับฉลาก (เช่น )O(n)

ดูเหมือนว่าขั้นตอนแรกจะใช้เวลารันไทม์และเป็นลำดับเดียวกับอัลกอริธึมไร้เดียงสา แต่ถ้าคุณแน่ใจว่าคุณสามารถประมาณการแจกแจงปัวซองด้วยการแจกแจงแบบปกติและเร่งความเร็วในขั้นตอนแรกwin1


การแจกแจงของไม่ใช่การแจกแจงแบบปัวซงถ้าได้รับการแก้ไข แต่เป็นการกระจายแบบทวินาม nnin
Frédéric Grosshans

@ FrédéricGrosshans Uhm ... นี่คือที่ที่ฉันยอมรับความอ่อนแอน่าสังเวชของฉันในความน่าจะเป็น มองฉันคิดว่าคุณอาจจะถูก ฉันไม่ได้มีการเชื่อมโยงสำหรับการขว้างปาแจกแจงทวินามโดยพลการ แต่วิกิพีเดียมีการอ้างอิงบางส่วน นอกจากนี้ยังมีความสัมพันธ์ระหว่างปัวซองและทวินามซึ่งฉันจะอ้างว่าเป็นผู้รับผิดชอบต่อความไม่แน่นอนของฉัน ใช่นั่นคือตั๋ว
dmckee --- ผู้ดูแลอดีตลูกแมว

1
@dmckee: คำตอบที่ดีสำหรับการวาดภาพจากแบบจำลองการผสมยกเว้นว่ามันควรจะเป็นการกระจายแบบพหุนามมากกว่าการกระจายตัวแบบปัวซองในขั้นตอนที่ 1
Neil G

3

หมายเหตุ:คำถามดั้งเดิมของคำถามนี้ถามเกี่ยวกับ "ผลรวมถ่วงน้ำหนักของการแจกแจงแบบปกติ" ซึ่งคำตอบต่อไปนี้อาจเป็นประโยชน์ อย่างไรก็ตามหลังจากการถกเถียงกันเล็กน้อยเกี่ยวกับคำตอบนี้คำตอบโดย @Geoff และจากคำถามตัวเองมันก็กลายเป็นที่ชัดเจนว่าคำถามคือการสุ่มตัวอย่าง "ส่วนผสมของการแจกแจงปกติ" ซึ่งคำตอบนี้ไม่สามารถใช้ได้


ผลรวมของการแจกแจงปกติคือการแจกแจงแบบปกติดังนั้นคุณสามารถคำนวณพารามิเตอร์ของการแจกแจงเดี่ยวนี้แล้วก็ดึงตัวอย่างจากนั้น ถ้าเราเรียกการแจกแจงนั้นว่าดังนั้นN(μsum,σsum2)

μsum=i=1kwiμi

σsum2=i=1kwi2σi2

3
เพื่อให้ชัดถ้อยชัดคำ Chris กำลังสรุปฟังก์ชั่นความหนาแน่นของความน่าจะเป็นไม่ใช่ตัวแปรแบบสุ่ม
Geoff Oxberry

2
Chris ต้องการ PDF ที่มี (อย่างน้อยในหลักการ) หลายอย่างในนั้น นั่นคือเขาเป็นผลรวมของ PDF ไม่ใช่ PDF ของผลรวม
dmckee --- ผู้ดูแลอดีตลูกแมว

1
มันเป็นความจริงที่ว่าผลรวมของตัวแปรสุ่มแบบกระจายปกตินั้นเป็นตัวแปรสุ่มแบบกระจายแบบปกติ อย่างไรก็ตามผลรวมของการแจกแจงแบบปกติไม่ใช่การแจกแจงแบบปกติ ดังนั้นถ้าและ , เป็นจริงที่ , แต่{2}) (เครดิตไปที่ @ChrisGranade สำหรับคำอธิบาย)X1N(μ1,σ12)X2N(μ2,σ22)X1+X2N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
Geoff Oxberry

2
@dmckee: นั่นไม่ใช่ "ผลรวมถ่วงน้ำหนักของการแจกแจงแบบปกติ" นั่นคือ "ส่วนผสมของการแจกแจงแบบปกติ"
Neil G

2
ความคิดเห็น @Barron ไม่ถือว่าเป็นส่วนสำคัญของหน้าเว็บ คุณควรแก้ไขคำตอบของคุณเพื่อรวมส่วนสำคัญของความคิดเห็นเพื่อให้ผู้อ่านที่ไม่ได้ดูความคิดเห็นนั้นจะไม่ถูกเข้าใจผิด
David Ketcheson

2

ปรับปรุง : คำตอบนี้ไม่ถูกต้องอันเนื่องมาจากความสับสนในคำศัพท์ (ดูที่ห่วงโซ่ความคิดเห็นด้านล่างเพื่อดูรายละเอียด); ฉันแค่ปล่อยให้มันเป็นป้ายบอกทางเพื่อให้ผู้คนไม่โพสต์คำตอบนี้ (นอกเหนือจากบาร์รอง) โปรดอย่าโหวตมันขึ้นหรือลง

ฉันแค่ใช้คุณสมบัติของตัวแปรสุ่มเพื่อลดตัวแปรให้เป็นตัวแปรสุ่มแบบกระจายตัวเดียว ผลรวมของสองอิสระกระจายตามปกติตัวแปรสุ่มตัวเองเป็นตัวแปรสุ่มดังนั้นหากและจากนั้นX1N(μ1,σ12)X2N(μ2,σ22)

X1+X2N(μ1+μ2,σ12+σ22).

นอกจากนี้ถ้าแล้วw1R

w1X1N(w1μ1,w12σ12).

การใช้ผลลัพธ์ทั้งสองรวมกันแล้ว

Pr(θ|data)N(i=1kwiμi,i=1kwi2σi2).

ดังนั้นในกรณีนี้คุณจะต้องดึงตัวอย่างจากการแจกแจงครั้งเดียวเท่านั้นซึ่งน่าจะง่ายกว่านี้มาก


2
นี่เป็นวิธีการแก้ปัญหาที่แตกต่างกันซึ่งสามารถเห็นได้จากความจริงที่ว่าการแจกแจงดั้งเดิมนั้นเป็นแบบหลายคำกริยาและข้อเสนอแนะของคุณคือแบบเดียว
Chris Ferrie

@ChrisFerrie: ฉันเชื่อว่าคุณ แต่ตามสัญกรณ์ฉันสับสนว่าทำไมการแจกแจงข้างต้นจะเป็นแบบหลายค่าในขณะที่ผลรวมของตัวแปรสุ่มแบบเกาส์อิสระสองตัวจะไม่เป็นเช่นนั้น ฉันหายไปนี่อะไร
Geoff Oxberry

ฉันคิดว่าความสับสนคือเราไม่ได้ดูผลรวมของตัวแปรสุ่ม แต่ PDF ที่เป็นผลรวมของ PDF จำนวนมาก เหล่านี้ไม่ได้เสมอกันตั้งแต่(X_2) แต่รูปแบบไฟล์ PDF ของเราสามารถจะคิดว่าเป็น marginalizing มากกว่าตัวแปรสุ่มฉันip(X1+X2)p(X1)+p(X2)i
Chris Granade

อาคุณกำลังดูผลรวมของ PDF ใช่นั่นเป็นสัตว์ร้ายที่ต่างออกไปโดยสิ้นเชิง ตอนนี้ฉันอ่านคำถามอย่างใกล้ชิดฉันเห็นสิ่งที่คุณพูดและฉันจะลบคำตอบของฉัน ขอบคุณ!
Geoff Oxberry

ฉันได้ยกเลิกการลบคำตอบที่ถูกลบไปก่อนหน้านี้ของฉันเพื่อทำหน้าที่เป็นเพียงป้ายบอกทางเท่านั้น โปรดอย่าโหวตคำตอบของฉันไม่ขึ้นหรือลงอีกต่อไป
Geoff Oxberry
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.