วิธีการแพร่กระจายอย่างเหมาะสมดึงเมื่อคำนวณหลายความคาดหวัง


9

สมมติว่าเราต้องการคำนวณความคาดหวัง:

EYEX|Y[(X,Y)]

สมมติว่าเราต้องการประมาณค่านี้โดยใช้การจำลองมอนติคาร์โล

EYEX|Y[(X,Y)]1RSΣR=1RΣs=1S(xR,s,YR)

แต่สมมติว่ามันมีค่าใช้จ่ายสูงในการดึงตัวอย่างจากการแจกแจงทั้งสองค่าเพื่อให้เราสามารถวาดหมายเลขคงที่เท่านั้น K

เราควรจัดสรรอย่างไร ตัวอย่างรวมถึงดึงไปที่การกระจายแต่ละครั้งหรือในสุดขั้วหนึ่งเสมอในด้านนอกและเสมอในด้านในรองในทางกลับกัน ฯลฯ .....KK/2K-1

สัญชาตญาณของฉันบอกฉันว่ามันจะต้องทำอย่างไรกับความแปรปรวน / เอนโทรปีของการแจกแจงที่สัมพันธ์กัน สมมติว่าด้านนอกหนึ่งเป็นจุดมวลแล้วส่วนหนึ่งของที่ช่วยลดข้อผิดพลาด MC จะวาดที่ 1 ของและวาดของxy KYK-1X|Y

หวังว่านี่จะชัดเจน


แก้ไขให้คุณ
wolfsatthedoor

1
"ในทางกลับกัน" และความคิดเห็นของคุณต่อ @ Xi'ans คำตอบดูเหมือนจะบ่งบอกว่าคุณคิดว่าเป็นไปได้ที่จะดึงตัวแปรด้านนอกมากกว่าตัวแปรภายใน แต่วิธีที่เหมาะสมที่สุด - ไม่ใช่ทั้งหมดที่จะเสียเปล่า? 0
Juho Kokkala

ยุติธรรมเพียงพอขั้นต่ำหนึ่งวาดต่อภายนอกฉันเดา หรือคุณอาจคิดว่าการเขียนโปรแกรมเพื่อประหยัดการวาดฉันคิดว่า
wolfsatthedoor

1
@robertevansanders โปรดยืนยันว่าการตีความคำถามของคุณในสองประโยคแรกของคำตอบของ Xi'ans นั้นถูกต้องหรือไม่
Juho Kokkala

อย่างที่คุณพูดใช่ แต่เปลี่ยน y และ x
wolfsatthedoor

คำตอบ:


4

นี่เป็นคำถามที่น่าสนใจมากกับเอกสารเล็ก ๆ น้อย ๆ ในวรรณคดี Monte Carlo ยกเว้นในการเชื่อมต่อกับการแบ่งชั้นและ ราว-Blackwellisation นี่อาจเป็นเพราะความจริงที่ว่าการคำนวณความแปรปรวนตามเงื่อนไขที่คาดหวังและความแปรปรวนของการคาดการณ์ตามเงื่อนไขนั้นทำได้ยาก

ก่อนอื่นให้เราสมมติว่าคุณทำงาน R แบบจำลองจาก πX, x1,...,xR และสำหรับแต่ละจำลอง xR, คุณวิ่ง S แบบจำลองจาก πY|X=xR, Y1R,...,YsR. Monte Carlo ของคุณประมาณการไว้แล้ว

δ(R,S)=1RSΣR=1RΣs=1S(xR,YRs)
ความแปรปรวนของการประมาณนี้ถูกแยกย่อยดังนี้
var{δ(R,S)}=1R2S2Rvar{Σs=1S(xR,YRs)}=1RS2varXEY|X{Σs=1S(xR,YRs)|xR}+1RS2EXvarY|X{Σs=1S(xR,YRs)|xR}=1RS2varX{SEY|X[(xR,Y)|xR]}+1RS2EX[SvarY|X{(xR,Y)|xR}]=1RvarX{EY|X[(xR,Y)|xR]}+1RSEX[varY|X{(xR,Y)|xR}]=K=RS1RvarX{EY|X[(xR,Y)|xR]}+1KEX[varY|X{(xR,Y)|xR}]
ดังนั้นหากต้องการลดความแปรปรวนนี้ให้น้อยที่สุดทางเลือกที่ดีที่สุดคือ R=K. นั่นหมายความว่าS=1. ยกเว้นเมื่อคำแปรปรวนแรกเป็นโมฆะในกรณีนี้มันไม่สำคัญ อย่างไรก็ตามตามที่กล่าวไว้ในความคิดเห็นสมมติฐานK=RS ไม่สมจริงเนื่องจากไม่ได้คำนึงถึงการผลิตรายการหนึ่ง xR [หรือถือว่านี่มาได้ฟรี]

ตอนนี้ให้เราสมมติค่าใช้จ่ายในการจำลองที่แตกต่างกันและข้อ จำกัด ด้านงบประมาณ R+aRS=ความหมายว่า YRsค่าใช้จ่าย a เพื่อจำลองมากกว่าครั้ง xR's การสลายตัวข้างต้นของความแปรปรวนนั้น

1RvarX{EY|X[(xR,Y)|xR]}+1R(-R)/aREX[varY|X{(xR,Y)|xR}]
ซึ่งสามารถย่อเล็กสุดได้ R เช่น
R* * * *=/1+{aEX[varY|X{(xR,Y)|xR}/varX{EY|X[(xR,Y)|xR]}}1/2
[จำนวนเต็มที่ใกล้เคียงที่สุดภายใต้ข้อ จำกัด R1 และ S1] ยกเว้นเมื่อความแปรปรวนแรกเท่ากับศูนย์ซึ่งในกรณีนี้ R=1. เมื่อไหร่EX[varY|X{(xR,Y)|xR}]=0ความแปรปรวนขั้นต่ำสอดคล้องกับค่าสูงสุด R, ซึ่งนำไปสู่ S=1 ในพิธีการปัจจุบัน

โปรดทราบว่าควรเปรียบเทียบโซลูชันนี้กับโซลูชันสมมาตรเมื่ออินทิกรัลชั้นในอยู่ X รับ Y และอินทิกรัลด้านนอกขัดกับขอบใน Y (สมมติว่าการจำลองมีความเป็นไปได้เช่นกันในลำดับนี้)

ส่วนขยายที่น่าสนใจสำหรับคำถามนั้นคือพิจารณาแบบจำลองที่แตกต่างกันจำนวนหนึ่ง S(xR) สำหรับแต่ละจำลอง xRขึ้นอยู่กับมูลค่า varY|X{(xR,Y)|xR}.


2
ในข้อสรุปสุดท้ายดูเหมือนว่าคุณจะได้รับการสมมติ K=RS แต่ในการตั้งคำถาม K=RS+Rเนื่องจากการนับตัวแปรนอกจะถูกนับเช่นกัน ผลลัพธ์ที่นี่บอกว่าหากการสุ่มตัวอย่างตัวแปรด้านนอกว่างแน่นอนหนึ่งควรสุ่มตัวอย่างภายนอกใหม่สำหรับทุกๆด้าน (นอกจากนี้บทบาทของx และ Yมีการสลับที่นี่เมื่อเทียบกับคำถาม แต่แน่นอนว่าไม่สำคัญ)
Juho Kokkala

2
ใช่ แต่เราสามารถตัดสินคุณค่าของ R... พิจารณาการตั้งค่าความเสื่อมที่ตำแหน่งด้านนอก Xเป็นค่าคงที่ มันจะดีกว่าที่จะสุ่มตัวอย่างค่าคงที่หนึ่งครั้งและY K-1 ครั้งมากกว่าค่าคงที่ K/2 ครั้งและ Y K/2 คูณ (ซึ่งก็คืออะไร) S=1จะบอกเป็นนัย) หรือฉันเข้าใจผิดอย่างสิ้นเชิงคำถาม? (ตอนนี้ฉันเพิ่งอ่านประโยคที่สองของความคิดเห็นของคุณ - ไม่ใช่สมมติฐานที่ระบุไว้ในคำถามที่ว่าพวกเขามีค่าใช้จ่ายเท่ากัน)
Juho Kokkala

@ ซีอานใช่โกลกาตาถูกต้องวิธีแก้ปัญหาของคุณโดยทั่วไปไม่สามารถถือได้ สมมติว่าตอนนี้ตัวแปรภายในมีการแจกแจงที่ลดลงและด้านนอกมีความแปรปรวนที่มีความหมายแล้วคุณจะต้องการสุ่มตัวอย่างดึงภายในน้อยที่สุด
wolfsatthedoor

ฉันคิดว่าคำตอบของคุณไม่ถูกต้อง สมมติว่าการกระจายภายในนั้นเสื่อมโทรมและด้านนอกเป็นความแปรปรวนขนาดใหญ่, S จะเป็น 1 ได้อย่างไร
wolfsatthedoor

@ robertevansanders: ถ้าการกระจายตัวภายในแย่ลง varY|X{f(xr,Y)|xr}=0ดังนั้น R=b และเราเลือกจำนวนเต็มที่ใกล้เคียงที่สุด R ภายใต้ข้อ จำกัด S1 และ R(1+aS)bซึ่งหมายถึงการ S=1 เพื่อทำ R ใกล้ที่สุดเท่าที่จะทำได้ b.
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.