ผลลัพธ์ของการประมาณการ Monte Carlo ผลิตโดยการสุ่มตัวอย่างที่สำคัญ


13

ฉันทำงานเกี่ยวกับการสุ่มตัวอย่างที่สำคัญอย่างใกล้ชิดสำหรับปีที่ผ่านมาและมีคำถามปลายเปิดสองสามข้อที่ฉันหวังว่าจะได้รับความช่วยเหลือ

ประสบการณ์เชิงปฏิบัติของฉันกับแผนการสุ่มตัวอย่างที่สำคัญคือพวกเขาสามารถสร้างค่าความแปรปรวนต่ำและค่าอคติต่ำได้เป็นครั้งคราว อย่างไรก็ตามบ่อยครั้งที่พวกเขามีแนวโน้มที่จะประเมินความผิดพลาดสูงที่มีความแปรปรวนตัวอย่างต่ำ แต่มีอคติสูงมาก

ฉันสงสัยว่าทุกคนสามารถอธิบายได้อย่างชัดเจนว่าปัจจัยชนิดใดที่ส่งผลต่อความถูกต้องของการประมาณตัวอย่างที่สำคัญ? โดยเฉพาะอย่างยิ่งฉันสงสัยว่า:

1) การประมาณการตัวอย่างที่สำคัญรับประกันว่าจะรวมกันเป็นผลลัพธ์ที่ถูกต้องเมื่อการแจกแจงความเอนเอียงมีการสนับสนุนเช่นเดียวกับการกระจายแบบดั้งเดิมหรือไม่? ถ้าเป็นเช่นนั้นทำไมสิ่งนี้ถึงใช้เวลานานในการฝึกฝน?

2) มีความสัมพันธ์เชิงปริมาณระหว่างข้อผิดพลาดในการประมาณการที่เกิดจากการสุ่มตัวอย่างที่สำคัญและ "คุณภาพ" ของการแจกแจงการให้น้ำหนัก (เช่นเท่าใดมันตรงกับการกระจายศูนย์แปรปรวน)

3) บางส่วนอิงจาก 1) และ 2) - มีวิธีการวัดปริมาณ 'เท่าใด' ที่คุณต้องรู้เกี่ยวกับการแจกแจงก่อนที่คุณจะดีขึ้นโดยใช้การออกแบบการสุ่มตัวอย่างที่สำคัญกว่าวิธี Monte Carlo แบบง่าย ๆ

คำตอบ:


8

การสุ่มตัวอย่างความสำคัญมีการตรวจสอบเช่นเดียวกับวิธีการพื้นฐานของ Monte Carlo ที่หลักของมันเป็นพื้นฐาน Monte Carlo อันที่จริงมันเป็นเพียงการเปลี่ยนแปลงของการวัดอ้างอิงไปจาก เป็น ดังนั้นการบรรจบกันเป็น garanteed โดยกฎหมายจำนวนมากในทั้งสองกรณีคือไม่ว่าคุณจำลองจากหรือจากกรัมนอกจากนี้หากคำว่า เป็นขอบเขตที่ จำกัด ทฤษฎีบทกลางยังใช้และความเร็วของการลู่เข้า คือ h ( x ) f ( x )

h(x)f(x)dx
fgh2(x)f2(x)
h(x)f(x)g(x)g(x)dx
fgO(1/
h2(x)f2(x)g(x)dx
O(1/O(1/n). หาก "ใช้เวลานานในการฝึกฝน" อาจเป็นเพราะปัจจัยความแปรปรวนข้างต้นใน CLT อาจมีขนาดค่อนข้างใหญ่ แต่ผมยืนยันและความเร็วเป็นเช่นเดียวกับปกติ Monte Carlo,{n})O(1/n)

คุณภาพของการกระจายความสำคัญการสุ่มตัวอย่างจึงมีความเกี่ยวข้องโดยตรงกับปัจจัยดังกล่าวข้างต้นแปรปรวนซึ่งจะไปศูนย์สำหรับ "ศูนย์กระจายแปรปรวน" สัดส่วนกับ(x)|h(x)|f(x)


2
ฉันสงสัยว่าเนื่องจาก OP กำลังรายงานการประมาณค่าความแปรปรวนขนาดเล็กที่มีอคติ แต่ดูเหมือนว่าจะมีความแปรปรวนเล็กน้อยซึ่งเขาอาจถามเกี่ยวกับการสุ่มตัวอย่างความสำคัญตามมาตรฐานของตนเอง ดูตัวอย่างที่ดีของ Radford Neal บนตัวประมาณค่าฮาร์มอนิกเพื่อดูตัวอย่างที่ดีซึ่งจะใช้การสุ่มตัวอย่างที่มีค่าความสำคัญที่มีค่าความแปรปรวนเป็น 0 และส่งกลับไร้สาระ ฉันไม่แน่ใจว่าสิ่งนี้จะไม่เกิดขึ้นในการสุ่มตัวอย่างที่มีความสำคัญเป็นประจำ แต่แน่นอนว่าเป็นของหายาก
deinst

แม้ว่านี่ไม่ใช่ความตั้งใจของโอพี แต่ฉันก็ยังสนใจในพอยน์เตอร์เกี่ยวกับวิธีที่จะคิดออกว่าการทำให้ตนเองเป็นปกติจะผิดไปอย่างผิดปกติ
deinst

@deinst ฉันไม่ได้ตระหนักถึงขั้นตอนการทำให้ปกติด้วยตนเองและข้อผิดพลาดของมันดังนั้นขอบคุณสำหรับสิ่งนี้! ไม่ว่าในกรณีใดฉันคิดว่าปัญหาอาจเกี่ยวข้องกับคุณสมบัติของโครงร่าง IS ของฉันดังนั้นฉันจึงต้องการสำรวจความคิดนี้อีกหากคุณมีความคิด
Berk U.

@deinst ชุดรูปแบบ IS ที่ฉันใช้ถูกออกแบบมาให้ทำงานโดยไม่มีการแจกแจงตัวอย่างในมือ โครงการแรกใช้ขั้นตอนการ MCMC เพื่อจำลองชี้จากศูนย์กระจายแปรปรวนDX} ถัดไปจะใช้เคอร์เนลความหนาแน่นของการประมาณค่าในผลผลิต(x)} เมื่อมีอยู่ในมือฉันสามารถตัวอย่างจุดใหม่ได้สร้างค่า IS ของฉันเป็น $ \ sum {h (y_i) f (y_i) / หมวก {g (y_i)} $g(x)Mx1..xMg(x)=h(x)f(x)/h(x)f(x)dxx1..xMg(x)^g(x)^Ny1...yN
Berk U.

การใช้การประมาณแบบไม่มีพารามิเตอร์แนะนำความแปรปรวนของคำสั่งที่สูงกว่าความแปรปรวน Monte Carlo ดังนั้นฉันจะไม่แนะนำ
ซีอาน

7

ซีอานได้ครอบคลุมผลการสุ่มตัวอย่างความสำคัญมาตรฐาน หากคุณถามเกี่ยวกับการสุ่มตัวอย่างความสำคัญด้วยตนเองที่คุณรู้เพียงและถึงค่าคงที่ normalizing ที่ไม่รู้จักบางอย่างมีการกล่าวถึงเทคนิคในบทที่ 4 ของหนังสือซีอานและ Casella Monte Carlo วิธีการทางสถิติและแนะนำ Monte วิธีคาร์โลกับ R ฉันแน่ใจว่าซีอานสามารถอธิบายรายละเอียดเกี่ยวกับเรื่องนี้ได้มากกว่าที่ฉันทำได้ดังนั้นในแง่หนึ่งคำตอบนี้ก็คือการหลอกล่อหมีfg

ด้วยการสุ่มตัวอย่างความสำคัญที่ทำให้เป็นมาตรฐานคุณกำลังพยายามประมาณ โดยเลือกจากการแจกแจงซึ่งฟังก์ชันความหนาแน่นเป็นสัดส่วนกับและการคำนวณ ใช้วิธีการเดลต้า (โดยทั่วไปจะขึ้นอยู่กับเงื่อนไขเชิงเส้นของเทย์เลอร์ซีรีย์ของ ) และให้เราได้ และ

δ=h(x)f(x)dx
x1,,xng(x)
δ^=i=1nh(x)f(x)/g(x)i=1nf(x)/g(x).
X/Yω(X)=f(x)/g(X)
Eg(δ^)δ+δVarg(ω(X))Covg(ω(X),h(X)ω(X))n
Varg(δ^)Varg(h(X)ω(X))2δCovg(ω(X),h(X)ω(X))+δ2Varg(ω(X))n.

ดังนั้นโดยสังเขปเพื่อให้มีอคติและความแปรปรวนเล็กน้อยคุณต้องการให้เล็กและเป็นค่าบวก โชคไม่ดีที่การประมาณเหล่านี้ไม่สมบูรณ์แบบ (และการพิจารณาความแปรปรวนและความแปรปรวนร่วมอย่างแม่นยำนั้นน่าจะยากพอ ๆ กับการแก้ปัญหาเบื้องต้น)Cov กรัม ( ω ( X ) , เอช( X ) ω ( X ) )Varg(ω(X))Covg(ω(X),h(X)ω(X))


ขอบคุณสำหรับสิ่งนี้. ฉันแค่ไม่แน่ใจเล็ก ๆ น้อย ๆ เกี่ยวกับสัญกรณ์ / ไม่แน่ใจว่ามีการพิมพ์ผิด เพื่ออธิบายว่าและในคำอธิบายของคุณคืออะไร? GX/YG
Berk U.

@BerkUstun ทุน G เป็นตัวพิมพ์เล็ก ๆ ที่ฉันจะแก้ไขทันที X / Y เป็นเพียงอัตราส่วนทั่วไปของตัวแปรสุ่ม IIRC ทั้งหมดนี้จะมีการอธิบายในหนังสือของหลิว Monte Carlo (อะไรกับวิทยาศาสตร์ในชื่อ.)
deinst

@deinst: จุดที่ดี! แท้จริงแล้วคุณสมบัติของเวอร์ชันที่ปรับให้เป็นมาตรฐานของตัวเองค่อนข้างแตกต่างจากตัวประมาณค่าการสุ่มตัวอย่างที่มีความสำคัญที่เป็นกลาง ในทางทฤษฎีเราจะต้องมีตัวอย่างความสำคัญแยกต่างหากเพื่อประเมินตัวส่วน
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.