การค้นหาความแม่นยำของการจำลองสถานการณ์ของ Monte Carlo


12

พื้นหลัง

ฉันออกแบบการจำลองมอนติคาร์โลที่รวมเอาท์พุทของชุดของแบบจำลองและฉันต้องการให้แน่ใจว่าการจำลองจะช่วยให้ฉันสามารถเรียกร้องที่สมเหตุสมผลเกี่ยวกับความน่าจะเป็นของผลลัพธ์ที่จำลองและความแม่นยำของการประมาณความน่าจะเป็น

การจำลองจะพบว่ามีความเป็นไปได้ที่คณะลูกขุนที่ดึงมาจากชุมชนที่ระบุจะลงโทษจำเลยที่หนึ่ง นี่คือขั้นตอนของการจำลอง:

  1. ใช้ข้อมูลที่มีอยู่แล้วสร้างแบบจำลองความน่าจะเป็นแบบโลจิสติกส์ ( M ) โดยการลงคะแนน“ juror first ballot vote” บนตัวทำนายกลุ่มประชากร

  2. ใช้วิธีการ Monte Carlo เพื่อจำลองM 1,000 เวอร์ชัน(เช่น 1,000 สัมประสิทธิ์สำหรับพารามิเตอร์รุ่น)

  3. เลือกรุ่นหนึ่งใน 1,000 รุ่น ( M i )

  4. Empanel 1,000 คณะลูกขุนโดยการสุ่มเลือก 12 คณะลูกขุน 12 คนจาก "ชุมชน" ( C ) ของบุคคลที่มีการแจกแจงลักษณะประชากร

  5. deterministically คำนวณความน่าจะเป็นครั้งแรกของการลงคะแนนเสียงการโหวตว่ามีความผิดในแต่ละตุลาการใช้Mฉัน

  6. แสดงผลคะแนนที่น่าจะเป็น "ลูกขุน" ในการลงคะแนนเสียงแบบกำหนด (ขึ้นอยู่กับว่ามันมีค่ามากกว่าหรือน้อยกว่าค่าที่เลือกแบบสุ่มระหว่าง 0-1)

  7. พิจารณา“ การลงคะแนนเสียงรอบสุดท้าย” ของคณะลูกขุนแต่ละครั้งโดยใช้แบบจำลอง (ที่ได้จากข้อมูลเชิงประจักษ์) ของความน่าจะเป็นที่คณะลูกขุนจะถูกตัดสินโดยมีเงื่อนไขตามสัดส่วนของคณะลูกขุนที่ลงคะแนนเพื่อความมั่นใจในการลงคะแนนเสียงครั้งแรก

  8. เก็บสัดส่วนของผู้ตัดสินที่มีความผิดสำหรับ 1,000 คณะลูกขุน ( PG i )

  9. ทำซ้ำขั้นตอนที่ 3-8 สำหรับแต่ละรุ่น 1,000 จำลองของM

  10. คำนวณค่าเฉลี่ยของPGและรายงานที่เป็นประมาณการจุดน่าจะเป็นของความเชื่อมั่นใน  C

  11. ระบุค่าเปอร์เซ็นต์ไทล์ 2.5 & 97.5 สำหรับPGและรายงานว่าเป็นช่วงความมั่นใจ 0.95

ขณะนี้ฉันกำลังใช้ลูกขุน 1,000 คนและคณะลูกขุน 1,000 คนในทฤษฎีที่ 1,000 สุ่มดึงจากการแจกแจงความน่าจะเป็น - ลักษณะทางประชากรของCหรือรุ่นM - จะเติมการกระจายนั้น

คำถาม

สิ่งนี้จะช่วยให้ฉันกำหนดความแม่นยำของการประมาณค่าของฉันได้อย่างแม่นยำหรือไม่ ถ้าเป็นเช่นนั้นฉันต้องใช้คณะลูกขุนกี่อันในการคำนวณPG iแต่ละครั้งเพื่อให้ครอบคลุมการแจกแจงความน่าจะเป็นของC (ดังนั้นฉันจึงหลีกเลี่ยงอคติการเลือก); ฉันจะใช้น้อยกว่า 1,000 ได้ไหม

ขอบคุณมากสำหรับความช่วยเหลือ!


เพิ่งออกมาจากความอยากรู้: มีอะไรในแบบจำลองนี้มีเงื่อนไขว่าผู้ถูกกล่าวหามีความผิดจริงหรือไม่?
whuber

ตัวแบบนั้นมาจากการตอบแบบสำรวจในรูปแบบข้อเท็จจริงเดียวดังนั้นความผิดที่แท้จริงจึงไม่แตกต่างกัน ฉันทำนายว่าคณะลูกขุนที่แตกต่างกันจะออกมาในกรณีประกวดเดียว
Maggie

ตกลงล้อเล่นคุณรายงานสามประมาณการ: ค่าเฉลี่ยและ 2.5 และ 97.5 เปอร์เซ็นต์ของ PG คุณต้องการการตัดสินใจที่“ ถูกต้อง” อย่างใดอย่างหนึ่งและต้องแม่นยำเพียงใด
whuber

ขั้นตอน (6) นั้นลึกลับเช่นกัน คุณสามารถอธิบายสิ่งที่ตั้งใจจะทำอย่างไร มี "ค่าที่เลือกแบบสุ่ม" แตกต่างกันสำหรับลูกขุนแต่ละคน (5) แต่ละคณะลูกขุน (4) แต่ละรุ่น (3) หรือชุดค่าผสมบางส่วนหรือไม่
whuber

1
(ดูความคิดเห็นด้านบน) ฉันคิดว่าฉันสามารถลด (a) จำนวนคณะลูกขุน ข้อผิดพลาดของการสุ่มตัวอย่างเป็นฟังก์ชันของจำนวนตัวอย่าง ด้วย 1,000 คณะลูกขุนต่อโมเดลฉันมีตัวอย่างเป็นล้าน ข้อผิดพลาดการสุ่มตัวอย่างที่เกี่ยวข้องกับตัวอย่าง 10 ^ 6 คือ ~ 0.1% ถ้าฉันใช้เพียง 35 juries ต่อโมเดลฉันจะมีตัวอย่าง 3.5 * 10 ^ 4 และข้อผิดพลาดในการสุ่มตัวอย่าง ~ 0.5% ข้อผิดพลาดการสุ่มตัวอย่างนี้มีขนาดเล็กกว่าข้อผิดพลาดการวัดของฉันมากถึง 5.0% ดังนั้นฉันควรจะใช้ 35 juries ต่อโมเดลและใช้ข้อผิดพลาดการวัดเพื่อประเมินช่วงความมั่นใจของฉัน
แม็กกี้

คำตอบ:


4

มีเกณฑ์ทั่วไปหนึ่งข้อและ "ในจักรวาล" เพื่อความดีงามของ Monte Carlo - คอนเวอร์เจนซ์

ยึดติดกับหนึ่ง M และตรวจสอบว่า PG ทำงานอย่างไรกับจำนวนของลูกขุน - มันควรจะมาบรรจบกันดังนั้นจะแสดงจำนวนของการซ้ำซ้อนที่คุณจะมีจำนวนหลักที่เหมาะสม (สำหรับใบสมัครของคุณ) ทำซ้ำเบนช์มาร์กนี้สำหรับ Ms อื่น ๆ ไม่กี่คนเพื่อให้แน่ใจว่าคุณไม่โชคดีกับการเลือก M จากนั้นดำเนินการจำลองทั้งหมด


1
ไม่แน่ใจว่าใครตอบคำถามได้อย่างเต็มที่ มันมีสองส่วน: (1) กลยุทธ์การสร้างแบบจำลองที่อธิบายมีวิธีแก้ปัญหาที่สามารถแก้ปัญหาที่เธอต้องการแก้ได้หรือไม่ - คือความเป็นไปได้ที่คณะลูกขุนจะสุ่มจากชุมชนCซึ่งมีลักษณะทางประชากรศาสตร์ที่ระบุจะลงคะแนนเพื่อค้นหา จำเลยมีความผิด? และ (2) หากกลยุทธ์การสร้างแบบจำลองมีความสมเหตุสมผลเธอจะต้องเลือก“ คณะลูกขุน” จำนวนเท่าไรและต้องตัดสิน“ ผู้ตัดสิน” จำนวนเท่าใดเพื่อรายงานการประเมินค่าความเชื่อมั่นที่เหมาะสมและ 0.95 CI เธอต้องการประหยัดในการคำนวณ ดูความคิดเห็นล่าสุดของเธอ
dmk38

0

สำหรับฉันดูเหมือนว่าปัญหาที่นี่คือว่าตัวแบบนั้นซับซ้อนเกินกว่าที่จะมองออกโดยไม่ใช้การจำลองแบบมอนติคาร์โล

หากแบบจำลองนั้นค่อนข้างเรียบง่ายคุณควรมองผ่านทางสถิติของคอนแวนแทนอันและหาคำตอบสำหรับคำถามที่ถูกถามโดยไม่เรียกใช้ตัวแบบซ้ำหลาย ๆ ครั้ง นี่เป็นความเรียบง่าย แต่ถ้าแบบจำลองทั้งหมดของคุณทำคะแนนตามการแจกแจงแบบปกติคุณก็สามารถหาคำตอบที่คุณต้องการได้อย่างง่ายดาย แน่นอนถ้าแบบจำลองนี้ง่ายแล้วคุณไม่จำเป็นต้องทำการจำลอง Monte Carlo เพื่อค้นหาคำตอบของคุณ

หากปัญหาซับซ้อนและเป็นไปไม่ได้ที่จะทำลายมันให้เป็นระดับประถมศึกษามากขึ้น Monte-Carlo เป็นรูปแบบที่ถูกต้องในการใช้งาน แต่ฉันไม่คิดว่าจะมีวิธีการจำกัดความเชื่อมั่นโดยไม่เรียกใช้โมเดล ในที่สุดเพื่อให้ได้ชนิดของขีด จำกัด ของความเชื่อมั่นที่อธิบายไว้ว่าแบบจำลองของเขาจะต้องถูกเรียกใช้หลายครั้งการกระจายความน่าจะเป็นจะต้องเหมาะสมกับผลลัพธ์ หนึ่งในความท้าทายของการจำลอง Monte-Carlo คือแบบจำลองให้คำตอบที่ดีและสม่ำเสมอสำหรับการแจกแจงในช่วงกลาง แต่ก้อยมักให้ผลลัพธ์ที่แปรผันมากขึ้น เปอร์เซ็นต์ไทล์ 97.5

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.