การรวมพล็อตการสอบเทียบหลังจากการใส่หลายครั้ง


15

ฉันต้องการคำแนะนำในการรวมพล็อตการแปลง / สถิติหลังจากการใส่ร้ายหลายครั้ง ในการตั้งค่าการพัฒนาแบบจำลองทางสถิติเพื่อทำนายเหตุการณ์ในอนาคต (เช่นการใช้ข้อมูลจากบันทึกของโรงพยาบาลเพื่อทำนายการรอดชีวิตของผู้ป่วยหลังออกจากโรงพยาบาลหรือเหตุการณ์) เราสามารถจินตนาการได้ว่ามีข้อมูลที่ขาดหายไปมากมาย การใส่ข้อมูลหลายครั้งเป็นวิธีหนึ่งในการจัดการสถานการณ์ดังกล่าว แต่ส่งผลให้จำเป็นต้องรวมสถิติการทดสอบจากชุดข้อมูลการใส่ข้อมูลแต่ละชุดโดยคำนึงถึงความแปรปรวนเพิ่มเติมเนื่องจากความไม่แน่นอนของการใส่ความ

ฉันเข้าใจว่ามีสถิติการสอบเทียบหลายอย่าง (hosmer-lemeshow, Emax ของ Harrell, ดัชนีการสอบเทียบโดยประมาณ ฯลฯ ) ซึ่งอาจใช้กฎรูบิน 'ปกติ' สำหรับการรวมกำไร

อย่างไรก็ตามสถิติเหล่านี้มักจะเป็นมาตรการโดยรวมของการสอบเทียบซึ่งไม่แสดงขอบเขตที่พลาดการสอบเทียบที่เฉพาะเจาะจงของโมเดล ด้วยเหตุนี้ฉันควรดูที่แผนการปรับเทียบ น่าเสียดายที่ฉันไม่รู้วิธีการ 'รวม' แปลงหรือข้อมูลเบื้องหลัง (คาดการณ์ความน่าจะเป็นต่อบุคคลและผลลัพธ์ที่สังเกตได้ต่อบุคคล) และไม่สามารถหาได้มากในวรรณคดีชีวการแพทย์ (สาขาที่ฉันคุ้นเคย) หรือที่นี่ใน CrossValidated แน่นอนว่าการดูชุดข้อมูลการสอบเทียบของชุดข้อมูลแต่ละชุดอาจเป็นคำตอบ แต่อาจกลายเป็นเรื่องที่น่ารำคาญมาก (จนถึงปัจจุบัน) เมื่อสร้างชุดการใส่จำนวนมาก

ฉันอยากถามว่ามีเทคนิคใดบ้างที่จะส่งผลให้เกิดแผนการปรับเทียบหรือไม่หลังจากรวมหลายครั้ง (?)


เป็นไปได้หรือไม่ที่จะรวมตัวอย่าง bootstrapped โดยตรงและประเมินการสอบเทียบของตัวอย่างนั้น?
AdamO

@AdamO คุณหมายถึงอะไรโดยรวมกำไรโดยตรง? และตัวอย่างบูทสแตรปตัวใดที่คุณอ้างถึง
IWS

2
ขออภัยให้ฉันสำรอง (ฉันคิดว่า MI เป็น bootstrap) ฉันกำลังบอกว่าถ้า n ของคุณคือ 1,000 และคุณมีชุดข้อมูล 5 MI ทำไมไม่สร้างพล็อตการสอบเทียบครั้งเดียวจาก 5,000 และเปรียบเทียบข้อสังเกต / คาดหวังในสิ่งที่ต้องการใน 5,000 รายการ
AdamO

@AdamO ฟังดูน่าสนใจมันต้องมีการปรับฟังก์ชั่นที่ให้ช่วงความมั่นใจด้วย การอ้างอิงหรือทฤษฎีใด ๆ เพื่อสนับสนุนแนวคิดนี้
IWS

2
ไม่มีการอ้างอิงเราได้ตีพิมพ์บทความเมื่อไม่นานมานี้โดยไม่มีข้อพิสูจน์ว่าเราได้รับการอนุมานจากข้อผิดพลาดมาตรฐาน bootstrap และการใส่ร้ายหลาย ๆ ครั้งโดยการรวมเข้าด้วยกันในลักษณะนี้ ฉันคิดว่าคุณสามารถระบุได้ว่าจุดประสงค์ของการวิเคราะห์คือการทดสอบที่ระดับ 0.05 ที่อัตราส่วนความคาดหวัง / การสังเกตหรือความแตกต่างอยู่ในช่วงการแจกแจงแบบปกติและการประมาณเชิงปริมาณนั้นไม่แปรเปลี่ยนกับขนาดตัวอย่างดังนั้นการทดสอบบนพื้นฐาน 95% CI ไม่ได้รับผลกระทบจากการรวมกำไร
AdamO

คำตอบ:


1

[... ] ถ้า n ของคุณคือ 1,000 และคุณมีชุดข้อมูล 5 MI ทำไมไม่สร้างพล็อตการสอบเทียบครั้งเดียวจาก 5,000 และเปรียบเทียบข้อสังเกต / คาดหวังในสิ่งที่ต้องการใน 5,000 รายการ

เกี่ยวกับการอ้างอิง:

ไม่มีการอ้างอิงเราได้ตีพิมพ์บทความเมื่อไม่นานมานี้โดยไม่มีข้อพิสูจน์ว่าเราได้รับการอนุมานจากข้อผิดพลาดมาตรฐาน bootstrap และการใส่ร้ายหลาย ๆ ครั้งโดยการรวมเข้าด้วยกันในลักษณะนี้ ฉันคิดว่าคุณสามารถระบุได้ว่าจุดประสงค์ของการวิเคราะห์คือการทดสอบที่ระดับ 0.05 ที่อัตราส่วนความคาดหวัง / การสังเกตหรือความแตกต่างอยู่ในช่วงการแจกแจงแบบปกติและการประมาณเชิงปริมาณนั้นไม่แปรเปลี่ยนกับขนาดตัวอย่างดังนั้นการทดสอบบนพื้นฐาน 95% CI ไม่ได้รับผลกระทบจากการรวมกำไร


1
ฉันได้คัดลอกความคิดเห็นนี้โดย @AdamO เป็นคำตอบของวิกิชุมชนเพราะความคิดเห็นนั้นมากหรือน้อยคำตอบของคำถามนี้ เรามีช่องว่างอย่างมากระหว่างคำตอบและคำถาม อย่างน้อยส่วนหนึ่งของปัญหาคือมีการตอบคำถามในความคิดเห็น: หากความคิดเห็นที่ตอบคำถามนั้นเป็นคำตอบแทนเราจะมีคำถามที่ยังไม่ได้ตอบน้อยกว่านี้
mkt - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.