ฉันมีคำถามเกี่ยวกับเทคนิคการบูตสแตรปที่เหมาะสมเพื่อใช้กับข้อมูลที่มีการจัดกลุ่มที่แข็งแกร่ง
ฉันได้รับมอบหมายให้ประเมินรูปแบบการทำนายผลผสมแบบหลายตัวแปรบนข้อมูลการเรียกร้องค่าสินไหมทดแทนโดยการให้คะแนนแบบจำลองพื้นฐานปัจจุบันในข้อมูลการอ้างสิทธิ์ล่าสุดเพื่อพิจารณาว่าแบบจำลองทำนายว่าตอนใดของการดูแลที่มีความถี่สูงสุดของเซสชัน เปอร์เซ็นต์ไทล์ที่ 95) ความไวความจำเพาะและค่าการทำนายเชิงบวก (PPV) จะถูกนำมาใช้เพื่อประเมินประสิทธิภาพของแบบจำลอง
Bootstrapping ดูเหมือนจะเป็นวิธีที่ถูกต้องในการสร้างช่วงความมั่นใจสำหรับความอ่อนไหวความเฉพาะเจาะจงและเปอร์เซ็นต์ PPV โชคไม่ดีที่ bootstrap ที่ไร้เดียงสานั้นไม่เหมาะสมเนื่องจากข้อมูลการเรียกร้องคือ 1) มีความสัมพันธ์กับผู้ให้บริการดูแล 2) จัดแบ่งเป็นตอนของการดูแลด้วยการเข้าชมบ่อยครั้งมากขึ้นในช่วงหลายเดือนก่อนหน้านี้ในตอนของการดูแล ความแตกต่างของเทคนิค bootstrap แบบเคลื่อนย้ายบล็อกจะเหมาะสมหรือไม่
หรืออาจเป็นขั้นตอน bootstrap สามขั้นตอนจะทำงาน: 1) ตัวอย่างที่มีการเปลี่ยนจากผู้ให้บริการที่แตกต่างในข้อมูลแล้ว 2) ตัวอย่างที่มีการเปลี่ยนจากตอนที่แตกต่างกันของการดูแลโดยผู้ให้บริการที่เลือกแล้ว 3) ตัวอย่างที่มีการทดแทน ตอนที่เลือก
ขอบคุณมากสำหรับคำแนะนำใด ๆ !