สำหรับแต่ละระเบียนในชุดข้อมูลของฉันฉันมีข้อมูลต่อไปนี้
ที่ไหน เป็นคุณสมบัติ คือ 1 ถ้าเหตุการณ์เป้าหมายเกิดขึ้นและ 0 เป็นอย่างอื่นและ เป็นเวลาประทับของเหตุการณ์ที่เกิดขึ้น โดยเฉพาะอย่างยิ่ง, อาจหายไปหากไม่มีเหตุการณ์หรือตั้งเวลาให้ติดตามผลสิ้นสุด
ฉันต้องการคำนวณดัชนีความเสี่ยงสำหรับแต่ละระเบียนในชุดข้อมูลของฉัน
ฉันคิดว่าจะใช้รูปแบบการจำแนกประเภทที่ใช้คุณสมบัติต่างๆ เพื่อทำนายชั้นเรียน . อย่างไรก็ตาม เป็นสิ่งสำคัญ: ถ้าเหตุการณ์ มีแนวโน้มที่จะเกิดขึ้นในไม่ช้าความเสี่ยงควรสูงขึ้น
นั่นคือเหตุผลที่การวิเคราะห์ความอยู่รอดควรเหมาะสำหรับปัญหานี้ ฉันไม่ต้องการการประเมินแบบเต็มของ แต่เพียงดัชนีเดียวที่แสดงถึงความเสี่ยงสำหรับการบันทึกเดียว
เวลาเฉลี่ยในการเอาชีวิตรอดที่สามารถคำนวณได้สำหรับแต่ละเร็กคอร์ดดูเหมือนว่าเป็นดัชนีความเสี่ยงที่ดี - ยิ่งมีความเสี่ยงต่ำ
คำถามของฉันคือ:
- การวิเคราะห์ความอยู่รอดเหมาะสำหรับวัตถุประสงค์ของฉันหรือไม่
- ฉันจะประเมินประสิทธิภาพของแบบจำลองของฉันได้อย่างไร
เกี่ยวกับคำถาม (2): ฉันกระตือรือร้นที่จะใช้ Harrell - ดัชนีตัวอย่าง แต่ฉันไม่แน่ใจว่าผลลัพธ์ที่คาดการณ์ไว้จะใช้ในการคำนวณ จากกลยุทธ์การสร้างแบบจำลองการถดถอยหนังสือของ Harrell หน้า 247:
ดัชนี [... ] ถูกคำนวณโดยการจับคู่วิชาที่เป็นไปได้ทั้งหมดซึ่งหนึ่งวิชาตอบกลับและอีกอันไม่ได้ ดัชนีเป็นสัดส่วนของคู่ดังกล่าวกับผู้ตอบกลับที่มีความน่าจะเป็นที่คาดการณ์ของการตอบสนองสูงกว่าผู้ตอบกลับ
หากการวิเคราะห์การเอาชีวิตรอดกลายเป็นตัวเลือกที่ถูกต้องฉันคิดว่าควรใช้วิธีมาตรฐานบางอย่างเพื่อแนะนำเวลาที่แปรปรวนร่วม .