ฉันรู้ว่าแบบจำลองทางสถิติแบบดั้งเดิมเช่น Cox Proportional Hazards Regression & แบบจำลอง Kaplan-Meier บางอย่างสามารถใช้ในการทำนายวันจนกว่าเหตุการณ์ที่จะเกิดขึ้นต่อไปจะบอกว่าล้มเหลว ฯลฯ เช่นการวิเคราะห์การอยู่รอด
คำถาม
- การถดถอยของโมเดลการเรียนรู้ของเครื่องเช่น GBM, โครงข่ายใยประสาทเทียม ฯลฯ สามารถใช้ในการทำนายวันจนถึงเหตุการณ์ได้อย่างไร?
- ฉันเชื่อว่าการใช้วันจนกว่าจะเกิดขึ้นเป็นตัวแปรเป้าหมายและการใช้โมเดลการถดถอยจะไม่ทำงาน ทำไมมันไม่ทำงานและจะแก้ไขอย่างไร
- เราสามารถแปลงปัญหาการวิเคราะห์การเอาชีวิตรอดเป็นการจัดประเภทแล้วได้รับความน่าจะเป็นของการอยู่รอดได้หรือไม่? ถ้าเช่นนั้นจะสร้างตัวแปรเป้าหมายไบนารีได้อย่างไร?
- ข้อดีและข้อเสียของวิธีการเรียนรู้ของเครื่องเทียบกับการถดถอยอันตรายของ Cox Proportional & รุ่น Kaplan-Meier ฯลฯ คืออะไร?
ลองนึกภาพข้อมูลตัวอย่างอินพุตเป็นรูปแบบด้านล่าง
บันทึก:
- เซ็นเซอร์ส่ง Ping ข้อมูลในช่วงเวลา 10 นาที แต่ในบางครั้งข้อมูลอาจหายไปเนื่องจากปัญหาเครือข่าย ฯลฯ ตามที่แสดงโดยแถวที่มี NA
- var1, var2, var3 เป็นตัวทำนายตัวแปรอธิบาย
- failure_flag บอกว่าเครื่องล้มเหลวหรือไม่
- เรามีข้อมูล 6 เดือนล่าสุดทุก ๆ 10 นาทีสำหรับรหัสเครื่องแต่ละเครื่อง
แก้ไข:
การคาดการณ์ผลลัพธ์ที่คาดหวังควรอยู่ในรูปแบบด้านล่าง
หมายเหตุ: ฉันต้องการทำนายความน่าจะเป็นที่จะเกิดความล้มเหลวสำหรับแต่ละเครื่องใน 30 วันถัดไปในระดับรายวัน
failure_flag
หลังจากที่มีการมองใกล้ดูเหมือนว่าคุณมีผลกับไบนารี