ฉันต้องการทำนายปัญหาสุขภาพ ฉันมีหมวดหมู่ผลลัพธ์ 3 รายการที่เรียงลำดับ: 'ปกติ', 'อ่อน' และ 'รุนแรง' ฉันต้องการที่จะทำนายสิ่งนี้จากตัวแปรทำนายสองตัว, ผลการทดสอบ (ความต่อเนื่อง, ช่วงเวลา covariate) และประวัติครอบครัวที่มีปัญหานี้ (ใช่หรือไม่ใช่) ในตัวอย่างของฉันความน่าจะเป็น 55% (ปกติ), 35% (ไม่รุนแรง) และ 10% (รุนแรง) ในแง่นี้ฉันสามารถทำนาย 'ปกติ' ได้เสมอและคิดถูก 55% ของเวลาแม้ว่ามันจะไม่ให้ข้อมูลกับฉันเกี่ยวกับคนไข้ ฉันพอดีกับรุ่นต่อไปนี้:
สมมติว่าไม่มีการโต้ตอบและทุกอย่างใช้ได้ดีกับตัวแบบ ความสอดคล้อง c คือ 60.5% ซึ่งฉันเข้าใจว่าเป็นความแม่นยำในการทำนายขั้นสูงสุดที่โมเดลใช้
ฉันเจอผู้ป่วยใหม่สองคนที่มีข้อมูลต่อไปนี้: 1. test = 3.26, family = 0; 2. test = 2.85, family = 1. ฉันต้องการทำนายการพยากรณ์โรค การใช้สูตร: (จากนั้นรับความแตกต่างระหว่าง ความน่าจะเป็นแบบสะสม) ฉันสามารถคำนวณการแจกแจงความน่าจะเป็นไปตามเงื่อนไขหมวดหมู่การตอบสนองของแบบจำลอง รหัส R (nb เนื่องจากปัญหาการปัดเศษผลลัพธ์ไม่ตรงกันอย่างสมบูรณ์):
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X <- rbind(c(3.26, 0), c(2.85, 1))
pred_cat1 <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3 <- 1-pred_cat2.temp
pred_cat2 <- pred_cat2.temp-pred_cat1
predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)
กล่าวคือ 1. 0 = 55.1%, 1 = 35.8%, 2 = 9.1%; และ 2. 0 = 35.6%, 1 = 46.2%, 2 = 18.2% คำถามของฉันคือฉันจะไปจากการแจกแจงความน่าจะเป็นหมวดหมู่การตอบสนองที่คาดการณ์ได้อย่างไร
ฉันได้ลองหลายวิธีโดยใช้ข้อมูลตัวอย่างซึ่งเป็นที่รู้จักผลลัพธ์ ถ้าฉันเลือกค่าสูงสุด (ความน่าจะเป็น) ความแม่นยำคือ 57% การปรับปรุงเล็กน้อยสำหรับค่า null แต่ต่ำกว่าความสอดคล้อง ยิ่งไปกว่านั้นในตัวอย่างวิธีการนี้ไม่เคยเลือก 'รุนแรง' ซึ่งเป็นสิ่งที่ฉันอยากรู้ ฉันลองใช้วิธีแบบเบย์โดยแปลงค่าความน่าจะเป็นโมฆะและแบบจำลองให้เป็นอัตราต่อรองแล้วเลือกค่าสูงสุด (อัตราส่วนอัตราต่อรอง) สิ่งนี้จะเลือก 'รุนแรง' เป็นครั้งคราว แต่ให้ความแม่นยำที่ต่ำกว่า 49.5% ฉันยังลองผลรวมของหมวดหมู่ที่ถ่วงน้ำหนักด้วยความน่าจะเป็นและการปัดเศษ สิ่งนี้ไม่เคยเลือก 'รุนแรง' และมีความแม่นยำต่ำ 51.5%
สมการที่นำข้อมูลข้างต้นมาใช้และให้ความแม่นยำสูงสุด (60.5%) คืออะไร