วิธีการประเมินความดีของความพอดีสำหรับฟังก์ชั่นการเอาตัวรอด


9

ฉันเป็นนักวิเคราะห์การรอดชีวิตคนใหม่แม้ว่าฉันจะมีความรู้ในการจำแนกและการถดถอย

สำหรับการถดถอยเรามีสถิติ MSE และ R กำลังสอง แต่เราจะบอกได้อย่างไรว่าแบบจำลองการเอาชีวิตรอด A นั้นเหนือกว่าแบบจำลองการเอาชีวิตรอด B นอกเหนือจากกราฟฟิค (KM curve) บางชนิด?

หากเป็นไปได้โปรดอธิบายความแตกต่างด้วยตัวอย่าง (เช่น rpart package ใน R) คุณจะแสดงให้เห็นได้อย่างไรว่าต้นไม้การอยู่รอดของ CART หนึ่งต้นนั้นดีกว่าต้นไม้การอยู่รอดของ CART อีกต้น สามารถใช้การวัดใดได้บ้าง


3
การวิเคราะห์การเอาชีวิตรอดมีหลากหลายประเภท บางคนขึ้นอยู่กับการถดถอย บางคนเช่น KM อาจจะคิดได้ง่ายขึ้นว่าเป็นตัวประมาณค่าสำหรับสถิติที่เกี่ยวข้องกับการอยู่รอด
Alexis

ขอบคุณสำหรับความพยายามอย่างต่อเนื่องในการปรับปรุงคำถามของคุณ ฉันสงสัยว่าเป็นคำตอบ / เหมาะสมสำหรับ CV ตอนนี้ ฉันได้รับการเสนอชื่อเพื่อเปิดใหม่ เราจะดูว่าคนอื่นเห็นด้วยหรือไม่ อาจช่วยได้ถ้าคุณสามารถโพสต์โมเดลการอยู่รอดประเภท CART สองแบบเพื่อให้ผู้คนใช้อธิบายปัญหาเหล่านี้
gung - Reinstate Monica

1
เบ็นโดยพื้นฐานแล้วคุณกำลังบอกว่าใน Cox Proportional Hazard Regression ไม่มีวิธีไหนที่ดีในการประเมินความเหมาะสม R-Square ไม่ได้นำไปสู่ผลลัพธ์ที่ดีเพราะมันไม่สามารถจัดการกับการสังเกตที่ถูกเซ็นเซอร์และการสังเกตที่ไม่ถูกตรวจได้อย่างถูกต้อง? คุณกำลังพูดถึง Harrells c ฉันเข้าใจคุณใช่ไหมว่าวิธีการนี้ไม่สามารถใช้กับการถดถอย Cox-PH ได้หรือไม่?
Kosta S.

คำตอบ:


9

ปัญหาหลักของสถิติเช่นรุ่น Cox R2(อธิบายไว้ในคำตอบอื่น) คือมันขึ้นอยู่กับการกระจายการเซ็นเซอร์ข้อมูลของคุณ สิ่งที่เป็นธรรมชาติอื่น ๆ ที่คุณอาจดูเช่นอัตราส่วนความน่าจะเป็นของโมเดลว่างก็มีปัญหาเช่นกัน (นี่เป็นเพราะการมีส่วนร่วมของดาต้าพอยน์ที่ถูกเซ็นเซอร์กับความน่าจะแตกต่างอย่างมากจากการมีส่วนร่วมของดาต้าพอยน์ที่มีการตรวจสอบเหตุการณ์เพราะหนึ่งในนั้นมาจาก PDF และหนึ่งในนั้นมาจาก CDF) วิธีที่เสนอเพื่อหลีกเลี่ยงสิ่งนี้ แต่วิธีที่ฉันเคยเห็นมักจะต้องการให้คุณมีรูปแบบของการกระจายการเซ็นเซอร์หรือบางสิ่งที่ไม่สามารถทำได้ ฉันไม่ได้ดูว่าการพึ่งพาอาศัยกันนี้เป็นอย่างไรในทางปฏิบัติดังนั้นหากการเซ็นเซอร์ของคุณไม่รุนแรงคุณก็ยังสามารถดูสถิติตามอัตราส่วนความน่าจะเป็นได้ สำหรับรถเข็นแบบเอาตัวรอด

สำหรับแบบจำลองการเอาชีวิตรอดทั่วไปสถิติที่ใช้บ่อยครั้งหนึ่งคือดัชนีcของ Harrell ซึ่งเป็นแอนะล็อกของเคนดัลล์τหรือ ROC AUC สำหรับแบบจำลองการอยู่รอด โดยพื้นฐานแล้วcคือสัดส่วนจากอินสแตนซ์ทั้งหมดที่คุณรู้ว่าอินสแตนซ์หนึ่งมีประสบการณ์เหตุการณ์หลังจากเหตุการณ์อื่นซึ่งโมเดลนั้นจัดอันดับอย่างถูกต้อง (ในคำอื่น ๆ สำหรับคู่ของอินสแตนซ์ที่จะรวมอยู่ในตัวหารที่นี่ส่วนใหญ่หนึ่งสามารถถูกเซ็นเซอร์และมันจะต้องถูกเซ็นเซอร์หลังจากที่คนอื่นประสบเหตุการณ์) ดัชนีcยังขึ้นอยู่กับการกระจายการเซ็นเซอร์ แต่ ตามที่ Harrell การพึ่งพานั้นรุนแรงกว่าสถิติอื่น ๆ ที่ฉันได้กล่าวถึงข้างต้น น่าเสียดายที่c Harrellมีความอ่อนไหวน้อยกว่าสถิติด้านบนดังนั้นคุณอาจไม่ต้องการเลือกระหว่างแบบจำลองตามหากความแตกต่างระหว่างขนาดเล็ก มันมีประโยชน์มากกว่าในฐานะดัชนีที่ตีความได้ของประสิทธิภาพทั่วไปมากกว่าวิธีเปรียบเทียบโมเดลต่างๆ

(สุดท้ายแน่นอนถ้าคุณมีจุดประสงค์เฉพาะในใจสำหรับโมเดล - นั่นคือถ้าคุณรู้ว่าฟังก์ชันการสูญเสียการทำนายของคุณคืออะไรคุณสามารถประเมินพวกมันได้ตามฟังก์ชั่นการสูญเสีย! ไม่โชคดีมาก ... )

สำหรับการอภิปรายเพิ่มเติมในเชิงลึกของทั้งสองสถิติความน่าจะเป็นอัตราส่วนและ Harrell ของ , คุณควรดูที่ตำราเรียนที่ยอดเยี่ยม Harrell ของการถดถอยการสร้างแบบจำลองกลยุทธ์ ส่วนของการประเมินแบบจำลองการอยู่รอดคือ survival19.10, pp. 492-493 ฉันขอโทษฉันไม่สามารถให้คำตอบที่ชัดเจนได้ แต่ฉันไม่คิดว่านี่เป็นปัญหาที่แก้ไขแล้ว!


5

การถดถอยตามสัดส่วนของค็อกซ์สำหรับข้อมูลการรอดชีวิตสามารถคิดได้ว่าสอดคล้องกับการถดถอยแบบมาตรฐานในหลายประการ ตัวอย่างเช่นการถดถอย Cox ยังให้ข้อผิดพลาดมาตรฐานที่เหลือและสถิติ R-Square ดูcoxphฟังก์ชั่นในsurvivalแพ็คเกจR (คุณสามารถคิดถึงเส้นโค้ง KM ที่สอดคล้องกับการวิเคราะห์แบบไม่อิงพารามิเตอร์ในสถิติมาตรฐานคุณจะรวมการทดสอบแบบไม่อิงพารามิเตอร์เข้ากับ CART ได้อย่างไร) ในทางปฏิบัติกับข้อมูลทางคลินิกข้อผิดพลาดมาตรฐานที่เหลือมีแนวโน้มสูงและค่า R-square ต่ำ ในการถดถอย Cox

ดังนั้นการถดถอยมาตรฐานและการถดถอย Cox จึงมีข้อกำหนดและข้อ จำกัด ที่คล้ายคลึงกัน คุณต้องตรวจสอบว่าข้อมูลนั้นตรงกับข้อสมมติฐานที่สำคัญซึ่งในการวิเคราะห์ของ Cox นั้นรวมถึงข้อสมมติฐานที่อันตรายที่ถูกเปรียบเทียบนั้นมีสัดส่วนตามเวลา คุณจะต้องหลีกเลี่ยงการปรับให้แน่นเกินไปและคุณจะต้องตรวจสอบโมเดลของคุณ และเมื่อฉันเข้าใจรถเข็นถึงแม้ว่าฉันจะไม่ใช้มันด้วยตัวเอง แต่คุณก็ยังคงเผชิญกับปัญหาที่เกิดขึ้นจากการเปรียบเทียบโมเดลที่ไม่ซ้อนกัน


ขอบคุณสำหรับคำตอบของคุณเกี่ยวกับความแตกต่างและความสัมพันธ์ระหว่างการถดถอยของ Cox และการถดถอย แต่ฉันต้องการรู้วิธีเปรียบเทียบแบบจำลองการอยู่รอดของต้นไม้การตัดสินใจสองส่วน (CART)
น้ำท่วม

กระดาษแบบเปิดที่เชื่อมโยงกับprojecteuclid.org/euclid.ssu/1315833185เป็นการทบทวนและเปรียบเทียบวิธีการในการสร้างและการเลือกต้นไม้ที่รอดชีวิตโดยอิงจากrpartแพ็คเกจ R และรหัสอื่น ๆ
EdM

ขอบคุณที่วางกระดาษ ฉันจะอ่านกระดาษตอนนี้
น้ำท่วม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.