โค้ง Kaplan-Meier ดูเหมือนจะพูดอย่างอื่นนอกเหนือจากการถดถอย Cox


9

ใน R ฉันทำการวิเคราะห์ข้อมูลการอยู่รอดของผู้ป่วยมะเร็ง

ฉันได้อ่านสิ่งที่มีประโยชน์มากเกี่ยวกับการวิเคราะห์การอยู่รอดใน CrossValidated และที่อื่น ๆ และคิดว่าฉันเข้าใจวิธีตีความผลการถดถอยของ Cox อย่างไรก็ตามผลหนึ่งยังคงบักฉัน ...

ฉันกำลังเปรียบเทียบความอยู่รอดกับเพศ เส้นโค้ง Kaplan-Meier เป็นที่โปรดปรานอย่างชัดเจนของผู้ป่วยเพศหญิง (ฉันได้ตรวจสอบหลายครั้งว่าตำนานที่ฉันเพิ่มเข้ามานั้นถูกต้องผู้ป่วยที่มีชีวิตรอดสูงสุด 4856 วันเป็นผู้หญิงจริง ๆ ): ป้อนคำอธิบายรูปภาพที่นี่

และการถดถอยของ Cox ก็จะกลับมา:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

ดังนั้นอัตราส่วนอันตราย (HR) สำหรับผู้ป่วยชาย ( gendermale) คือ 0.6903 วิธีที่ฉันจะตีความว่า (โดยไม่มองที่เส้นโค้ง Kaplan-Meier) คือ: เนื่องจาก HR เป็น <1 การเป็นผู้ป่วยเพศชายนั้นมีการป้องกัน หรือแม่นยำยิ่งขึ้นผู้ป่วยเพศหญิงคือ 1 / 0.6903 = exp (-coef) = 1.449 มีแนวโน้มที่จะตายในเวลาใดเวลาหนึ่งมากกว่าผู้ชาย

แต่นั่นไม่เหมือนสิ่งที่เส้นโค้ง Kaplan-Meier พูด! เกิดอะไรขึ้นกับการตีความของฉัน


3
จากกราฟ KM ของคุณดูเหมือนว่าค่า PH ของการถดถอยแบบ Cox จะไม่ถูกเก็บไว้
Deep North

ฉันเห็น. ฉันไม่ได้ดูเรื่องนั้นมาก่อน! กราฟิกหมายความว่าเส้นโค้ง Kaplan-Meier ของฉันควรขนานกันดังนั้นฉันจึงสามารถใช้ Cox ได้อย่างปลอดภัยใช่ไหม ดูเหมือนว่าจะมากขึ้นหรือน้อยลงก่อน ~ 2200 วัน ไม่เป็นไรที่จะดูผลลัพธ์ของ Cox สำหรับข้อมูลทั้งหมดเล็กน้อยก่อนถึงสี่แยก
francoiskroll

4
หมายเหตุมันเป็นเส้นโค้งโดยที่คือฟังก์ชั่นการเอาชีวิตรอดโดยประมาณสำหรับกลุ่มซึ่งควรขนานกันภายใต้อันตรายตามสัดส่วน @IWS ชี้ให้เห็นว่าช่วงความเชื่อมั่นจะกว้างมากสำหรับกลุ่มผู้หญิงหลังจากผ่านไปประมาณ 3000 วัน (มีเพียงสองครั้งเท่านั้นที่ผ่านจุดนั้น?) ดังนั้นสมมติฐานของ PH อาจไม่เลวร้ายนัก loglogS^i(t)S^i(t)i
Scortchi - Reinstate Monica

@ ลึก: ฉันไม่เห็นหลักฐานที่แข็งแกร่งกับอันตรายตามสัดส่วน ใช่เส้นโค้งทางเทคนิคทับซ้อนกัน ... แต่นั่นอยู่บนหางที่รุนแรง
หน้าผา AB

เพื่อเติมเต็มคำตอบและความคิดเห็นอื่น ๆ เปรียบเทียบการอยู่รอดเฉลี่ยหรือการอยู่รอดห้าปีสำหรับผู้ชายและผู้หญิง มีประโยชน์ที่ชัดเจนสำหรับผู้ชายในข้อมูลนี้สอดคล้องกับการวิเคราะห์ค่า Cox
Itamar

คำตอบ:


12

นี่เป็นตัวอย่างที่ดีมากเกี่ยวกับอันตรายที่ไม่ได้สัดส่วนหรือผลของ 'การพร่อง' ในการวิเคราะห์การเอาตัวรอด ฉันจะพยายามอธิบาย

ในตอนแรกลองดูที่เส้นโค้ง Kaplan-Meier (KM) ของคุณ: คุณสามารถเห็นได้ในส่วนแรก (จนถึงประมาณ 3000 วัน) สัดส่วนของเพศชายที่ยังมีชีวิตอยู่ในประชากรที่มีความเสี่ยง ณ เวลาที่ t มีขนาดใหญ่กว่าสัดส่วนของผู้หญิง (เช่นเส้นสีฟ้าคือ 'สูงกว่าเส้นสีแดง) ซึ่งหมายความว่าเพศชายแน่นอน 'ป้องกัน' สำหรับเหตุการณ์ (ความตาย) ศึกษา ดังนั้นอัตราส่วนความเป็นอันตรายควรอยู่ระหว่าง 0 ถึง 1 (และค่าสัมประสิทธิ์ควรเป็นค่าลบ)

อย่างไรก็ตามหลังจากวันที่ 3000 เส้นสีแดงจะสูงกว่า! นี่จะเป็นการแนะนำสิ่งที่ตรงกันข้าม จากกราฟ KM นี้เพียงอย่างเดียวสิ่งนี้จะช่วยชี้ให้เห็นถึงอันตรายที่ไม่เป็นสัดส่วน ในกรณีนี้ 'ไม่เป็นสัดส่วน' หมายความว่าผลกระทบของตัวแปรอิสระ (เพศ) ไม่คงที่ตลอดเวลา กล่าวอีกนัยหนึ่งอัตราส่วนความเป็นอันตรายสามารถเปลี่ยนแปลงได้เมื่อเวลาผ่านไป ตามที่อธิบายไว้ข้างต้นดูเหมือนว่ากรณีนี้ โมเดล Cox ที่เป็นอันตรายตามสัดส่วนปกติไม่รองรับผลกระทบดังกล่าว ที่จริงแล้วหนึ่งในข้อสมมติฐานหลักคืออันตรายที่ได้สัดส่วน! ตอนนี้คุณสามารถจำลองอันตรายที่ไม่เป็นสัดส่วนได้เช่นกัน แต่นั่นอยู่นอกเหนือขอบเขตของคำตอบนี้

มีความคิดเห็นเพิ่มเติมอีกหนึ่งข้อที่ต้องทำ: ความแตกต่างนี้อาจเกิดจากอันตรายที่แท้จริงซึ่งไม่ใช่สัดส่วนหรือความจริงที่ว่ามีความแปรปรวนจำนวนมากในการประมาณการหางของเส้นโค้ง KM โปรดทราบว่า ณ เวลานี้ผู้ป่วยทั้งหมด 348 รายจะปฏิเสธที่จะมีประชากรขนาดเล็กมากที่มีความเสี่ยง อย่างที่คุณเห็นทั้งสองกลุ่มเพศมีผู้ป่วยที่ประสบเหตุการณ์และผู้ป่วยที่ถูกเซ็นเซอร์ (เส้นแนวตั้ง) เมื่อประชากรที่มีความเสี่ยงลดลงการประมาณความอยู่รอดจะไม่แน่นอน หากคุณวางแผนช่วงความเชื่อมั่น 95% รอบเส้น KM คุณจะเห็นความกว้างของช่วงความมั่นใจเพิ่มขึ้น นี่เป็นสิ่งสำคัญสำหรับการประเมินความเป็นอันตรายเช่นกัน กล่าวอย่างง่ายๆเนื่องจากประชากรที่มีความเสี่ยงและจำนวนของกิจกรรมในช่วงสุดท้ายของการศึกษาของคุณต่ำช่วงเวลานี้จะมีส่วนช่วยลดค่าใช้จ่ายในการประเมินในโมเดลค็อกซ์เริ่มต้นของคุณ

ในที่สุดนี้จะอธิบายว่าทำไมความเสี่ยง (สันนิษฐานว่าคงที่เมื่อเวลาผ่านไป) มีความสอดคล้องกับส่วนแรกของ KM ของคุณแทนที่จะเป็นจุดสุดท้าย

แก้ไข: ดูความคิดเห็นเฉพาะจุดของ @ Scrotchi ต่อคำถามต้นฉบับ: ตามที่ระบุไว้ผลของตัวเลขต่ำในช่วงสุดท้ายของการศึกษาคือการประเมินความเป็นอันตรายของจุดเหล่านั้นในเวลานั้นไม่แน่นอน ดังนั้นคุณยังมีความมั่นใจน้อยกว่าด้วยว่าการละเมิดความเป็นอันตรายตามสัดส่วนที่เห็นได้ชัดนั้นไม่ใช่เพราะโอกาส ในฐานะที่เป็นรัฐ @ scrotchi ข้อสมมติฐาน PH อาจไม่เลวร้ายขนาดนั้น


1
(-1) ก้อยข้ามส่วนปลายสุดขั้วซึ่งเรามีข้อมูลน้อยมาก ในความเป็นจริงหลักฐานสำหรับ "อันตรายที่ไม่ได้สัดส่วน" ขึ้นอยู่กับการสังเกตสองครั้งเท่านั้น (เช่นเมื่อ t> 2800 มีเพียงสองวิชาที่เหลืออยู่ในกลุ่มผู้หญิงและนอกเหนือจากนั้นเหตุการณ์สุดท้ายก่อนหน้านี้ในกลุ่มคือประมาณ t = 2100)
Cliff AB

2
@CliffAB ขอบคุณสำหรับคำติชม Cliff AB ฉันสับสนเล็กน้อยเนื่องจากคำพูดของคุณเป็นสิ่งที่ฉันพยายามจะพูด ฉันจะยอมรับ: มันอาจจะสั้นกว่านี้เล็กน้อย -1 นั้นค่อนข้างรุนแรงเล็กน้อย: '(
IWS

2
อาจจะเป็นค่าเฉลี่ยของฉันเล็กน้อย ประเด็นเดียวของฉันคือเมื่อฉันดูสิ่งนี้ฉันไม่เห็นว่าเป็นตัวอย่างที่ดีของอันตรายที่ไม่ได้สัดส่วน แต่มีข้อมูลเพียงเล็กน้อยบนหาง ฉันเห็นว่าประโยคแรกได้รับการแก้ไข (ฉันคิดว่าถ้าฉันไม่ได้พลาดในครั้งแรก?) เพื่อที่อยู่แม้ว่าดังนั้นตอนนี้ (-1) ไม่แน่นอนสำหรับ
หน้าผา AB

1
อ๊ะดูเหมือนว่าฉันจะพลาดครั้งแรก ขออภัย!
หน้าผา AB

ไม่มีปัญหาอย่างน้อยเราเห็นด้วยกับคำตอบ: D
IWS

5

คุณกำลังสับสนกับลักษณะของผลลัพธ์ของคุณ ข้อมูลเหล่านี้บอกว่า: ถ้าคุณเป็นผู้ชายคุณมีแนวโน้มที่จะอยู่ได้นานกว่าผู้หญิง ผู้หญิงมีความอยู่รอดได้มากกว่าผู้ชาย สิ่งนี้สะท้อนให้เห็นในผลลัพธ์การถดถอยเนื่องจากเอฟเฟกต์สำหรับการเป็นเพศชายจะต้องมีอัตราส่วนความเป็นอันตรายต่อบันทึกการลบเช่นผู้ชายมีความเสี่ยงต่ำกว่าเพศหญิง ในกรณีส่วนใหญ่เวลา (เมื่อเส้นโค้ง "ขั้นตอน") เส้นโค้งการอยู่รอดของผู้ชายมีค่ามากกว่าของผู้หญิงผลลัพธ์ของแบบจำลองของ Cox และกราฟเห็นด้วยมาก ส่วนโค้ง KM ยืนยันสิ่งนี้เช่นเดียวกับเอาต์พุตโมเดลการถดถอย "กากบาท" เป็นสิ่งที่ขาดไม่ได้

เส้นโค้ง KM มีพฤติกรรมที่ไม่ดีในหางโดยเฉพาะอย่างยิ่งเมื่อใกล้ 0% และ / หรือเรียวลงเล็กน้อย แกน Y คือสัดส่วนที่รอดตาย ด้วยจำนวนที่ค่อนข้างน้อยที่รอดชีวิตจากการศึกษามานานและมีเพียงไม่กี่คนที่เสียชีวิตในเวลานั้น ฉันสังเกตเห็นว่ามีผู้หญิงในกลุ่มของคุณน้อยกว่าผู้ชายอย่างเห็นได้ชัดและหลังจากนั้น 2,800 วันมีผู้หญิงน้อยกว่า 10 คนที่เหลืออยู่ในกลุ่มนี้ตามที่เห็นได้จากขั้นตอนต่าง ๆ ในการอยู่รอดและขาดเหตุการณ์เซ็นเซอร์

ในฐานะที่เป็นบันทึกที่น่าสนใจเนื่องจากการวิเคราะห์ความอยู่รอดโดยใช้เส้นโค้ง KM การทดสอบยศบันทึกและโมเดล Cox ใช้เวลารอดอันดับสูงสุดระยะเวลาการอยู่รอดจริงจึงไม่เกี่ยวข้องเลย ผู้หญิงที่รอดชีวิตยาวนานที่สุดของคุณจะสามารถรอดชีวิตได้อีก 100 ปีและจะไม่มีผลกระทบต่อการวิเคราะห์ นี่เป็นเพราะฟังก์ชันอันตรายพื้นฐาน (ไม่ได้สังเกตเหตุการณ์ใด ๆ ในช่วง 13 ปีที่ผ่านมา) จะถือว่าไม่มีความเสี่ยงต่อการเสียชีวิตในอีก 87 ปีข้างหน้าเนื่องจากไม่มีใครเสียชีวิต

หากคุณต้องการ HR ที่แข็งแกร่งเพื่อรับ CIs และ 95% ของค่า p ที่ถูกต้องให้ระบุrobust=TRUEใน Cox-PH เพื่อรับข้อผิดพลาดมาตรฐานแซนวิช ในกรณีนั้น HR เป็น HR เฉลี่ยที่เปรียบเทียบกับผู้ชายกับผู้หญิงทุกครั้งที่เกิดความล้มเหลว


เพื่อชี้แจง: ในพล็อต KM เพศชายมีชีวิตรอดได้ดีขึ้นถึงประมาณ 2,700 วัน หลังจากนั้นผู้หญิงมีชีวิตรอดดีขึ้น แต่หางนั้นไม่แม่นยำเพราะมีข้อมูลน้อยมาก คุณสามารถเห็นได้ว่าสองขั้นตอนในเส้นโค้ง KM ทำให้การอยู่รอดของผู้หญิงจากประมาณ 35% ถึง 0% ดังนั้นจึงเป็นไปได้มากที่สุดที่คนสองคนมันจะเป็นประโยชน์ในการวางแผน KM curves ด้วยแถบความเชื่อมั่น จากนั้นฉันเดาว่าคุณจะเห็นการแยกชัดเจนถึงประมาณ 2,000 วันแล้วทับซ้อนกันหลังจากนั้น
Harvey Motulsky

2
@HarveyMotulsky จริง แต่ส่วนท้ายของ KMs ไม่น่าเชื่อถือมาก หาก OP ดึงซีไอเอออกมาพวกเขาจะทับซ้อนกันอย่างรุนแรงดังนั้นเราจะบอกได้ว่าการเอาชีวิตรอดนั้นคงไม่แน่ชัดหลังจาก 2,700 วัน
AdamO

ตรงประเด็นของฉัน ข้อมูลแสดงให้เห็นอย่างชัดเจนว่าเพศชาย (ในสถานการณ์นี้ไม่ว่าจะเป็นอะไรก็ตาม) จะมีชีวิตรอดดีขึ้นอย่างน้อยในช่วง 2,000+ วันแรก
Harvey Motulsky
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.