สิ่งหนึ่งที่ต้องเก็บไว้ในใจกับเส้นโค้งการอยู่รอดของ Kaplan-Meier ก็คือว่ามันเป็นพื้นพรรณนาและไม่เชิงอนุมาน มันเป็นเพียงฟังก์ชั่นของข้อมูลที่มีรูปแบบที่ยืดหยุ่นอย่างไม่น่าเชื่อที่อยู่ด้านหลัง นี่คือจุดแข็งเพราะสิ่งนี้หมายความว่าแทบจะไม่มีข้อสันนิษฐานใด ๆ ที่อาจแตกหัก แต่จุดอ่อนเพราะมันยากที่จะพูดคุยและมันเหมาะกับ "เสียง" และ "สัญญาณ" หากคุณต้องการทำการอนุมานคุณจะต้องแนะนำสิ่งที่ไม่รู้จักที่คุณอยากรู้
ตอนนี้วิธีหนึ่งในการเปรียบเทียบเวลาเฉลี่ยของการเอาตัวรอดคือการทำสมมติฐานต่อไปนี้:
- ฉันมีการประมาณการของเวลาการอยู่รอดเฉลี่ยสำหรับแต่ละรัฐกำหนดโดยเส้นโค้ง Kaplan Meierฉันเสื้อผมผม
- ฉันคาดว่าเวลาเฉลี่ยของการอยู่รอดที่แท้จริงจะเท่ากับค่าประมาณนี้ E ( T i | t i ) = t iTiE(Ti|ti)=ti
- ฉันมั่นใจ 100% ว่าเวลาการอยู่รอดที่แท้จริงเป็นค่าบวก Pr(Ti>0)=1
ทีนี้วิธีที่ "อนุรักษ์นิยมที่สุด" ในการใช้สมมติฐานเหล่านี้คือหลักการของเอนโทรปีสูงสุดดังนั้นคุณจะได้รับ:
p(Ti|ti)=Kexp(−λTi)
ที่ไหนและได้รับการแต่งตั้งดังกล่าวว่ารูปแบบไฟล์ PDF ให้เป็นมาตรฐานและความคุ้มค่าที่คาดว่าจะเป็น{i} ตอนนี้เรามี:λ t ฉันKλti
= K [ - อีเอ็กซ์พี( - λ T ฉัน )
1=∫∞0p(Ti|ti)dTi=K∫∞0exp(−λTi)dTi
E ( T i ) = 1=K[−exp(−λTi)λ]Ti=∞Ti=0=Kλ⟹K=λ
และตอนนี้เรามี
E(Ti)=1λ⟹λ=t−1i
คุณมีชุดของการแจกแจงความน่าจะเป็นสำหรับแต่ละรัฐ
p(Ti|ti)=1tiexp(−Titi)(i=1,…,N)
ซึ่งให้การกระจายความน่าจะเป็นร่วมของ:
p(T1,T2,…,TN|t1,t2,…,tN)=∏i=1N1tiexp(−Titi)
ตอนนี้ดูเหมือนว่าคุณต้องการทดสอบสมมติฐานโดยที่เป็นเวลาเฉลี่ยของการรอดชีวิตเฉลี่ย สมมติฐานทางเลือกที่รุนแรงในการทดสอบคือ "ทุกรัฐเป็นเกล็ดหิมะที่มีเอกลักษณ์และสวยงาม"เพราะนี่คือ ทางเลือกที่เป็นไปได้มากที่สุดและแสดงถึงข้อมูลที่หายไปในการย้ายไปสู่สมมติฐานที่ง่ายกว่า (การทดสอบ "minimax") การวัดหลักฐานเทียบกับสมมติฐานที่ง่ายกว่านั้นกำหนดโดยอัตราต่อรอง:H0:T1=T2=⋯=TN=t¯t¯=1N∑Ni=1tiHA:T1=t1,…,TN=tN
O(HA|H0)=p(T1=t1,T2=t2,…,TN=tN|t1,t2,…,tN)p(T1=t¯,T2=t¯,…,TN=t¯|t1,t2,…,tN)
=[∏Ni=11ti]exp(−∑Ni=1titi)[∏Ni=11ti]exp(−∑Ni=1t¯ti)=exp(N[t¯tharm−1])
ที่ไหน
tharm=[1N∑i=1Nt−1i]−1≤t¯
คือค่าเฉลี่ยฮาร์มอนิก โปรดทราบว่าอัตราต่อรองจะเหมาะอย่างสมบูรณ์แบบเสมอ แต่ไม่มากถ้าเวลาอยู่รอดเฉลี่ยอยู่ใกล้พอสมควร นอกจากนี้ยังช่วยให้คุณสามารถระบุหลักฐานของการทดสอบสมมติฐานนี้โดยเฉพาะ:
สมมติฐานที่ 1-3 ให้อัตราต่อรองสูงสุดของ เทียบกับค่ามัธยฐานการมีชีวิตอยู่รอดที่เท่าเทียมกันในทุกรัฐO(HA|H0):1
รวมสิ่งนี้เข้ากับกฏการตัดสินใจ, ฟังก์ชั่นการสูญเสีย, ฟังก์ชั่นยูทิลิตี้ ฯลฯ ซึ่งบอกว่ามันมีประโยชน์อย่างไรที่จะยอมรับสมมติฐานที่ง่ายกว่าและคุณจะได้ข้อสรุป!
ไม่มีการ จำกัด จำนวนของสมมติฐานที่คุณสามารถทดสอบได้และให้อัตราต่อรองที่คล้ายกัน เพียงแค่เปลี่ยนเพื่อระบุชุดที่เป็นไปได้ "ค่าจริง" ที่เป็นไปได้ คุณสามารถทำ "การทดสอบนัยสำคัญ" โดยเลือกสมมติฐานดังนี้:H0
HS,i:Ti=ti,Tj=T=t¯(i)=1N−1∑j≠itj
ดังนั้นสมมติฐานนี้จึงเป็นคำพูด "รัฐมีอัตราการรอดชีวิตเฉลี่ยที่แตกต่างกัน แต่รัฐอื่น ๆ ทั้งหมดเหมือนกัน" จากนั้นทำการคำนวณอัตราต่อรองที่ฉันทำไว้อีกครั้ง แม้ว่าคุณควรระมัดระวังเกี่ยวกับสมมติฐานทางเลือกคืออะไร สำหรับข้อใดข้อหนึ่งด้านล่างนี้ "สมเหตุสมผล" ในแง่ที่ว่าพวกเขาอาจเป็นคำถามที่คุณสนใจที่จะตอบ (และโดยทั่วไปแล้วพวกเขาจะมีคำตอบที่แตกต่างกัน)i
- ฉันที่กำหนดไว้ข้างต้น - วิธีการที่เลวร้ายมากจะเมื่อเทียบกับแบบที่สมบูรณ์แบบ? H S , iHAHS,i
- ฉันกำหนดไว้ด้านบน - วิธีที่ดีมากที่จะเมื่อเทียบกับแบบเฉลี่ย? H S , iH0HS,i
- ต่างกัน- รัฐ "แตกต่างกันมาก" เมื่อเทียบกับ state ? k iHS,kki
ทีนี้สิ่งหนึ่งที่มองข้ามนี่คือความสัมพันธ์ระหว่างรัฐ - โครงสร้างนี้สันนิษฐานว่าการรู้อัตราการรอดชีวิตเฉลี่ยในรัฐหนึ่งจะไม่บอกอะไรคุณเกี่ยวกับอัตราการรอดชีวิตเฉลี่ยในอีกรัฐหนึ่ง แม้ว่าสิ่งนี้อาจดูเหมือน "ไม่ดี" แต่ก็ไม่ยากที่จะปรับปรุงและการคำนวณข้างต้นเป็นผลลัพธ์เริ่มต้นที่ดีซึ่งง่ายต่อการคำนวณ
การเพิ่มการเชื่อมต่อระหว่างรัฐจะเปลี่ยนโมเดลความน่าจะเป็นและคุณจะเห็น "การรวม" บางอย่างของเวลาการอยู่รอดเฉลี่ย วิธีหนึ่งที่จะรวมความสัมพันธ์เข้ากับการวิเคราะห์คือการแยกเวลาการเอาชีวิตรอดที่แท้จริงออกเป็นสองส่วนคือ "ส่วนทั่วไป" หรือ "แนวโน้ม" และ "ส่วนบุคคล":
Ti=T+Ui
จากนั้น จำกัด แต่ละส่วนให้มีค่าเฉลี่ยเป็นศูนย์เหนือหน่วยทั้งหมดและความแปรปรวนที่ไม่รู้จักที่จะรวมเข้าด้วยกันโดยใช้ก่อนอธิบายความรู้ที่คุณมีของความแปรปรวนของแต่ละบุคคลก่อนที่จะสังเกตข้อมูล (หรือ jeffreys ก่อนถ้าคุณ ไม่ต้องรู้อะไรเลยและครึ่งนึงถ้า jeffreys ทำให้เกิดปัญหา) σUiσ