อะไรคือค่า“


18

อะไรคือค่า ให้ไว้ในบทสรุปของโมเดล coxph ใน R ตัวอย่างเช่น,R2

Rsquare= 0.186   (max possible= 0.991 )

ฉันรวมบทความต้นฉบับอย่างโง่เขลาเป็นค่าและผู้ตรวจสอบเพิ่มขึ้นโดยบอกว่าเขาไม่ได้ตระหนักถึงอนาล็อกของ สถิติจากการถดถอยเชิงเส้นแบบคลาสสิกที่พัฒนาขึ้นสำหรับโมเดล Cox และหากมีสิ่งใดสิ่งหนึ่งโปรด ให้การอ้างอิง ความช่วยเหลือใด ๆ จะดีมาก!R 2R2R2


1
ในสถานการณ์ส่วนใหญ่ที่แนวคิดของถูกขยายออกไปมากกว่าการถดถอยเชิงเส้นแบบดั้งเดิมมันเป็นความสัมพันธ์กำลังสองระหว่างค่าที่สังเกตได้กับค่าที่ทำนายไว้ภายใต้ตัวแบบ อาจเป็นไปได้ที่จะใช้ที่นี่? R2
มาโคร

2
ไม่มันไม่เกี่ยวข้องกับเรื่องนั้น
Frank Harrell

คำตอบ:


15

การใช้getS3method("summary","coxph")คุณสามารถดูวิธีคำนวณได้

บรรทัดรหัสที่เกี่ยวข้องมีดังต่อไปนี้:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

นี่cox$loglikคือ "เวกเตอร์ของความยาว 2 ที่มีบันทึกความน่าจะเป็นที่มีค่าเริ่มต้นและค่าสุดท้ายของสัมประสิทธิ์" (ดู?coxph.object) และcox$nเป็น "จำนวนการสังเกตที่ใช้ในแบบพอดี"


5
ถ้าฉันไม่ผิดนี่คือ Cox & Snell หลอก R-squared สำหรับคำอธิบายและเปรียบเทียบต่างๆหลอก R-squareds ดูats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm
onestop

4

หารด้วยจำนวนของการสังเกตในบทสรุปของที่ไม่ถูกต้องก็ควรจะจำนวนของเหตุการณ์วาบนั้น ดู O'Quigley และคณะ (2005) การสุ่มแบบอธิบายได้ในแบบจำลองความเป็นอันตรายตามสัดส่วนสถิติการแพทย์หน้า 479-489ncoxph


4
ไม่ถูกต้องคุณหารด้วยจำนวนการสังเกตไม่ว่าจะฟังดูแปลก สำหรับคำถามดั้งเดิมมันแปลกที่ผู้ตรวจสอบจะไม่ตระหนักถึงสิ่งที่อยู่รอบตัว 20 ปีสำหรับโมเดล Cox
Frank Harrell

การเพิ่มการแลกเปลี่ยนระหว่าง Ronghui Xu และ @ Frank Harrell ไม่เพียง แต่จะทำให้ `` ฟังดูแปลก '' โดยหารด้วยจำนวนการสังเกต แต่มันไม่ทำงาน หากต้องการดูสิ่งนี้ให้พิจารณาเบต้าคงที่ที่ค่าบางค่าโดยประมาณ E (R2) = 0.5 และการกระจาย covariate เดียวกันนั่นคือทุกอย่างเหมือนกันนอกเหนือจากข้อเท็จจริงที่ว่าการศึกษา 1 มีอัตราการเซ็นเซอร์เป็นสองเท่าของการศึกษา 2 แม้ว่าเราควรจะประมาณปริมาณประชากรเท่ากัน แต่การประมาณ R2 ในการศึกษา 1 จะประมาณครึ่งหนึ่งของการศึกษาที่ 2 โดยไม่คำนึงถึงขนาดของตัวอย่าง แทนที่จะเป็น 0.5 เราจะได้ประมาณ 0.25

จอห์นมันจะคุ้มค่าหากให้การจำลอง R เล็กน้อยเพื่อแสดงว่า โอกาสในการเข้าสู่ระบบเป็นโมฆะก็เปลี่ยนไปใช่ไหม - อาจชดเชยผลกระทบที่คุณอธิบาย ไม่ว่าจะเป็นแนวทั่วไปR2เรามีข้อบกพร่องในบางวิธีหรือไม่ใช้อย่างมากและมีทฤษฎีบางอย่างที่สนับสนุนการตั้งค่าที่แปลก
Frank Harrell

ในการตอบข้อสังเกตของ Frank ฉันจะยอมรับว่าสิ่งนี้ไม่ตรงไปตรงมาและการสังเกตของ Frank เกี่ยวกับความเป็นไปได้ในการบันทึกที่ไม่ถูกต้อง ฉันเคยดูปริมาณนี้เป็นการประมาณค่าประมาณที่สอดคล้องกันของปริมาณประชากรที่กำหนดไว้อย่างดีจากการได้รับข้อมูล บทความที่อ้างถึงโดย Ronghui Xu ดำเนินการจำลองสถานการณ์ สิ่งเหล่านี้แสดงให้เห็นถึงผลกระทบของการเซ็นเซอร์แม้ว่าจะไม่หายไป แต่จะอ่อนแอกว่าเมื่อเราแบ่งตามจำนวนความล้มเหลวมากกว่าจำนวนการสังเกตทั้งหมด

1
จอห์นคุณและ Ronghui จะบอกเราว่าคุณต้องการวัดอะไรในปัจจุบัน? ฉันกำลังมองหาส่วนของการสุ่มที่อธิบายซึ่งไม่ขึ้นกับการแจกเซ็นเซอร์R2ในแบบจำลองเชิงเส้นและมีคู่ที่พร้อมสำหรับการถดถอยโลจิสติก ในที่สุดฉันก็อ่านกระดาษ 2005 ที่ยอดเยี่ยมของคุณ - เป็นงานที่ดี
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.