คำถามติดแท็ก cox-model

การถดถอยอันตรายตามสัดส่วนของ Cox เป็นวิธีกึ่งพารามิเตอร์สำหรับการวิเคราะห์การรอดชีวิต ไม่จำเป็นต้องสันนิษฐานว่าเป็นรูปแบบการกระจายเท่านั้นผลกระทบของการเพิ่มหนึ่งหน่วยในโควาเรียตคือค่าคงที่หลายค่า

5
การทำนายในการถดถอยแบบค็อกซ์
ฉันกำลังทำการถดถอยหลายตัวแปร Cox ฉันมีตัวแปรอิสระที่สำคัญและค่าเบต้า รูปแบบเหมาะสมกับข้อมูลของฉันได้เป็นอย่างดี ตอนนี้ฉันต้องการใช้แบบจำลองของฉันและทำนายความอยู่รอดของการสังเกตใหม่ ฉันไม่ชัดเจนว่าจะทำอย่างไรกับโมเดล Cox ในการถดถอยเชิงเส้นหรือแบบลอจิสติกมันจะง่ายเพียงแค่ใส่ค่าของการสังเกตใหม่ลงในการถดถอยและทวีคูณพวกมันด้วยเบตาดังนั้นผมจึงมีการทำนายผล ฉันจะตัดสินอันตรายพื้นฐานของฉันได้อย่างไร ฉันต้องการมันนอกเหนือจากการคำนวณการทำนาย สิ่งนี้ทำในรูปแบบ Cox ได้อย่างไร?

1
Cox Regression มีการแจกแจงแบบปัวซองหรือไม่?
ทีมเล็ก ๆ ของเรากำลังพูดคุยกันและติดอยู่ ไม่มีใครรู้ว่าการถดถอยของ Cox นั้นมีการแจกแจงแบบปัวซองหรือไม่ เรามีการถกเถียงกันว่าบางทีการถดถอยของค็อกซ์ที่มีความเสี่ยงเวลาคงที่จะมีความคล้ายคลึงกันกับการถดถอยปัวซองด้วยความแปรปรวนที่แข็งแกร่ง ความคิดใด ๆ

2
ในการวิเคราะห์ความอยู่รอดทำไมเราถึงใช้โมเดลกึ่งพารามิเตอร์ (Cox ที่เป็นอันตรายตามสัดส่วน) แทนที่จะเป็นโมเดลพาราเมตริกแบบเต็ม?
คำถามนี้ถูกย้ายจาก Mathematics Stack Exchange เพราะสามารถตอบได้ในการตรวจสอบข้าม อพยพ 6 ปีที่แล้ว ฉันได้ศึกษาโมเดลอันตรายของ Cox Proportional แล้วและคำถามนี้ได้ถูกคัดสรรมาเป็นส่วนใหญ่ Cox เสนอการปรับค่าสัมประสิทธิ์ของฟังก์ชั่น Hazard โดยใช้วิธีความน่าจะเป็นบางส่วน แต่ทำไมไม่เพียงแค่ปรับสัมประสิทธิ์ของฟังก์ชั่น Parametric Survival โดยใช้วิธีโอกาสสูงสุดและแบบจำลองเชิงเส้น? ในกรณีใด ๆ ที่คุณมีข้อมูลเซ็นเซอร์คุณสามารถหาพื้นที่ใต้เส้นโค้ง ตัวอย่างเช่นหากค่าประมาณของคุณคือ 380 โดยมีค่าเบี่ยงเบนมาตรฐานเท่ากับ 80 และตัวอย่างถูกเซ็นเซอร์> 300 ดังนั้นความน่าจะเป็น 84% สำหรับตัวอย่างนั้นในการคำนวณความน่าจะเป็นเป็นข้อผิดพลาดปกติ

1
อันตรายพื้นฐานของ Cox
สมมติว่าฉันมีชุดข้อมูล "สายสวนไต" ฉันกำลังพยายามสร้างโมเดลกราฟความอยู่รอดโดยใช้โมเดล Cox หากฉันพิจารณาโมเดล Cox:ฉันต้องมีการประเมินความเป็นอันตรายพื้นฐาน ด้วยการใช้ฟังก์ชั่นแพคเกจ R ฉันสามารถทำสิ่งนี้ได้อย่างง่ายดาย:h ( t , Z)) = h0ประสบการณ์( b'Z) ,ชั่วโมง(เสื้อ,Z)=ชั่วโมง0ประสบการณ์⁡(ข'Z),h(t,Z) = h_0 \exp(b'Z),survivalbasehaz() library(survival) data(kidney) fit <- coxph(Surv(time, status) ~ age , kidney) basehaz(fit) แต่ถ้าฉันต้องการเขียนฟังก์ชันทีละขั้นตอนของอันตรายพื้นฐานสำหรับการประมาณค่าพารามิเตอร์ที่กำหนดbฉันจะดำเนินการต่อได้อย่างไร ฉันเหนื่อย: bhaz <- function(beta, time, status, x) { data <- data.frame(time,status,x) data <- data[order(data$time), ] dt <- data$time …
20 r  cox-model  hazard 

2
อะไรคือค่า“
อะไรคือค่า ให้ไว้ในบทสรุปของโมเดล coxph ใน R ตัวอย่างเช่น,R2R2R^2 Rsquare= 0.186 (max possible= 0.991 ) ฉันรวมบทความต้นฉบับอย่างโง่เขลาเป็นค่าและผู้ตรวจสอบเพิ่มขึ้นโดยบอกว่าเขาไม่ได้ตระหนักถึงอนาล็อกของ สถิติจากการถดถอยเชิงเส้นแบบคลาสสิกที่พัฒนาขึ้นสำหรับโมเดล Cox และหากมีสิ่งใดสิ่งหนึ่งโปรด ให้การอ้างอิง ความช่วยเหลือใด ๆ จะดีมาก!R 2R2R2R^2R2R2R^2

1
เหตุใดค่า p จึงสูงขึ้นในโมเดลอันตรายตามสัดส่วนของ Cox มากกว่าในการถดถอยโลจิสติก
ฉันได้เรียนรู้เกี่ยวกับรูปแบบอันตรายตามสัดส่วนของค็อกซ์แล้ว ฉันมีจำนวนมากประสบการณ์ที่เหมาะสมรูปแบบการถดถอยโลจิสติกและเพื่อที่จะสร้างสัญชาตญาณของฉันได้รับการเปรียบเทียบรูปแบบให้พอดีกับการใช้coxphจาก R "อยู่รอด" ที่มีรูปแบบการถดถอยโลจิสติกพอดีใช้กับglmfamily="binomial" ถ้าฉันใช้รหัส: library(survival) s = Surv(time=lung$time, event=lung$status - 1) summary(coxph(s ~ age, data=lung)) summary(glm(status-1 ~ age, data=lung, family="binomial")) ฉันรับค่า p สำหรับอายุ 0.0419 และ 0.0254 ตามลำดับ ในทำนองเดียวกันถ้าฉันใช้เพศเป็นตัวทำนายโดยมีหรือไม่มีอายุ ฉันพบว่ามันทำให้งงเพราะฉันคิดว่าการใช้เวลาเป็นจำนวนมากเมื่อพิจารณาว่าแบบจำลองจะให้พลังงานทางสถิติมากกว่าการรักษาความตายเป็นผลลัพธ์ไบนารีในขณะที่ค่า p จะสอดคล้องกับที่มีกำลังทางสถิติน้อยลง เกิดขึ้นที่นี่คืออะไร?

3
สัมประสิทธิ์ตามเวลาใน R - จะทำอย่างไร?
อัปเดต : ขออภัยสำหรับการอัปเดตอื่น แต่ฉันพบวิธีแก้ปัญหาที่เป็นไปได้ด้วยพหุนามเศษส่วนและแพ็คเกจเสี่ยงการแข่งขันที่ฉันต้องการความช่วยเหลือ ปัญหา ฉันไม่สามารถหาวิธีง่าย ๆ ในการวิเคราะห์ค่าสัมประสิทธิ์เวลาได้ใน R ฉันต้องการให้สามารถใช้สัมประสิทธิ์ตัวแปรของฉันและทำมันเป็นค่าสัมประสิทธิ์ขึ้นอยู่กับเวลา (ไม่ใช่ตัวแปร) แล้วพล็อตการเปลี่ยนแปลงกับเวลา: βม. Y_ v a r i a b l e= β0+ β1∗ t + β2∗ t2. . .βม.Y_โวลต์aRผมaขล.อี=β0+β1* * * *เสื้อ+β2* * * *เสื้อ2...\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... การแก้ปัญหาที่เป็นไปได้ 1) การแยกชุดข้อมูล ฉันได้ดูตัวอย่างนี้ (Se ส่วนที่ 2 ของเซสชันแล็บ) แต่การสร้างชุดข้อมูลแยกต่างหากดูเหมือนซับซ้อนซับซ้อนคำนวณค่าใช้จ่ายและไม่ง่ายมาก ... 2) Reduced Rank models …

1
วิธีการตีความผลลัพธ์ของการทำนาย.coxph?
หลังจากติดตั้ง coxmodel เป็นไปได้ที่จะคาดการณ์และดึงความเสี่ยงสัมพัทธ์ของข้อมูลใหม่ สิ่งที่ฉันไม่เข้าใจคือวิธีคำนวณความเสี่ยงสัมพัทธ์สำหรับบุคคลและสิ่งที่สัมพันธ์กับ (เช่นค่าเฉลี่ยของประชากร) คำแนะนำใด ๆ สำหรับทรัพยากรที่จะช่วยให้เข้าใจ (ฉันไม่ได้ก้าวหน้ามากในการวิเคราะห์การเอาชีวิตรอด

3
โมเดล Cox เทียบกับการถดถอยโลจิสติก
สมมติว่าเราได้รับปัญหาต่อไปนี้: ทำนายว่าลูกค้ารายใดที่มีแนวโน้มจะหยุดซื้อในร้านของเราในอีก 3 เดือนข้างหน้า สำหรับลูกค้าแต่ละรายเรารู้ว่าเดือนใดที่ลูกค้าเริ่มซื้อสินค้าในร้านของเราและนอกจากนี้เรายังมีคุณสมบัติด้านพฤติกรรมหลายอย่างในการรวบรวมรายเดือน ลูกค้า 'คนโต' ซื้อมาแล้วห้าสิบเดือน มาแสดงเวลาตั้งแต่ลูกค้าเริ่มซื้อโดย ( ) สามารถสันนิษฐานได้ว่าจำนวนลูกค้ามีขนาดใหญ่มาก หากลูกค้าหยุดซื้อเป็นเวลาสามเดือนจากนั้นกลับมาเขาจะถือว่าเป็นลูกค้าใหม่เพื่อให้เหตุการณ์ (หยุดซื้อ) สามารถเกิดขึ้นได้เพียงครั้งเดียวt ∈ [ 0 , 50 ]tttt∈[0,50]t∈[0,50]t \in [0, 50] การแก้ปัญหาสองข้อนั้นอยู่ในใจของฉัน: การถดถอยแบบลอจิสติก - สำหรับลูกค้าแต่ละรายและในแต่ละเดือน (อาจยกเว้น 3 เดือนล่าสุด) เราสามารถพูดได้ว่าลูกค้าหยุดซื้อหรือไม่ดังนั้นเราสามารถทำการสุ่มตัวอย่างด้วยการสังเกตหนึ่งครั้งต่อลูกค้าและเดือน เราสามารถใช้จำนวนเดือนนับตั้งแต่เริ่มต้นเป็นตัวแปรเด็ดขาดเพื่อรับฟังก์ชั่นความอันตรายพื้นฐานบางอย่าง Extended Cox model - ปัญหานี้สามารถจำลองได้ด้วยการใช้ Extended Cox model ดูเหมือนว่าปัญหานี้เหมาะกับการวิเคราะห์เพื่อความอยู่รอด คำถาม:อะไรคือข้อดีของการวิเคราะห์การอยู่รอดในปัญหาที่คล้ายกัน? การวิเคราะห์การอยู่รอดถูกคิดค้นขึ้นด้วยเหตุผลบางอย่างดังนั้นจะต้องมีข้อได้เปรียบที่ร้ายแรงบางอย่าง ความรู้ของฉันในการวิเคราะห์การเอาชีวิตรอดนั้นไม่ลึกมากและฉันคิดว่าข้อดีที่เป็นไปได้มากที่สุดของโมเดล Cox สามารถทำได้โดยใช้การถดถอยโลจิสติก รูปแบบค็อกซ์เทียบเท่าสามารถแบ่งชั้นได้โดยใช้การโต้ตอบของและตัวแปรแบ่งชั้น ttt แบบจำลองปฏิสัมพันธ์ …

3
ตัวเลือกในรูปแบบการถดถอยความเป็นอันตรายแบบสัดส่วนเมื่อส่วนที่เหลือของ Schoenfeld ไม่ดีมีอะไรบ้าง
ฉันกำลังทำการถดถอยแบบอันตรายตามสัดส่วนของ Cox ในการใช้ R coxphซึ่งรวมถึงตัวแปรจำนวนมาก ส่วนที่เหลือ Martingale ดูดีและส่วนที่เหลือ Schoenfeld นั้นยอดเยี่ยมสำหรับเกือบทุกตัวแปร มีสามตัวแปรที่มี Schoenfeld ส่วนที่เหลือไม่แบนและลักษณะของตัวแปรนั้นมันทำให้รู้สึกว่าพวกเขาอาจแตกต่างกันไปตามเวลา นี่คือตัวแปรที่ฉันไม่สนใจจริง ๆ ดังนั้นการทำให้เป็นชั้นจะดี อย่างไรก็ตามพวกเขาทั้งหมดเป็นตัวแปรต่อเนื่องไม่ใช่ตัวแปรเด็ดขาด ดังนั้นฉันจึงเข้าใจชั้นที่จะไม่เป็นเส้นทาง * ฉันได้ลองสร้างปฏิสัมพันธ์ระหว่างตัวแปรและเวลาตามที่อธิบายไว้ที่นี่แต่เราได้รับข้อผิดพลาด: In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge ฉันทำงานกับจุดข้อมูลเกือบ 1,000 จุดและทำงานกับตัวแปรครึ่งโหลด้วยหลาย ๆ ปัจจัยแต่ละตัวดังนั้นจึงรู้สึกเหมือนว่าเรากำลังผลักดันขีด จำกัด ของวิธีที่ข้อมูลนี้จะถูกหั่นและหั่นเป็นลูกเต๋า โชคไม่ดีโมเดลที่เรียบง่ายทั้งหมดที่ฉันได้ลองด้วยตัวแปรที่รวมอยู่น้อยกว่านั้นแย่ลงอย่างชัดเจน ตัวเลือกของฉันคืออะไร? เนื่องจากฉันไม่สนใจเกี่ยวกับตัวแปรที่มีพฤติกรรมแย่ ๆ …

3
จะได้รับการทำนายในแง่ของเวลาการเอาชีวิตรอดจากโมเดล Cox PH ได้อย่างไร
ฉันต้องการพัฒนาแบบจำลองการทำนาย (Cox PH) สำหรับการเสียชีวิตแบบทุกสาเหตุในชุดข้อมูลของผู้เข้าร่วมซึ่งเกือบทุกคนเสียชีวิตเมื่อสิ้นสุดการติดตาม (เช่น 1 ปี) แทนที่จะทำนายความเสี่ยงที่แน่นอนของการตายในเวลาหนึ่งฉันต้องการทำนายเวลาการอยู่รอด (เป็นเดือน) สำหรับแต่ละคน เป็นไปได้หรือไม่ที่จะได้รับการทำนายเช่นนี้ใน R (จากเช่น coxph-object) และถ้าใช่ฉันจะทำเช่นนั้นได้อย่างไร? ขอบคุณมากล่วงหน้า!

2
การตีความและการตรวจสอบความถูกต้องของรูปแบบการถดถอยอันตรายตามสัดส่วนของ Cox โดยใช้ R เป็นภาษาอังกฤษแบบธรรมดา
มีใครช่วยอธิบายโมเดล Cox ของฉันให้ฉันฟังเป็นภาษาอังกฤษธรรมดาได้ไหม ฉันติดตั้งโมเดลการถดถอยของ Cox ต่อไปนี้กับข้อมูลทั้งหมดของฉันโดยใช้cphฟังก์ชั่น Dataข้อมูลของฉันจะถูกบันทึกไว้ในวัตถุที่เรียกว่า ตัวแปรw, xและyมีความต่อเนื่อง zเป็นปัจจัยสองระดับ เวลามีหน่วยวัดเป็นเดือน ผู้ป่วยบางรายของฉันขาดข้อมูลสำหรับตัวแปรz( หมายเหตุ : ฉันได้ระบุไว้อย่างชัดเจนว่าคำแนะนำของดร. ฮาร์เรลด้านล่างนี้ว่าฉันใส่ค่าเหล่านี้เพื่อหลีกเลี่ยงการทำให้ลำเอียงแบบของฉันและจะทำในอนาคต) > fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12) Cox Proportional Hazards Model …

3
เครื่องสามารถใช้โมเดลการเรียนรู้ของเครื่อง (GBM, NN และอื่น ๆ ) สำหรับการวิเคราะห์การอยู่รอดได้อย่างไร
ฉันรู้ว่าแบบจำลองทางสถิติแบบดั้งเดิมเช่น Cox Proportional Hazards Regression & แบบจำลอง Kaplan-Meier บางอย่างสามารถใช้ในการทำนายวันจนกว่าเหตุการณ์ที่จะเกิดขึ้นต่อไปจะบอกว่าล้มเหลว ฯลฯ เช่นการวิเคราะห์การอยู่รอด คำถาม การถดถอยของโมเดลการเรียนรู้ของเครื่องเช่น GBM, โครงข่ายใยประสาทเทียม ฯลฯ สามารถใช้ในการทำนายวันจนถึงเหตุการณ์ได้อย่างไร? ฉันเชื่อว่าการใช้วันจนกว่าจะเกิดขึ้นเป็นตัวแปรเป้าหมายและการใช้โมเดลการถดถอยจะไม่ทำงาน ทำไมมันไม่ทำงานและจะแก้ไขอย่างไร เราสามารถแปลงปัญหาการวิเคราะห์การเอาชีวิตรอดเป็นการจัดประเภทแล้วได้รับความน่าจะเป็นของการอยู่รอดได้หรือไม่? ถ้าเช่นนั้นจะสร้างตัวแปรเป้าหมายไบนารีได้อย่างไร? ข้อดีและข้อเสียของวิธีการเรียนรู้ของเครื่องเทียบกับการถดถอยอันตรายของ Cox Proportional & รุ่น Kaplan-Meier ฯลฯ คืออะไร? ลองนึกภาพข้อมูลตัวอย่างอินพุตเป็นรูปแบบด้านล่าง บันทึก: เซ็นเซอร์ส่ง Ping ข้อมูลในช่วงเวลา 10 นาที แต่ในบางครั้งข้อมูลอาจหายไปเนื่องจากปัญหาเครือข่าย ฯลฯ ตามที่แสดงโดยแถวที่มี NA var1, var2, var3 เป็นตัวทำนายตัวแปรอธิบาย failure_flag บอกว่าเครื่องล้มเหลวหรือไม่ เรามีข้อมูล 6 เดือนล่าสุดทุก ๆ …

2
คำอธิบายของคนธรรมดาเกี่ยวกับการเซ็นเซอร์ในการวิเคราะห์การเอาตัวรอด
ฉันได้อ่านเกี่ยวกับการเซ็นเซอร์ว่ามันคืออะไรและมันจำเป็นต้องนำมาใช้ในการวิเคราะห์การอยู่รอด แต่ฉันต้องการที่จะได้ยินคำจำกัดความทางคณิตศาสตร์ของมันน้อยลง ทุกคนสามารถให้คำอธิบายแก่ฉันเกี่ยวกับ 1) การเซ็นเซอร์และ 2) มันมีผลอย่างไรกับเส้นโค้ง Kaplan-Meier และการถดถอยของ Cox

1
การติดตั้ง Cox-model กับ strata และ strata-covariate
ในกลยุทธ์การสร้างแบบจำลองการถดถอยโดย Harrell (รุ่นที่สอง) มีส่วน (S. 20.1.7) ที่กล่าวถึงโมเดล Cox รวมถึงการทำงานร่วมกันระหว่าง covariate ที่มีผลกระทบหลักต่อการอยู่รอดเราต้องการประเมินเช่นกัน (อายุในตัวอย่างด้านล่าง) และ covariate ที่มีเอฟเฟกต์หลักที่เราไม่ต้องการประเมิน (เพศในตัวอย่างด้านล่าง) เป็นรูปธรรม: สมมติว่าในความเป็นอันตราย (ไม่ทราบจริง)ตามแบบจำลองh(t)h(t)h(t) h(t)={hf(t)exp(β1age),hm(t)exp((β1+β2)age),for female patiensfor male patiensh(t)={hf(t)exp⁡(β1age),for female patienshm(t)exp⁡((β1+β2)age),for male patiensh(t) = \begin{cases} h_f(t) \exp(\beta_1 \textrm{age}), & \textrm{for female patiens} \\ h_m(t) \exp((\beta_1 + \beta_2) \textrm{age}), & \textrm{for male patiens} \end{cases} โดยที่ ,ไม่เป็นความจริงจริงไม่ควรประเมินฟังก์ชั่นอันตรายพื้นฐานและ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.