คำถามติดแท็ก survival

การวิเคราะห์การเอาตัวรอดแบบจำลองเวลากับข้อมูลเหตุการณ์โดยทั่วไปแล้วเวลาถึงตายหรือเวลาที่ล้มเหลว ข้อมูลที่ถูกเซ็นเซอร์เป็นปัญหาทั่วไปสำหรับการวิเคราะห์เพื่อความอยู่รอด

2
การวิเคราะห์การอยู่รอดที่ไม่สามารถใช้ข้อมูลแปรปรวนร่วมกับ covariates ได้
ฉันกำลังดูเวลาที่ผู้พิพากษาต้องการในการตัดสินใจ ผู้ตัดสินแต่ละคนประเมินจำนวนผู้สมัครและสามารถอนุมัติหรือไม่อนุมัติใบสมัคร คดีนี้จะสิ้นสุดลงเมื่อผู้พิพากษาแสดงรายงานซึ่งอาจมีบางเวลาหลังจากการพิจารณาคดี หลายกรณียังคงเปิดให้บริการเมื่อสิ้นสุดระยะเวลาการศึกษา ฉันต้องการที่จะประเมินเวลาเฉลี่ยที่จำเป็นสำหรับกรณีที่จะย้ายผ่านระบบ นอกจากนี้ฉันต้องการดูว่ากรณีที่ถูกปฏิเสธใช้เวลานานกว่ากรณีที่ได้รับการอนุมัติ (ผู้พิพากษาดูเหมือนจะใช้เวลานานในการเขียนรายงานของพวกเขาในที่สุดพวกเขาล้มเหลวในการอนุมัติหรือค้นหาเอกสารเพิ่มเติม) เห็นได้ชัดว่าฉันไม่ทราบว่ากรณีที่ยังคงเปิดเมื่อการศึกษาสิ้นสุดลงจะได้รับการอนุมัติหรือไม่ดังนั้น covariate (อนุมัติ / ไม่อนุมัติ) จะถูกตรวจสอบพร้อมกับข้อมูล มีอะไรที่ฉันสามารถทำได้เกี่ยวกับเรื่องนี้?
9 survival 

1
โครงสร้างของข้อมูลและการเรียกใช้ฟังก์ชันสำหรับข้อมูลเหตุการณ์ที่เกิดซ้ำพร้อมตัวแปรขึ้นอยู่กับเวลา
ฉันกำลังพยายามประเมินผลของยา 2 ชนิด ( drug1, drug2) ต่อโอกาสที่ผู้ป่วยจะตกลงมา ( event) ผู้ป่วยสามารถล้มได้มากกว่าหนึ่งครั้งและสามารถวางหรือถอดออกจากยาเสพติดได้ทุกจุด คำถามของฉันคือวิธีการจัดโครงสร้างข้อมูลโดยคำนึงถึงช่วงเวลา (วัน) โดยเฉพาะอย่างยิ่งว่าต้องมีการทับซ้อนกันระหว่างวันหรือไม่ Nมีสองเหตุผลที่ว่าทำไมผมคิดว่าโครงสร้างของฉันคือผิดเป็นครั้งแรกเป็นที่ไม่ถูกต้องดูเหมือน นอกจากนี้ผมยังได้รับข้อผิดพลาดบางช่วงเวลาที่เป็นวันเดียว (เช่นtime1=4, time2=4) และนไม่แน่ใจว่าวิธีการเหล่านี้ควรได้รับการเข้ารหัส เวลาเริ่มต้นของรายการถัดไปควรเป็นเวลาหยุดของรายการก่อนหน้าหรือไม่ ฉันได้ลองทั้งสองวิธี (โดยมีและไม่มีทับซ้อนกัน) และในขณะที่การทับซ้อนกันได้รับการกำจัดคำเตือนNก็ยังไม่ถูกต้อง Warning message: In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53, : Stop time must be > start time, NA created …
9 r  survival  cox-model 

1
การวิเคราะห์การอยู่รอดสำหรับการทำนายเหตุการณ์
สำหรับแต่ละระเบียนในชุดข้อมูลของฉันฉันมีข้อมูลต่อไปนี้ (X1 ,… ,Xm ,δ ,T )(X1 ,… ,Xm ,δ ,T ) (X_1 \ , \dots \ , X_m \ , \delta \ , T \ ) ที่ไหน XiXiX_i เป็นคุณสมบัติ δδ\delta คือ 1 ถ้าเหตุการณ์เป้าหมายเกิดขึ้นและ 0 เป็นอย่างอื่นและ TTTเป็นเวลาประทับของเหตุการณ์ที่เกิดขึ้น โดยเฉพาะอย่างยิ่ง,TTT อาจหายไปหากไม่มีเหตุการณ์หรือตั้งเวลาให้ติดตามผลสิ้นสุด ฉันต้องการคำนวณดัชนีความเสี่ยงสำหรับแต่ละระเบียนในชุดข้อมูลของฉัน ฉันคิดว่าจะใช้รูปแบบการจำแนกประเภทที่ใช้คุณสมบัติต่างๆ XiXiX_i เพื่อทำนายชั้นเรียน δδ\delta. อย่างไรก็ตามTTT เป็นสิ่งสำคัญ: ถ้าเหตุการณ์ δδ\delta มีแนวโน้มที่จะเกิดขึ้นในไม่ช้าความเสี่ยงควรสูงขึ้น นั่นคือเหตุผลที่การวิเคราะห์ความอยู่รอดควรเหมาะสำหรับปัญหานี้ …

2
เซ็นเซอร์ช่วงแบบ Cox ตามสัดส่วนความเป็นอันตรายใน R
เมื่อกำหนดช่วงเวลาการเอาตัวรอดให้ถูกต้องฉันจะทำการจำลอง Cox PH แบบช่วงเซ็นเซอร์ได้Rอย่างไร การค้นหา rseek จะเปิดแพ็คเกจintcoxซึ่งไม่มีอยู่ในที่Rเก็บอีกต่อไป ฉันเกือบจะเป็นบวกcoxphฟังก์ชั่นในsurvivalแพ็คเกจไม่สามารถจัดการกับข้อมูลการรอดชีวิตแบบเซ็นเซอร์ นอกจากนี้ฉันไม่ต้องการใส่ข้อมูลแล้วใช้coxphฟังก์ชัน วิธีนี้จะประเมินข้อผิดพลาดมาตรฐานต่ำกว่าค่าสัมประสิทธิ์เนื่องจากคุณไม่สนใจความไม่แน่นอนของการเซ็นเซอร์ช่วงเวลา

2
จะทำการทดสอบ Wilcoxon ได้รับการจัดอันดับสำหรับข้อมูลการอยู่รอดใน R ได้อย่างไร?
สมมติว่าคุณมีข้อมูลการอยู่รอดเช่นนี้: obs <- data.frame( time = c(floor(runif(100) * 30), floor((runif(100)^2) * 30)), status = c(rbinom(100, 1, 0.2), rbinom(100, 1, 0.7)), group = gl(2,100) ) ในการทำการทดสอบการจัดอันดับบันทึกมาตรฐานหนึ่งสามารถใช้ survdiff(Surv(time, status) ~ group, data = obs, rho = 0) ขวา? แต่แล้วการทดสอบอื่น ๆ ล่ะ? คุณจะทำการทดสอบระดับเซ็นชื่อของวิลคอกซัน, การทดสอบเปโตหรือการทดสอบเฟลมิง - แฮร์ริงตันได้อย่างไร R มีความเป็นไปได้ที่จะทำการทดสอบ Wilcoxonแต่ฉันไม่พบวิธีที่จะให้การตรวจสอบมีการพิจารณา นอกจากนี้หมอระบุว่าการตั้งค่าrho = 1จะทำให้การทดสอบ "การเปลี่ยนแปลง …

1
พล็อตการทำนายที่แตกต่างจาก coxph การอยู่รอดและ rms cph
ฉันได้สร้างตัวเองรุ่นของฉันเพิ่มขึ้นเล็กน้อยจาก termplot ที่ฉันใช้ในตัวอย่างนี้คุณสามารถค้นหาได้ที่นี่ ฉันโพสต์ก่อนหน้านี้บนSOแต่ยิ่งฉันคิดเกี่ยวกับมันมากขึ้นฉันเชื่อว่านี่อาจเกี่ยวข้องกับการตีความของโมเดลอันตราย Cox Proportional มากกว่าการเข้ารหัสจริง ปัญหา เมื่อฉันมองไปที่พล็อตอัตราส่วนอันตรายผมคาดว่าจะมีจุดอ้างอิงที่ช่วงความเชื่อมั่นตามธรรมชาติคือ 0 และเป็นกรณีนี้เมื่อฉันใช้ CPH () จากrms packageแต่ไม่เมื่อฉันใช้ coxph (ที่) survival packageจาก พฤติกรรมที่ถูกต้องโดย coxph () และถ้าเป็นเช่นนั้นจุดอ้างอิงคืออะไร? นอกจากนี้ตัวแปรดัมมี่ใน coxph () มีช่วงเวลาและค่าอื่นที่ไม่ใช่e0e0e^0? ตัวอย่าง นี่คือรหัสทดสอบของฉัน: # Load libs library(survival) library(rms) # Regular survival survobj <- with(lung, Surv(time,status)) # Prepare the variables lung$sex <- factor(lung$sex, levels=1:2, labels=c("Male", …
9 r  survival  cox-model 

3
วิธีตรวจสอบอัตราความผิดพลาดต่ำมาก
ฉันเผชิญกับการพยายามสาธิตผ่านการทดสอบอัตราความผิดพลาดต่ำมากสำหรับเซ็นเซอร์ (ไม่เกิน 1 ข้อผิดพลาดใน 1,000,000 ครั้ง) เรามีเวลา จำกัด ในการดำเนินการทดสอบดังนั้นเราคาดว่าจะไม่สามารถได้รับมากกว่า 4,000 ครั้ง ฉันเห็นว่าไม่มีปัญหาในการแสดงเซ็นเซอร์ไม่เป็นไปตามข้อกำหนดเนื่องจากแม้แต่ข้อผิดพลาดเพียงครั้งเดียวในความพยายาม 4,000 ครั้งจะให้ช่วงความมั่นใจ 95% สำหรับอัตราข้อผิดพลาดที่มีขีด จำกัด ล่างมากกว่า 0.000001 แสดงว่ามันเป็นไปตามข้อกำหนด แต่เป็นปัญหาเนื่องจากแม้แต่ 0 ข้อผิดพลาดในความพยายาม 4,000 ครั้งยังคงส่งผลให้ขอบเขตล่างมากกว่า 0.000001 ข้อเสนอแนะใด ๆ ที่จะได้รับการชื่นชมอย่างมาก.

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
การถดถอยของ Cox และมาตราส่วนเวลา
ตัวแปร X (อันตราย) ในการวิเคราะห์การถดถอยอันตรายตามสัดส่วนที่คอคส์ต้องมีเวลาหรือไม่? ถ้าไม่คุณช่วยยกตัวอย่างได้ไหม อายุของผู้ป่วยมะเร็งสามารถเป็นตัวแปรอันตรายได้หรือไม่? ถ้าเป็นเช่นนั้นจะตีความได้ว่าเป็นความเสี่ยงของการเป็นมะเร็งในบางช่วงอายุได้หรือไม่? การถดถอยของ Cox จะเป็นการวิเคราะห์ที่ถูกต้องหรือไม่เพื่อศึกษาความสัมพันธ์ระหว่างการแสดงออกของยีนและอายุ

2
ฉันจะตัดสินได้อย่างไรว่าโมเดลการเอาตัวรอดที่มีข้อมูลหายไปเหมาะสมหรือไม่
ฉันมีบันทึกประมาณล้านรายการที่บันทึกเวลาเข้าและเวลาออกของผู้คนในระบบซึ่งครอบคลุมประมาณสิบปี ทุกเรคคอร์ดมีเวลาเข้า แต่ไม่ใช่ทุกเรคคอร์ดมีเวลาออก เวลาเฉลี่ยในระบบคือ ~ 1 ปี เวลาทางออกที่หายไปเกิดขึ้นด้วยเหตุผลสองประการ: บุคคลไม่ได้ออกจากระบบในเวลาที่ข้อมูลถูกจับ ไม่ได้บันทึกเวลาออกของบุคคลนั้น เรื่องนี้เกิดขึ้นกับ 50% ของบันทึก คำถามที่น่าสนใจคือ: มีคนใช้เวลาน้อยลงในระบบและเวลาน้อยลง มีการบันทึกเวลาออกที่มากขึ้นและจำนวนเท่าไหร่ เราสามารถทำแบบนี้โดยบอกว่าความน่าจะเป็นที่ทางออกได้รับการบันทึกแตกต่างกันไปตามเวลาและเวลาในระบบมี Weibull ซึ่งพารามิเตอร์ต่างกันไปตามเวลา จากนั้นเราสามารถทำการประเมินความน่าจะเป็นสูงสุดของพารามิเตอร์ต่างๆและลูกตาผลลัพธ์และเห็นว่าน่าเชื่อถือ เราเลือกการแจกแจงแบบ Weibull เพราะดูเหมือนว่าจะใช้ในการวัดอายุการใช้งานและสนุกที่จะพูดเมื่อเทียบกับการปรับให้เหมาะสมกับข้อมูลที่ดีกว่าการบอกว่าเป็นการกระจายแกมม่า ฉันควรหาเบาะแสว่าจะทำอย่างไรให้ถูกต้อง? เราค่อนข้างเข้าใจทางคณิตศาสตร์ แต่ไม่เข้าใจสถิติอย่างมาก
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.