คำถามติดแท็ก survival

การวิเคราะห์การเอาตัวรอดแบบจำลองเวลากับข้อมูลเหตุการณ์โดยทั่วไปแล้วเวลาถึงตายหรือเวลาที่ล้มเหลว ข้อมูลที่ถูกเซ็นเซอร์เป็นปัญหาทั่วไปสำหรับการวิเคราะห์เพื่อความอยู่รอด

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
หมายถึงเวลาการเอาชีวิตรอดสำหรับฟังก์ชันการเอาชีวิตรอดแบบล็อก - ปกติ
ฉันพบสูตรมากมายที่แสดงวิธีหาเวลาเฉลี่ยในการเอาชีวิตรอดสำหรับการแจกแจงแบบเลขชี้กำลังหรือ Weibull แต่ฉันโชคดีน้อยลงสำหรับฟังก์ชันการเอาชีวิตรอดแบบล็อก - ปกติ รับฟังก์ชั่นการอยู่รอดต่อไปนี้: S( t ) = 1 - ϕ [ ln( t ) - μσ]S(เสื้อ)=1-φ[LN⁡(เสื้อ)-μσ]S(t) = 1 - \phi \left[ {{{\ln (t) - \mu } \over \sigma }} \right] เราจะหาเวลารอดเฉลี่ยได้อย่างไร ตามที่ผมเข้าใจมันคือพารามิเตอร์ขนาดโดยประมาณและที่ exp ( ) จากรูปแบบการอยู่รอดพาราคือ\ในขณะที่ฉันคิดว่าฉันสามารถจัดการมันได้อย่างเป็นสัญลักษณ์เพื่อให้ได้ทั้งหมดหลังจากตั้งค่า S (t) = 0.5 สิ่งที่ทำให้ฉันนิ่งงันโดยเฉพาะคือวิธีจัดการในรูปแบบ R เมื่อมันเข้ามาเพื่อประเมินค่าทั้งหมดและได้รับ เวลาเฉลี่ยบีตาμσσ\sigmaββ\betaμμ\muφφ\phi ป่านนี้ฉันได้สร้างฟังก์ชันการอยู่รอด (และเส้นโค้งที่เกี่ยวข้อง) เช่น: …
10 survival 

2
วิธีการวิเคราะห์ ROC ใน R ด้วยโมเดล Cox
ฉันได้สร้างแบบจำลองการถดถอยของ Cox แล้วและฉันต้องการดูว่าแบบจำลองเหล่านี้ทำงานได้ดีเพียงใดและฉันคิดว่าบางที ROC-curve หรือ c-statistic อาจมีประโยชน์เหมือนกับที่บทความนี้ใช้: JN Armitage และ JH van der Meulen,” การระบุอาการป่วยในผู้ป่วยผ่าตัดโดยใช้ข้อมูลการบริหารกับ Royal College of ศัลยแพทย์ Charlson Score”, วารสาร British Journal of Surgery, Vol. 97, NUM 5, เอสเอส 772-781, Maj 2010 Armitage ใช้การถดถอยแบบโลจิสติกส์ แต่ฉันสงสัยว่าเป็นไปได้หรือไม่ที่จะใช้แบบจำลองจากแพ็กเกจการเอาตัวรอด SurvivalROCให้คำใบ้เกี่ยวกับความเป็นไปได้นี้ แต่ฉันไม่สามารถหาวิธีที่จะทำให้มัน ฉันจะขอบคุณถ้ามีคนจะแสดงให้ฉันเห็นวิธีการวิเคราะห์ ROC ในตัวอย่างนี้: library(survival) data(veteran) attach(veteran) surv <- Surv(time, status) fit …
10 r  survival  roc 

4
ภาพรวมเกี่ยวกับการวิเคราะห์การอยู่รอดและการวิเคราะห์ข้อมูลชีวิต
ฉันเคยได้ยินการวิเคราะห์ความอยู่รอดและการวิเคราะห์ข้อมูลชีวิต แต่ไม่ได้รับภาพรวม ฉันสงสัยว่าหัวข้อใดบ้างที่ครอบคลุม มันเป็นสถิติที่บริสุทธิ์หรือเพียงแค่ประยุกต์ใช้สถิติในบางพื้นที่ การวิเคราะห์วันที่ชีวิตเป็นส่วนหนึ่งของการวิเคราะห์การอยู่รอดหรือไม่? ขอบคุณและขอแสดงความนับถือ!

2
การทดสอบสมมติฐานเกี่ยวกับอันตรายตามสัดส่วนในโมเดลพาราเมตริก
ฉันตระหนักถึงการทดสอบสมมติฐานเกี่ยวกับอันตรายตามสัดส่วนในบริบทของโมเดล Cox PH แต่ฉันไม่พบสิ่งใดที่เกี่ยวข้องกับตัวแบบพารามิเตอร์ มีวิธีที่เป็นไปได้ในการทดสอบสมมติฐาน PH ของแบบจำลองพารามิเตอร์บางตัวหรือไม่? ดูเหมือนว่าควรมีรูปแบบพาราเมตริกที่มีความแตกต่างจากโมเดลกึ่งคอคส์เล็กน้อยเท่านั้น? ตัวอย่างเช่นถ้าฉันต้องการให้พอดีกับเส้นโค้งมรณะ Gompertz (ดังด้านล่าง) ฉันจะทดสอบสมมติฐาน PH ได้อย่างไร μxHx( t )Sx( t )= a bอีa x + βZ=∫เสื้อ0μx + tdt = b (อีที- 1 )อีa x + βZ= exp ( -Hx( T ) )μx=abeax+βZHx(t)=∫0tμx+tdt=b(eat−1)eax+βZSx(t)=exp(−Hx(t))\begin{align} \mu_{x}&=abe^{ax+\beta Z}\\ H_{x}(t)&=\int_{0}^{t}\mu_{x+t}\,dt=b(e^{at}-1)e^{ax+\beta Z}\\ S_{x}(t)&=\text{exp}(-H_{x}(t)) \end{align} ฉันคิดว่าโดยทั่วไปสิ่งที่ฉันขอคือ: สำหรับแบบจำลองการเอาตัวรอดแบบ Parametric วิธีใดบ้างในการประเมินความดีของแบบจำลองและการทดสอบสมมติฐาน …

2
วิธี coxph ของ R () จัดการกับมาตรการซ้ำ ๆ ได้อย่างไร?
บริบท ฉันพยายามที่จะเข้าใจว่า Rox coxph () ยอมรับและจัดการรายการซ้ำ ๆ สำหรับวิชา (หรือผู้ป่วย / ลูกค้าถ้าคุณต้องการ) บางคนเรียกรูปแบบยาวนี้บางคนเรียกว่า 'มาตรการซ้ำ' ดูตัวอย่างชุดข้อมูลที่มีคอลัมน์ ID ในส่วนคำตอบที่: แพ็คเกจที่ดีที่สุดสำหรับรุ่น Cox ที่แปรเปลี่ยนตามเวลา ยังถือว่าโควาเรียตมีการเปลี่ยนแปลงตลอดเวลาและมีตัวแปรเซ็นเซอร์หนึ่งตัว (เช่นเหตุการณ์) ซึ่งเป็นไบนารี คำถาม 1) ในคำตอบของลิงก์ด้านบนหาก ID ไม่ได้รับเป็นพารามิเตอร์ในการเรียกไปยัง coxph () ผลลัพธ์ควรเหมือนกับการรวม cluster (ID) เป็นพารามิเตอร์ใน coxph () หรือไม่? ฉันพยายามค้นหาเอกสาร แต่ดูเหมือนว่าจะไม่ได้ระบุที่อยู่อย่างชัดเจน (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html 2) ถ้าคำตอบของ (1) คือ 'ไม่' ดังนั้น (ทางคณิตศาสตร์) ทำไม? ดูเหมือนว่าคลัสเตอร์ () …

2
แนวโน้มอัตราการรอดชีวิตในกรณีศึกษาการควบคุม
ฉันส่งบทความที่ถูกปฏิเสธเนื่องจากวิธีการวิเคราะห์การเอาตัวรอดที่ไม่เหมาะสม ผู้ชี้ขาดไม่มีรายละเอียดหรือคำอธิบายอื่นใดนอกเหนือจาก: "การวิเคราะห์การเอาชีวิตรอดตามแนวโน้มเวลาต้องใช้วิธีการเซ็นเซอร์ที่ซับซ้อนยิ่งขึ้น" คำถาม: ความเสี่ยงส่วนเกินของการเสียชีวิตของผู้สูบบุหรี่ลดลงในทศวรรษที่ผ่านมาหรือไม่? ข้อมูล: ผู้สูบบุหรี่ 25,000 คนในเยอรมนี พวกเขาลงทะเบียนในการศึกษาในช่วงเวลาระหว่างปี 1995 และ 2014 แต่ละสูบบุหรี่ได้รับการจับคู่ (ในช่วงเวลาของการลงทะเบียน) กับเพศและอายุการจับคู่การควบคุมจากประชากรทั่วไป (ที่ไม่สูบบุหรี่) ฉันมีเวลาที่แน่นอนของการเสียชีวิตสำหรับทุกคนที่เสียชีวิตในช่วงระยะเวลาการศึกษาทั้งหมด คนที่ไม่ตายระหว่างการติดตามจะถูกเซ็นเซอร์ การศึกษานี้มีจุดประสงค์เพื่อตรวจสอบความเสี่ยงส่วนเกินของการเสียชีวิตของผู้สูบบุหรี่ในแต่ละปีตั้งแต่ปี 2538-2557 จุดมุ่งหมายคือการคำนวณ: อัตราอุบัติการณ์การเสียชีวิตของผู้สูบบุหรี่และผู้ไม่สูบบุหรี่ในแต่ละปีและตรวจสอบแนวโน้มเหล่านี้ ความเสี่ยงส่วนเกินของการเสียชีวิตในหมู่ผู้สูบบุหรี่ในแต่ละปี (หรือระยะเวลาไม่กี่ปีติดต่อกัน) ควรวิเคราะห์ข้อมูลอย่างไร จำได้ไหมว่าคนที่รวมอยู่ในปี 1998 อาจเสียชีวิตในปี 2558 แนวทางที่ถูกต้องในการใช้รูปแบบกระบวนการนับด้วยการเริ่มต้นและหยุดการอัปเดตสำหรับแต่ละปีหรือไม่ นี่คือวิธีการที่ผู้ตัดสินไม่ชอบ: อัตราอุบัติการณ์ถูกคำนวณโดยวิธีการปัวซงถดถอย เรารวมเวลาติดตามเป็นตัวชดเชยในโมเดลและรวมอายุเพศสถานะการสูบบุหรี่และช่วงเวลาตามปฏิทิน (รวมสองปีติดต่อกัน) เป็นตัวทำนายในโมเดล จากนั้นคำนวณอัตราต่อ 1,000 คนต่อปีโดยใช้ฟังก์ชั่นทำนาย () ของอาร์ระยะเวลาชดเชย (ติดตามผล) คือระยะเวลาการสังเกตทั้งหมดของบุคคล (วัน) จากการลงทะเบียน ใช้แบบจำลอง Cox เพื่อประเมินความเสี่ยงสัมพัทธ์สำหรับผู้สูบบุหรี่ในแต่ละช่วงเวลาตั้งแต่ต้นจนจบการศึกษา เพื่อความง่ายเราเปรียบเทียบอัตราส่วนอันตรายในช่วงแรกกับอัตราส่วนอันตรายในช่วงสุดท้าย ปัญหา: …

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
แบบจำลองเอฟเฟกต์แบบสุ่มที่จัดการความซ้ำซ้อน
ฉันกำลังพยายามจัดการกับการวิเคราะห์แบบเวลาต่อเหตุการณ์โดยใช้ผลลัพธ์ไบนารีซ้ำ ๆ สมมติว่าเวลาต่อเหตุการณ์ถูกวัดเป็นวัน แต่สำหรับช่วงเวลาที่เราแยกเวลาเป็นสัปดาห์ ฉันต้องการประมาณค่าประมาณของ Kaplan-Meier (แต่อนุญาตให้ covariates) โดยใช้ผลลัพธ์ไบนารีซ้ำ นี่จะดูเหมือนเป็นวงเวียนที่จะไป แต่ฉันกำลังสำรวจว่าสิ่งนี้ขยายไปสู่ผลลัพธ์ตามลำดับและเหตุการณ์ที่เกิดขึ้นซ้ำ ๆ หากคุณสร้างลำดับเลขฐานสองที่ดูเหมือนว่า 000 สำหรับคนที่ถูกเซ็นเซอร์ใน 3 สัปดาห์, 0000 สำหรับคนที่ถูกเซ็นเซอร์ที่ 4w และ 0000111111111111 .... สำหรับผู้ที่ล้มเหลวที่ 5w (1s ขยายไปถึงประเด็นที่เรื่องสุดท้ายเป็น ตามมาในการศึกษา) เมื่อคุณคำนวณสัดส่วนเฉพาะสัปดาห์ของ 1s คุณจะได้รับอุบัติการณ์สะสมตามปกติ (จนกว่าคุณจะได้รับเวลาตรวจสอบตัวแปรที่ซึ่งจะประมาณได้เฉพาะ แต่ไม่เท่ากับการประมาณอุบัติการณ์สะสมของ Kaplan-Meier) ฉันสามารถใส่การสังเกตแบบไบนารี่ซ้ำ ๆ กับแบบจำลองโลจิสติกไบนารีโดยใช้ GEE แทนที่จะทำให้เวลาไม่ต่อเนื่องเหมือนด้านบน แต่แทนที่จะใช้ spline ในเวลา ตัวประมาณความแปรปรวนร่วมของคลัสเตอร์แซนด์วิชทำงานได้ดีพอสมควร แต่ฉันต้องการได้ข้อสรุปที่แน่นอนมากขึ้นโดยใช้โมเดลเอฟเฟกต์แบบผสม ปัญหาคือว่า 1 หลังจาก 1 แรกซ้ำซ้อน ไม่มีใครรู้วิธีระบุเอฟเฟกต์แบบสุ่มหรือระบุรุ่นที่คำนึงถึงความซ้ำซ้อนเพื่อให้ข้อผิดพลาดมาตรฐานจะไม่ย่นหรือไม่ …

2
โค้ง Kaplan-Meier ดูเหมือนจะพูดอย่างอื่นนอกเหนือจากการถดถอย Cox
ใน R ฉันทำการวิเคราะห์ข้อมูลการอยู่รอดของผู้ป่วยมะเร็ง ฉันได้อ่านสิ่งที่มีประโยชน์มากเกี่ยวกับการวิเคราะห์การอยู่รอดใน CrossValidated และที่อื่น ๆ และคิดว่าฉันเข้าใจวิธีตีความผลการถดถอยของ Cox อย่างไรก็ตามผลหนึ่งยังคงบักฉัน ... ฉันกำลังเปรียบเทียบความอยู่รอดกับเพศ เส้นโค้ง Kaplan-Meier เป็นที่โปรดปรานอย่างชัดเจนของผู้ป่วยเพศหญิง (ฉันได้ตรวจสอบหลายครั้งว่าตำนานที่ฉันเพิ่มเข้ามานั้นถูกต้องผู้ป่วยที่มีชีวิตรอดสูงสุด 4856 วันเป็นผู้หญิงจริง ๆ ): และการถดถอยของ Cox ก็จะกลับมา: Call: coxph(formula = survival ~ gender, data = Clinical) n= 348, number of events= 154 coef exp(coef) se(coef) z Pr(>|z|) gendermale -0.3707 0.6903 0.1758 -2.109 0.035 * …

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

1
ML ประมาณค่าการแจกแจงเอ็กซ์โปเนนเชียล (พร้อมข้อมูลเซ็นเซอร์)
ในการวิเคราะห์การเอาตัวรอดคุณจะถือว่าเวลาการอยู่รอดของ rvมีการแจกแจงแบบเอ็กซ์โพเนนเชียล พิจารณาว่าตอนนี้ฉันมี "ผล" ของ IID RV ของx_iมีเพียงบางส่วนของผลลัพธ์เหล่านี้ที่จริงแล้ว "รับรู้เต็มที่" เช่นการสังเกตที่เหลือยังคง "มีชีวิตอยู่"XผมXiX_ix1, … ,xnx1,…,xnx_1,\dots,x_nXผมXiX_i ถ้าฉันต้องการทำการประมาณ ML สำหรับพารามิเตอร์ rateของการกระจายฉันจะใช้การสังเกตการณ์ที่ไม่ได้รับรู้ในลักษณะที่สอดคล้อง / เหมาะสมได้อย่างไร ฉันเชื่อว่าพวกเขายังคงมีข้อมูลที่เป็นประโยชน์สำหรับการประเมินλλ\lambda ใครช่วยแนะนำฉันเกี่ยวกับวรรณกรรมในหัวข้อนี้ ฉันแน่ใจว่ามันมีอยู่ อย่างไรก็ตามฉันมีปัญหาในการค้นหาคำหลัก / คำค้นหาที่ดีสำหรับหัวข้อ

2
วิธีการประเมินความดีของความพอดีสำหรับฟังก์ชั่นการเอาตัวรอด
ฉันเป็นนักวิเคราะห์การรอดชีวิตคนใหม่แม้ว่าฉันจะมีความรู้ในการจำแนกและการถดถอย สำหรับการถดถอยเรามีสถิติ MSE และ R กำลังสอง แต่เราจะบอกได้อย่างไรว่าแบบจำลองการเอาชีวิตรอด A นั้นเหนือกว่าแบบจำลองการเอาชีวิตรอด B นอกเหนือจากกราฟฟิค (KM curve) บางชนิด? หากเป็นไปได้โปรดอธิบายความแตกต่างด้วยตัวอย่าง (เช่น rpart package ใน R) คุณจะแสดงให้เห็นได้อย่างไรว่าต้นไม้การอยู่รอดของ CART หนึ่งต้นนั้นดีกว่าต้นไม้การอยู่รอดของ CART อีกต้น สามารถใช้การวัดใดได้บ้าง

1
วิธีการสร้างข้อมูลการอยู่รอดด้วยโควาเรียที่ขึ้นอยู่กับเวลาโดยใช้ R
ฉันต้องการสร้างเวลาการเอาชีวิตรอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ที่มีเวลาแปรปรวนร่วม รูปแบบคือ h(t|Xi)=h0(t)exp(γXi+αmi(t))h(t|Xi)=h0(t)exp⁡(γXi+αmi(t))h(t|X_i) =h_0(t) \exp(\gamma X_i + \alpha m_{i}(t)) ที่ถูกสร้างขึ้นจากทวินาม (1,0.5) และTXiXiX_imi(t)=β0+β1Xi+β2Xitmi(t)=β0+β1Xi+β2Xitm_{i}(t)=\beta_0 + \beta_1 X_{i} + \beta_2 X_{i} t ค่าพารามิเตอร์จริงถูกใช้เป็นγ=1.5,β0=0,β1=−1,β2=−1.5,h0(t)=1γ=1.5,β0=0,β1=−1,β2=−1.5,h0(t)=1\gamma = 1.5, \beta_0 = 0, \beta_1 = -1, \beta_2 = -1.5, h_0(t) = 1 สำหรับตัวแปรอิสระตามเวลา (เช่นฉันสร้างขึ้นดังนี้h(t|Xi)=h0(t)exp(γXi)h(t|Xi)=h0(t)exp⁡(γXi)h(t|X_i) =h_0(t) \exp(\gamma X_i) #For time independent case # h_0(t) = 1 gamma <- -1 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.