คำถามติดแท็ก survival

การวิเคราะห์การเอาตัวรอดแบบจำลองเวลากับข้อมูลเหตุการณ์โดยทั่วไปแล้วเวลาถึงตายหรือเวลาที่ล้มเหลว ข้อมูลที่ถูกเซ็นเซอร์เป็นปัญหาทั่วไปสำหรับการวิเคราะห์เพื่อความอยู่รอด

1
คำถามพื้นฐานเกี่ยวกับการวิเคราะห์การเอาชีวิตรอดแบบไม่ต่อเนื่อง
ฉันพยายามวิเคราะห์การรอดชีวิตแบบไม่ต่อเนื่องโดยใช้แบบจำลองการถดถอยแบบโลจิสติกส์และฉันไม่แน่ใจว่าฉันเข้าใจกระบวนการทั้งหมดอย่างสมบูรณ์ ฉันขอขอบคุณสำหรับความช่วยเหลืออย่างมากกับคำถามพื้นฐานสองสามข้อ นี่คือการตั้งค่า: ฉันกำลังดูสมาชิกในกลุ่มภายในหน้าต่างเวลาห้าปี สมาชิกแต่ละคนมีบันทึกการเป็นสมาชิกรายเดือนสำหรับแต่ละเดือนที่สมาชิกอยู่ในกลุ่ม ฉันกำลังพิจารณาสมาชิกทั้งหมดที่สมาชิกเริ่มขึ้นในช่วงห้าปี (เพื่อหลีกเลี่ยงปัญหา "การเซ็นเซอร์ซ้าย" กับสมาชิกที่เข้าร่วมก่อนหน้านี้) แต่ละเร็กคอร์ดจะถูกทำดัชนีตามเวลาโดยเวลาหนึ่งคือเดือนที่สมาชิกเข้าร่วม ดังนั้นสมาชิกที่อยู่สองปีครึ่งจะมีบันทึกรายเดือนสามสิบหมายเลขจากหนึ่งถึงสามสิบ แต่ละเร็กคอร์ดจะได้รับตัวแปรไบนารีซึ่งจะมีค่าหนึ่งสำหรับเดือนสุดท้ายของการเป็นสมาชิกและเป็นศูนย์มิฉะนั้น ค่าหนึ่งสำหรับตัวแปรไบนารีทำเครื่องหมายเหตุการณ์ที่สมาชิกออกจากกลุ่ม สำหรับสมาชิกแต่ละคนที่ยังคงเป็นสมาชิกเกินกว่าหน้าต่างการวิเคราะห์ห้าปี ดังนั้นรูปแบบการถดถอยโลจิสติกถูกสร้างขึ้นเพื่อทำนายค่าของตัวแปรเหตุการณ์ไบนารี จนถึงตอนนี้ดีมาก หนึ่งในวิธีทั่วไปในการประเมินรูปแบบการทำนายแบบไบนารี่คือการวัดการยกของตัวอย่างโฮลด์ สำหรับโมเดลการถดถอยโลจิสติกที่ฉันสร้างขึ้นเพื่อทำนายเหตุการณ์สิ้นสุดการเป็นสมาชิกฉันได้คำนวณการยกชุดข้อมูลที่เก็บไว้พร้อมกับอัตราส่วนห้าต่อหนึ่งของการไม่เกิดเหตุการณ์ต่อเหตุการณ์ ฉันจัดอันดับค่าที่ทำนายไว้เป็น deciles ช่วงทศวรรษที่มีค่าที่คาดการณ์ไว้สูงที่สุดนั้นมีค่าเจ็ดสิบเปอร์เซ็นต์ decile สองตัวแรกรวมกันมีหกสิบห้าเปอร์เซ็นต์ของทั้งหมดใน holdout ในบริบทบางอย่างนี้จะถือว่าเป็นรูปแบบการทำนายที่ค่อนข้างดี แต่ฉันสงสัยว่ามันดีพอที่จะทำการวิเคราะห์การอยู่รอด Let h[j,k]h[j,k]h[j,k]เป็นฟังก์ชั่นอันตรายสำหรับบุคคลjjjในเดือนkkkและให้S[j,k]S[j,k]S[j,k]จะเป็นไปได้ว่าบุคคลjjjรอดผ่านเดือนkkkk นี่คือคำถามพื้นฐานของฉัน: ฟังก์ชั่นอันตรายแบบไม่ต่อเนื่อง, h[j,k]h[j,k]h[j,k] , ความน่าจะเป็นแบบมีเงื่อนไขของการไม่รอด (ออกจากกลุ่ม) ในแต่ละเดือนหรือไม่? ค่าที่ทำนายจากการประมาณค่าแบบจำลองการถดถอยโลจิสติกส์ของฟังก์ชันอันตรายหรือไม่? (กล่าวคือเท่ากับแบบจำลองที่ทำนายค่าสำหรับjแต่ละตัวในเดือนkหรือทำอะไรมากกว่านี้ที่ต้องทำเพื่อให้ได้ค่าประมาณฟังก์ชันอันตราย?)h[j,k]h[j,k]h[j,k]jjjkkk ความน่าจะเป็นของการอยู่รอดถึงเดือน q สำหรับแต่ละเท่ากับผลิตภัณฑ์ของหนึ่งลบฟังก์ชันอันตรายจากเดือนหนึ่งถึงqนั่นคือ S [ j , q ] = ( 1 - …

1
เหตุใดค่า p จึงสูงขึ้นในโมเดลอันตรายตามสัดส่วนของ Cox มากกว่าในการถดถอยโลจิสติก
ฉันได้เรียนรู้เกี่ยวกับรูปแบบอันตรายตามสัดส่วนของค็อกซ์แล้ว ฉันมีจำนวนมากประสบการณ์ที่เหมาะสมรูปแบบการถดถอยโลจิสติกและเพื่อที่จะสร้างสัญชาตญาณของฉันได้รับการเปรียบเทียบรูปแบบให้พอดีกับการใช้coxphจาก R "อยู่รอด" ที่มีรูปแบบการถดถอยโลจิสติกพอดีใช้กับglmfamily="binomial" ถ้าฉันใช้รหัส: library(survival) s = Surv(time=lung$time, event=lung$status - 1) summary(coxph(s ~ age, data=lung)) summary(glm(status-1 ~ age, data=lung, family="binomial")) ฉันรับค่า p สำหรับอายุ 0.0419 และ 0.0254 ตามลำดับ ในทำนองเดียวกันถ้าฉันใช้เพศเป็นตัวทำนายโดยมีหรือไม่มีอายุ ฉันพบว่ามันทำให้งงเพราะฉันคิดว่าการใช้เวลาเป็นจำนวนมากเมื่อพิจารณาว่าแบบจำลองจะให้พลังงานทางสถิติมากกว่าการรักษาความตายเป็นผลลัพธ์ไบนารีในขณะที่ค่า p จะสอดคล้องกับที่มีกำลังทางสถิติน้อยลง เกิดขึ้นที่นี่คืออะไร?

3
สัมประสิทธิ์ตามเวลาใน R - จะทำอย่างไร?
อัปเดต : ขออภัยสำหรับการอัปเดตอื่น แต่ฉันพบวิธีแก้ปัญหาที่เป็นไปได้ด้วยพหุนามเศษส่วนและแพ็คเกจเสี่ยงการแข่งขันที่ฉันต้องการความช่วยเหลือ ปัญหา ฉันไม่สามารถหาวิธีง่าย ๆ ในการวิเคราะห์ค่าสัมประสิทธิ์เวลาได้ใน R ฉันต้องการให้สามารถใช้สัมประสิทธิ์ตัวแปรของฉันและทำมันเป็นค่าสัมประสิทธิ์ขึ้นอยู่กับเวลา (ไม่ใช่ตัวแปร) แล้วพล็อตการเปลี่ยนแปลงกับเวลา: βม. Y_ v a r i a b l e= β0+ β1∗ t + β2∗ t2. . .βม.Y_โวลต์aRผมaขล.อี=β0+β1* * * *เสื้อ+β2* * * *เสื้อ2...\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... การแก้ปัญหาที่เป็นไปได้ 1) การแยกชุดข้อมูล ฉันได้ดูตัวอย่างนี้ (Se ส่วนที่ 2 ของเซสชันแล็บ) แต่การสร้างชุดข้อมูลแยกต่างหากดูเหมือนซับซ้อนซับซ้อนคำนวณค่าใช้จ่ายและไม่ง่ายมาก ... 2) Reduced Rank models …

2
แบบจำลองการอยู่รอดเพื่อทำนายการเปลี่ยนแปลง - ตัวทำนายเวลาที่ต่างกัน?
ฉันกำลังมองหาที่จะสร้างแบบจำลองการทำนายสำหรับทำนายปั่นป่วนและกำลังมองหาที่จะใช้แบบจำลองการอยู่รอดแบบไม่ต่อเนื่องเวลาพอดีกับชุดข้อมูลการฝึกอบรมระยะเวลาบุคคล (แถวหนึ่งสำหรับลูกค้าแต่ละรายและระยะเวลาไม่ต่อเนื่องพวกเขาตกอยู่ในความเสี่ยง ถ้าปั่นเกิดขึ้นในช่วงเวลานั้นอีก 0) ฉันเหมาะสมกับโมเดลโดยใช้การถดถอยโลจิสติกส์ธรรมดาโดยใช้เทคนิคจากนักร้องและวิลเล็ต จำนวนลูกค้าที่เกิดขึ้นสามารถเกิดขึ้นได้ทุกที่ในช่วงเดือน แต่มันก็แค่สิ้นเดือนที่เรารู้เกี่ยวกับมัน (บางครั้งในช่วงเดือนที่พวกเขาออกไป) ใช้เวลา 24 เดือนในการฝึกอบรม ตัวแปรเวลาที่ใช้คือเวลาเริ่มต้นของตัวอย่าง - ลูกค้าทั้งหมดที่ใช้งานจนถึงวันที่ 12/31/2008 - พวกเขาทั้งหมดได้รับ t = 0 ตั้งแต่เดือนมกราคม 2552 (ไม่ใช่วิธีแบบดั้งเดิมที่จะทำ แต่ฉันเชื่อว่าวิธีการสร้าง แบบจำลองการทำนายกับแบบสถิติดั้งเดิม) covariate ที่ใช้คืออายุของลูกค้า ณ เวลานั้น มีชุดของโควาเรียต์ที่สร้างขึ้น - บางชุดที่ไม่เปลี่ยนแปลงในแถวของชุดข้อมูล (สำหรับลูกค้าที่ระบุ) และบางชุดที่ทำ ตัวแปรแปรปรวนเวลาเหล่านี้เป็นปัญหาและสิ่งที่ทำให้ฉันถามรูปแบบการอยู่รอดสำหรับการทำนายแบบปั่นป่วน (เปรียบเทียบกับตัวจําแนกปกติที่ทำนายการปั่นในอีก x เดือนถัดไปตามข้อมูลสแนปชอตปัจจุบัน) คนที่ไม่แปรเปลี่ยนเวลาอธิบายกิจกรรมในเดือนก่อนและคาดว่าจะเป็นตัวกระตุ้นที่สำคัญ การดำเนินการตามรูปแบบการทำนายนี้อย่างน้อยตามความคิดปัจจุบันของฉันคือการให้คะแนนฐานลูกค้า ณ สิ้นเดือนแต่ละเดือนเพื่อคำนวณความน่าจะเป็น / ความเสี่ยงจากการปั่นป่วนในช่วงเดือนถัดไป จากนั้นอีกครั้งสำหรับ 1,2 หรือ 3 เดือนถัดไป จากนั้นสำหรับอีก …

2
ฉันจะตีความ Exp (B) ในการถดถอยแบบ Cox ได้อย่างไร
ฉันเป็นนักศึกษาแพทย์ที่พยายามทำความเข้าใจกับสถิติ (!) - ดังนั้นขอให้สุภาพ! ;) ฉันกำลังเขียนเรียงความที่ประกอบด้วยการวิเคราะห์ทางสถิติในจำนวนที่เหมาะสมรวมถึงการวิเคราะห์การอยู่รอด (Kaplan-Meier, Log-Rank และ Cox regression) ฉันใช้ Cox regression กับข้อมูลของฉันพยายามค้นหาว่าฉันสามารถค้นหาความแตกต่างที่สำคัญระหว่างการเสียชีวิตของผู้ป่วยในสองกลุ่ม (ผู้ป่วยที่มีความเสี่ยงสูงหรือผู้ที่มีความเสี่ยงต่ำ) ฉันได้เพิ่ม covariates หลายตัวลงใน Cox regression เพื่อควบคุมอิทธิพลของพวกเขา Risk (Dichotomous) Gender (Dichotomous) Age at operation (Integer level) Artery occlusion (Dichotomous) Artery stenosis (Dichotomous) Shunt used in operation (Dichotomous) ฉันลบ Artery occlusion ออกจากรายการ covariates เนื่องจาก SE มีค่าสูงมาก …

4
ข้อดีและข้อเสียของการใช้ logrank กับวิธี Mantel-Haenszel สำหรับการคำนวณอัตราส่วนความเป็นอันตรายในการวิเคราะห์การอยู่รอดคืออะไร
วิธีหนึ่งในการสรุปการเปรียบเทียบเส้นโค้งการอยู่รอดสองเส้นคือการคำนวณอัตราส่วนความเป็นอันตราย (HR) มีอย่างน้อยสองวิธีในการคำนวณค่านี้ วิธีการ Logrank เป็นส่วนหนึ่งของการคำนวณ Kaplan-Meier ให้คำนวณจำนวนของเหตุการณ์ที่สังเกต (ตายโดยปกติ) ในแต่ละกลุ่ม ( และO b ) และจำนวนของเหตุการณ์ที่คาดหวังซึ่งสมมติว่าสมมติฐานว่างจากการอยู่รอดไม่แตกต่างกัน ( E aและE b ) อัตราส่วนความเป็นอันตรายนั้นคือ: H R = ( O a / E a )OaOaOaObObObEaEaEaEbEbEbHR=(Oa/Ea)(Ob/Eb)HR=(Oa/Ea)(Ob/Eb) HR= \frac{(Oa/Ea)}{(Ob/Eb)} HR=exp((Oa−Ea)V)HR=exp⁡((Oa−Ea)V) HR= \exp\left(\frac{(Oa-Ea)}{V}\right) มีคนส่งตัวอย่างที่ทั้งสองวิธีแตกต่างกันโดยปัจจัยที่สาม ในตัวอย่างนี้เป็นที่ชัดเจนว่าการประมาณ logrank นั้นสมเหตุสมผลและการประมาณการ Mantel-Haenszel นั้นอยู่ไกลมาก คำถามของฉันคือถ้าใครมีคำแนะนำทั่วไปสำหรับเมื่อมันเป็นการดีที่สุดที่จะเลือกการประมาณ logrank ของอัตราส่วนความเป็นอันตรายและเมื่อมันจะดีที่สุดในการเลือกประมาณการ Mantel-Haenszel? มันต้องทำกับขนาดตัวอย่างหรือไม่? จำนวนความสัมพันธ์? อัตราส่วนขนาดตัวอย่าง?
17 survival  hazard 

4
ปรีชาสำหรับฟังก์ชันอันตรายสะสม (การวิเคราะห์การอยู่รอด)
ฉันกำลังพยายามที่จะรับสัญชาติญาณสำหรับแต่ละหน้าที่หลักในวิทยาศาสตร์คณิตศาสตร์ประกันภัย (โดยเฉพาะสำหรับ Cox Proportional Hazards Model) นี่คือสิ่งที่ฉันมี: f(x)ฉ(x)f(x) : เริ่มตั้งแต่เวลาเริ่มต้นการกระจายความน่าจะเป็นของเวลาที่คุณจะตาย F(x)F(x)F(x) : แค่การแจกแจงสะสม ในช่วงเวลาประชากร% ใดที่จะตาย?TTT S(x)S(x)S(x) :(x) ในช่วงเวลา % ของประชากรจะมีชีวิตอยู่เท่าไหร่?1−F(x)1−F(x)1-F(x)TTT h(x)h(x)h(x) : ฟังก์ชั่นอันตราย ในช่วงเวลาที่กำหนดของผู้คนยังมีชีวิตอยู่สิ่งนี้สามารถใช้เพื่อประเมินว่ามีกี่คนที่จะตายในช่วงเวลาถัดไปหรือถ้าช่วงเวลา -> 0, ความน่าจะเป็นของการเสียชีวิตแบบ 'ทันที'TTT H(x)H(x)H(x) : อันตรายที่สะสม ไม่มีความเห็น. แนวคิดเบื้องหลังการรวมค่าอันตรายโดยเฉพาะเมื่อต่อเนื่องคืออะไร หากเราใช้ตัวอย่างแบบไม่ต่อเนื่องที่มีอัตราการตายตลอดสี่ฤดูกาลและฟังก์ชั่นอันตรายมีดังนี้: เริ่มต้นที่ Spring ทุกคนยังมีชีวิตอยู่และ 20% จะตาย ตอนนี้ในฤดูร้อนของเหลือ 50% จะตาย ตอนนี้ในฤดูใบไม้ร่วงของที่เหลืออยู่ 75% จะตาย ฤดูกาลสุดท้ายคือฤดูหนาว ของที่เหลืออยู่ 100% จะตาย จากนั้นอันตรายสะสมคือ …

2
วิธีการคำนวณระยะเวลาในการรับประทานมังสวิรัติโดยเฉลี่ยเมื่อเรามีข้อมูลการสำรวจเกี่ยวกับมังสวิรัติในปัจจุบันเท่านั้น
สำรวจประชากรตัวอย่างแบบสุ่ม พวกเขาถูกถามว่าพวกเขากินอาหารมังสวิรัติหรือไม่ หากพวกเขาตอบว่าใช่พวกเขาจะถูกขอให้ระบุว่าพวกเขากินอาหารมังสวิรัตินานแค่ไหนโดยไม่หยุดชะงัก ฉันต้องการใช้ข้อมูลนี้เพื่อคำนวณระยะเวลาในการรับประทานมังสวิรัติโดยเฉลี่ย กล่าวอีกนัยหนึ่งเมื่อใครบางคนกลายเป็นมังสวิรัติฉันอยากรู้ว่าพวกเขากินเจโดยเฉลี่ยนานเท่าไร สมมติว่า: ผู้ตอบแบบสอบถามทุกคนให้คำตอบที่ถูกต้องและแม่นยำ โลกมีเสถียรภาพ: ความนิยมของการทานมังสวิรัติไม่เปลี่ยนแปลงความยาวของการยึดถือโดยเฉลี่ยก็ไม่เปลี่ยนแปลงเช่นกัน เหตุผลของฉันจนถึงตอนนี้ ฉันพบว่ามีประโยชน์ในการวิเคราะห์แบบจำลองของเล่นของโลกที่จุดเริ่มต้นของทุก ๆ ปีคนสองคนกลายเป็นมังสวิรัติ ทุกครั้งหนึ่งในนั้นจะเป็นมังสวิรัติ 1 ปีและอีก 3 ปี เห็นได้ชัดว่าความยาวของการยึดมั่นในโลกนี้คือ (1 + 3) / 2 = 2 ปี นี่คือกราฟที่แสดงตัวอย่าง สี่เหลี่ยมผืนผ้าแต่ละรูปแสดงระยะเวลาของการกินเจ: สมมติว่าเราทำแบบสำรวจกลางปี ​​4 (เส้นสีแดง) เราได้รับข้อมูลต่อไปนี้: เราจะได้ข้อมูลเดียวกันถ้าเราทำแบบสำรวจทุกปีเริ่มปีที่ 3 ถ้าเราแค่ตอบสนองโดยเฉลี่ยเราจะได้รับ: (2 * 0.5 + 1.5 + 2.5) / 4 = 1.25 เราดูถูกดูแคลนเพราะเราคิดว่าทุกคนหยุดเป็นมังสวิรัติทันทีหลังจากสำรวจซึ่งเห็นได้ชัดว่าไม่ถูกต้อง เพื่อให้ได้ค่าประมาณที่ใกล้เคียงกับเวลาเฉลี่ยจริงที่ผู้เข้าร่วมจะยังคงเป็นมังสวิรัติเราสามารถสันนิษฐานได้ว่าโดยเฉลี่ยพวกเขารายงานเวลาครึ่งทางผ่านช่วงเวลาของการกินเจและระยะเวลารายงานคูณด้วย 2 …

3
สัญชาตญาณเบื้องหลังอัตราอันตราย
ฉันสับสนเกี่ยวกับสมการที่ทำหน้าที่เป็นคำจำกัดความของอัตราอันตราย ฉันเข้าใจว่าอัตราอันตรายนั้นเป็นอย่างไร แต่ฉันไม่เห็นว่าสมการแสดงความรู้สึกนั้น ถ้าxxxเป็นตัวแปรสุ่มซึ่งหมายถึงจุดของเวลาของการตายของคนในช่วงเวลา[ 0 , T][0,T][0,T] ] ดังนั้นอัตราความเสี่ยงคือ: h ( x ) = f( x )1 - ฟ( x )ชั่วโมง(x)=ฉ(x)1-F(x)h(x)=\frac{f(x)}{1-F(x)} ที่ไหนF( x )F(x)F(x)แสดงให้เห็นถึงความน่าจะเป็นของการเสียชีวิตจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , 1 - ฟ( x )1-F(x)1-F(x)แสดงให้เห็นถึงความน่าจะเป็นของการมีชีวิตรอดจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , และฉ( x )ฉ(x)f(x)ความน่าจะเป็นของการเสียชีวิตที่จุดxxxx วิธีการที่ไม่หารโดยอัตราการรอดตายอธิบายสัญชาตญาณของความน่าจะเป็นของการเสียชีวิตทันทีในที่อยู่ถัดΔ ที ? ไม่ควรเป็นแค่f ( x …

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
อัตราส่วนความเป็นอันตรายสามารถแปลเป็นอัตราส่วนของค่ามัธยฐานของเวลารอดหรือไม่
ในบทความหนึ่งที่อธิบายผลลัพธ์ของการวิเคราะห์การอยู่รอดฉันได้อ่านข้อความที่บอกเป็นนัยว่าสามารถแปลอัตราส่วนอันตราย (HR) เป็นอัตราส่วนของเวลาเฉลี่ยการเอาตัวรอด (และ ) โดยใช้สูตร:M1M1M_1M2M2M_2 HR=M1M2HR=M1M2HR = \frac{M_1}{M_2} ฉันแน่ใจว่ามันไม่ถือเมื่อไม่มีใครสามารถคิดแบบจำลองความเป็นอันตรายตามสัดส่วนได้ แต่ฉันสงสัยว่าถึงอย่างนั้นมันก็ไม่ได้ผลกับการแจกแจงการอยู่รอดยกเว้นการยกกำลัง สัญชาตญาณของฉันถูกต้องหรือไม่
15 survival  hazard 

3
โมเดล Cox เทียบกับการถดถอยโลจิสติก
สมมติว่าเราได้รับปัญหาต่อไปนี้: ทำนายว่าลูกค้ารายใดที่มีแนวโน้มจะหยุดซื้อในร้านของเราในอีก 3 เดือนข้างหน้า สำหรับลูกค้าแต่ละรายเรารู้ว่าเดือนใดที่ลูกค้าเริ่มซื้อสินค้าในร้านของเราและนอกจากนี้เรายังมีคุณสมบัติด้านพฤติกรรมหลายอย่างในการรวบรวมรายเดือน ลูกค้า 'คนโต' ซื้อมาแล้วห้าสิบเดือน มาแสดงเวลาตั้งแต่ลูกค้าเริ่มซื้อโดย ( ) สามารถสันนิษฐานได้ว่าจำนวนลูกค้ามีขนาดใหญ่มาก หากลูกค้าหยุดซื้อเป็นเวลาสามเดือนจากนั้นกลับมาเขาจะถือว่าเป็นลูกค้าใหม่เพื่อให้เหตุการณ์ (หยุดซื้อ) สามารถเกิดขึ้นได้เพียงครั้งเดียวt ∈ [ 0 , 50 ]tttt∈[0,50]t∈[0,50]t \in [0, 50] การแก้ปัญหาสองข้อนั้นอยู่ในใจของฉัน: การถดถอยแบบลอจิสติก - สำหรับลูกค้าแต่ละรายและในแต่ละเดือน (อาจยกเว้น 3 เดือนล่าสุด) เราสามารถพูดได้ว่าลูกค้าหยุดซื้อหรือไม่ดังนั้นเราสามารถทำการสุ่มตัวอย่างด้วยการสังเกตหนึ่งครั้งต่อลูกค้าและเดือน เราสามารถใช้จำนวนเดือนนับตั้งแต่เริ่มต้นเป็นตัวแปรเด็ดขาดเพื่อรับฟังก์ชั่นความอันตรายพื้นฐานบางอย่าง Extended Cox model - ปัญหานี้สามารถจำลองได้ด้วยการใช้ Extended Cox model ดูเหมือนว่าปัญหานี้เหมาะกับการวิเคราะห์เพื่อความอยู่รอด คำถาม:อะไรคือข้อดีของการวิเคราะห์การอยู่รอดในปัญหาที่คล้ายกัน? การวิเคราะห์การอยู่รอดถูกคิดค้นขึ้นด้วยเหตุผลบางอย่างดังนั้นจะต้องมีข้อได้เปรียบที่ร้ายแรงบางอย่าง ความรู้ของฉันในการวิเคราะห์การเอาชีวิตรอดนั้นไม่ลึกมากและฉันคิดว่าข้อดีที่เป็นไปได้มากที่สุดของโมเดล Cox สามารถทำได้โดยใช้การถดถอยโลจิสติก รูปแบบค็อกซ์เทียบเท่าสามารถแบ่งชั้นได้โดยใช้การโต้ตอบของและตัวแปรแบ่งชั้น ttt แบบจำลองปฏิสัมพันธ์ …

2
จะทำการตรวจสอบข้ามกับโมเดลอันตรายตามสัดส่วนของ Cox ได้อย่างไร
สมมติว่าฉันได้สร้างแบบจำลองการทำนายสำหรับการเกิดโรคเฉพาะในชุดข้อมูลหนึ่ง (ชุดข้อมูลการสร้างแบบจำลอง) และตอนนี้ต้องการตรวจสอบว่ารูปแบบการทำงานในชุดข้อมูลใหม่ได้ดีเพียงใด (ชุดข้อมูลการตรวจสอบความถูกต้อง) สำหรับแบบจำลองที่สร้างขึ้นด้วยการถดถอยโลจิสติกฉันจะคำนวณความน่าจะเป็นที่คาดการณ์สำหรับแต่ละคนในชุดข้อมูลการตรวจสอบความถูกต้องตามค่าสัมประสิทธิ์แบบจำลองที่ได้จากชุดข้อมูลการสร้างแบบจำลองแล้วหลังจากแยกขั้ว ที่ช่วยให้ฉันสามารถคำนวณอัตราบวกที่แท้จริง (ความไว) และอัตราลบที่แท้จริง (ความจำเพาะ) ยิ่งกว่านั้นฉันสามารถสร้างเส้นโค้ง ROC ทั้งหมดได้โดยการปรับค่า cutoff แล้วรับ AUC สำหรับกราฟ ROC ตอนนี้สมมติว่าฉันมีข้อมูลการอยู่รอด ดังนั้นฉันใช้โมเดลอันตรายตามสัดส่วนของ Cox ในชุดข้อมูลการสร้างแบบจำลองและตอนนี้ต้องการตรวจสอบว่าแบบจำลองนั้นทำงานได้ดีเพียงใดในชุดข้อมูลการตรวจสอบความถูกต้อง เนื่องจากความเสี่ยงพื้นฐานไม่ใช่ฟังก์ชันพารามิเตอร์ในโมเดล Cox ฉันไม่เห็นว่าฉันจะได้รับโอกาสรอดชีวิตที่คาดการณ์ไว้สำหรับแต่ละคนในชุดข้อมูลการตรวจสอบตามค่าสัมประสิทธิ์แบบจำลองที่ได้จากชุดข้อมูลการสร้างแบบจำลองอย่างไร ดังนั้นฉันจะไปเกี่ยวกับการตรวจสอบว่าแบบจำลองทำงานได้ดีในชุดข้อมูลการตรวจสอบได้อย่างไร มีวิธีการที่กำหนดไว้สำหรับการทำเช่นนี้หรือไม่? และถ้าใช่จะมีการใช้งานในซอฟต์แวร์ใด ๆ หรือไม่? ขอบคุณล่วงหน้าสำหรับคำแนะนำใด ๆ !

3
การฝึกอบรมการทดสอบการตรวจสอบในการวิเคราะห์ปัญหาการอยู่รอด
ฉันดูหัวข้อต่างๆที่นี่ แต่ฉันไม่คิดว่าจะตอบคำถามที่แน่นอน ฉันมีชุดข้อมูลของนักเรียนประมาณ 50,000 คนและเวลาในการออกกลางคัน ฉันจะทำการลดความเสี่ยงตามสัดส่วนที่มีค่าความแปรปรวนจำนวนมาก ฉันกำลังจะทำการถดถอยโลจิสติกเมื่อออกกลางคัน / อยู่ต่อเป้าหมายหลักคือการคาดการณ์สำหรับนักเรียนกลุ่มใหม่ โดยทั่วไปแล้วฉันไม่มีความหรูหราของข้อมูลและทำตัวแบบที่เหมาะสมกับการลงโทษ แต่คราวนี้ฉันคิดว่าการแยกชุดฝึกอบรมและชุดข้อมูลทดสอบแล้วทำการเลือกตัวแปรในชุดฝึกอบรม จากนั้นใช้ชุดข้อมูลทดสอบสำหรับการประมาณค่าพารามิเตอร์และความสามารถในการทำนาย นี่เป็นกลยุทธ์ที่ดีใช่ไหม ถ้าไม่ดีกว่าอะไร ยินดีต้อนรับการอ้างอิง แต่ไม่จำเป็น

3
จะได้รับการทำนายในแง่ของเวลาการเอาชีวิตรอดจากโมเดล Cox PH ได้อย่างไร
ฉันต้องการพัฒนาแบบจำลองการทำนาย (Cox PH) สำหรับการเสียชีวิตแบบทุกสาเหตุในชุดข้อมูลของผู้เข้าร่วมซึ่งเกือบทุกคนเสียชีวิตเมื่อสิ้นสุดการติดตาม (เช่น 1 ปี) แทนที่จะทำนายความเสี่ยงที่แน่นอนของการตายในเวลาหนึ่งฉันต้องการทำนายเวลาการอยู่รอด (เป็นเดือน) สำหรับแต่ละคน เป็นไปได้หรือไม่ที่จะได้รับการทำนายเช่นนี้ใน R (จากเช่น coxph-object) และถ้าใช่ฉันจะทำเช่นนั้นได้อย่างไร? ขอบคุณมากล่วงหน้า!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.