แบบจำลองเอฟเฟกต์แบบสุ่มที่จัดการความซ้ำซ้อน


9

ฉันกำลังพยายามจัดการกับการวิเคราะห์แบบเวลาต่อเหตุการณ์โดยใช้ผลลัพธ์ไบนารีซ้ำ ๆ สมมติว่าเวลาต่อเหตุการณ์ถูกวัดเป็นวัน แต่สำหรับช่วงเวลาที่เราแยกเวลาเป็นสัปดาห์ ฉันต้องการประมาณค่าประมาณของ Kaplan-Meier (แต่อนุญาตให้ covariates) โดยใช้ผลลัพธ์ไบนารีซ้ำ นี่จะดูเหมือนเป็นวงเวียนที่จะไป แต่ฉันกำลังสำรวจว่าสิ่งนี้ขยายไปสู่ผลลัพธ์ตามลำดับและเหตุการณ์ที่เกิดขึ้นซ้ำ ๆ

หากคุณสร้างลำดับเลขฐานสองที่ดูเหมือนว่า 000 สำหรับคนที่ถูกเซ็นเซอร์ใน 3 สัปดาห์, 0000 สำหรับคนที่ถูกเซ็นเซอร์ที่ 4w และ 0000111111111111 .... สำหรับผู้ที่ล้มเหลวที่ 5w (1s ขยายไปถึงประเด็นที่เรื่องสุดท้ายเป็น ตามมาในการศึกษา) เมื่อคุณคำนวณสัดส่วนเฉพาะสัปดาห์ของ 1s คุณจะได้รับอุบัติการณ์สะสมตามปกติ (จนกว่าคุณจะได้รับเวลาตรวจสอบตัวแปรที่ซึ่งจะประมาณได้เฉพาะ แต่ไม่เท่ากับการประมาณอุบัติการณ์สะสมของ Kaplan-Meier)

ฉันสามารถใส่การสังเกตแบบไบนารี่ซ้ำ ๆ กับแบบจำลองโลจิสติกไบนารีโดยใช้ GEE แทนที่จะทำให้เวลาไม่ต่อเนื่องเหมือนด้านบน แต่แทนที่จะใช้ spline ในเวลา ตัวประมาณความแปรปรวนร่วมของคลัสเตอร์แซนด์วิชทำงานได้ดีพอสมควร แต่ฉันต้องการได้ข้อสรุปที่แน่นอนมากขึ้นโดยใช้โมเดลเอฟเฟกต์แบบผสม ปัญหาคือว่า 1 หลังจาก 1 แรกซ้ำซ้อน ไม่มีใครรู้วิธีระบุเอฟเฟกต์แบบสุ่มหรือระบุรุ่นที่คำนึงถึงความซ้ำซ้อนเพื่อให้ข้อผิดพลาดมาตรฐานจะไม่ย่นหรือไม่

โปรดทราบว่าการตั้งค่านี้แตกต่างจากEfronเนื่องจากเขาใช้แบบจำลองโลจิสติกเพื่อประเมินความน่าจะเป็นแบบมีเงื่อนไขในชุดความเสี่ยง ฉันประมาณความน่าจะเป็นที่ไม่มีเงื่อนไข

คำตอบ:


3

เท่าที่ฉันเห็นทั้ง GEE หรือตัวแบบผสมสำหรับการตรวจสอบไบนารีซ้ำ ๆ คุณจะพบปัญหาว่าตัวแบบจะกำหนดความน่าจะเป็นในเชิงบวกสำหรับ '0' หลังจากที่สังเกต '1' ตัวแรก

ในกรณีใด ๆ ที่ระบุว่าคุณต้องการที่จะได้รับการประมาณการจากผลกระทบผสมถดถอยโลจิสติที่จะมีการตีความเช่นเดียวกับใน GEE (ดูที่นี่สำหรับข้อมูลเพิ่มเติม) คุณสามารถเหมาะสมกับรูปแบบโดยใช้mixed_model()ฟังก์ชั่นจากGLMMadaptiveแพคเกจแล้ว marginal_coefs()ใช้ ยกตัวอย่างให้ดูที่นี่


1
ขอบคุณ Dimitris สำหรับกรณีของฉันที่มี 1 ซ้ำซ้อน (เพื่อให้ได้ฟังก์ชั่นเฉลี่ยที่ถูกต้อง) ฉันคิดว่าฉันจะต้องมีโมเดลที่ดัดแปลงหรือการตั้งค่าเอฟเฟกต์แปลก ๆ GLMMadaptiveแพคเกจมีลักษณะที่ยอดเยี่ยมสำหรับการตั้งค่าทั่วไปมากขึ้น
Frank Harrell

2

คู่ของความคิดเกี่ยวกับเรื่องนี้:

  1. ดูเหมือนว่าแบบจำลองเอฟเฟกต์แบบพื้นฐานจะเป็นแบบจำลองความน่าจะเป็นแบบมีเงื่อนไขคือความน่าจะเป็นของเหตุการณ์สำหรับหัวเรื่องที่มีความเสี่ยงสำหรับเหตุการณ์นั้นคืออะไร

  2. เรารู้ว่าความน่าจะเป็นของ '1' หลังจาก '1' แรกเป็นหนึ่ง ดังนั้นจึงไม่มีข้อมูลเพิ่มเติมในค่า '1' ที่ตามมา

  3. ดูเหมือนว่าเนื่องจากค่า '1' ที่ตามมาไม่มีข้อมูลเพิ่มเติมจึงไม่ควรส่งผลกระทบต่อฟังก์ชันความน่าจะเป็นดังนั้นจึงไม่มีผลกระทบต่อข้อผิดพลาดมาตรฐานของตัวประมาณความน่าจะเป็น แน่นอนว่าจะไม่มีผลกระทบของค่า '1' ที่ตามมาหาก p (y = '1' | x) = 1 โดยไม่คำนึงถึงค่าพารามิเตอร์โมเดลตามที่ควรจะเป็น

  4. เราอาจสามารถบังคับพฤติกรรมนี้ได้ (เช่น p (y = '1' | x) = 1) และรักษาฟังก์ชันค่าเฉลี่ยที่ต้องการโดยเพิ่มตัวบ่งชี้ covariate ให้กับโมเดลที่ทำเครื่องหมายรูปแบบที่ตามมาและบังคับค่าสัมประสิทธิ์ของมัน มีขนาดใหญ่มากดังนั้น p (y = '1' | x) ได้อย่างมีประสิทธิภาพ = 1

  5. ดังที่คุณกล่าวถึงอาจมีวิธีการบังคับ '1' แรกและคำตอบที่ตามมาให้มีความสัมพันธ์ 100% แต่ในรูปแบบทวินามนั่นก็เหมือนกับ p (y = '1' | x) = 1 สำหรับการตอบกลับในภายหลัง


1
ขอบคุณแมตต์ ถ้าฉันไม่ต้องการแบบจำลองเต็มรูปแบบ แต่เป็นเนื้อหาที่มีการประมาณสมการสิ่งที่คุณได้รับก็คือการเพิ่มการตอบกลับซ้ำไปยังฟังก์ชันคะแนนเพื่อให้ได้ฟังก์ชันเฉลี่ยที่ถูกต้อง แต่ไม่ได้เพิ่มเข้าไปในฟังก์ชันข้อมูล ฉันไม่คิดว่าฉันสามารถเพิ่มตัวบ่งชี้ความแปรปรวนร่วมได้เพราะนั่นอาจใช้เวลาประมาณเช่นผลการรักษา ฉันคิดว่าตัวแบบเอฟเฟกต์ผสมเป็นแบบจำลองที่ไม่มีเงื่อนไขมากขึ้น เมื่อเหตุการณ์ไม่ได้อยู่ในสถานะดูดซับคุณกำลังสร้างแบบจำลองเอฟเฟกต์ขอบขึ้นอยู่กับเวลา
Frank Harrell

1

ฉันไม่แน่ใจว่าคุณกำลังพยายามทำอะไร แต่คุณสามารถใส่โมเดลการถดถอยโลจิสติกส์แบบพูล ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 ) ได้ไหม ในกรณีนี้คุณจะรวม 1 ในช่วงเวลาของเหตุการณ์เทอร์มินัล - มันจะไม่ทำซ้ำหลังจากเหตุการณ์เกิดขึ้น คุณจะรวมเวลาในโมเดลอย่างยืดหยุ่น (เช่นขยายโดยใช้เส้นโค้ง)


1
เฮ้ไบรอัน - ฉันชอบการถดถอยแบบลอจิสติกแบบรวมและใช้มันบ่อยๆ แต่ถ้าคุณยุติการสังเกตของผู้เข้าร่วมการแข่งขันที่เทอร์มินัลและให้อาสาสมัครคนอื่นตามมานอกเหนือจากจุดนั้นโดยไม่มีเหตุการณ์คุณจะได้รับฟังก์ชั่นเฉลี่ย (P (เหตุการณ์ตามเวลา t)) ผิด ฉันต้องการได้รับการประมาณอุบัติการณ์สะสมใกล้ Kaplan-Meier สำหรับฟังก์ชันค่าเฉลี่ยอย่างน้อยในกรณีพิเศษ
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.