คำอธิบายของคนธรรมดาเกี่ยวกับการเซ็นเซอร์ในการวิเคราะห์การเอาตัวรอด


13

ฉันได้อ่านเกี่ยวกับการเซ็นเซอร์ว่ามันคืออะไรและมันจำเป็นต้องนำมาใช้ในการวิเคราะห์การอยู่รอด แต่ฉันต้องการที่จะได้ยินคำจำกัดความทางคณิตศาสตร์ของมันน้อยลง ทุกคนสามารถให้คำอธิบายแก่ฉันเกี่ยวกับ 1) การเซ็นเซอร์และ 2) มันมีผลอย่างไรกับเส้นโค้ง Kaplan-Meier และการถดถอยของ Cox


ฉันขอแนะนำให้ฟังพอดแคสต์เชิงเส้นในการวิเคราะห์การอยู่รอดและรับฟังคำจำกัดความง่าย ๆ ของการเซ็นเซอร์ด้านซ้ายและขวาและแรงจูงใจสำหรับโมเดล cox
Uri Goren

คำตอบ:


16

เซ็นเซอร์มักถูกอธิบายในการเปรียบเทียบกับการตัด คำอธิบายที่ดีของทั้งสองกระบวนการมีให้โดย Gelman et al (2005, p. 235)

ข้อมูลที่ถูกตัดทอนนั้นแตกต่างจากข้อมูลที่ถูกเซ็นเซอร์ซึ่งไม่มีการนับจำนวนการสังเกตเกินกว่าจุดที่ถูกตัดทอน ด้วยการเซ็นเซอร์ ค่าของการสังเกตเกินจุดตัดจะหายไป แต่จำนวนของพวกเขาจะถูกสังเกต

การเซ็นเซอร์หรือการตัดสามารถเกิดขึ้นได้สำหรับค่าที่สูงกว่าบางระดับ (การเซ็นเซอร์ขวา) ต่ำกว่าบางระดับ (การเซ็นเซอร์ด้านซ้าย) หรือทั้งสองอย่าง

2.02.0

ป้อนคำอธิบายรูปภาพที่นี่

ตัวอย่างที่ใช้งานง่ายของการเซ็นเซอร์คือคุณถามผู้ตอบแบบสอบถามเกี่ยวกับอายุของพวกเขา แต่บันทึกได้เพียงบางค่าและทุกช่วงอายุที่สูงกว่าค่านี้กล่าวว่า 60 ปีจะถูกบันทึกเป็น "60+" สิ่งนี้นำไปสู่การมีข้อมูลที่แม่นยำสำหรับค่าที่ไม่ถูกเซ็นเซอร์และไม่มีข้อมูลเกี่ยวกับค่าที่ถูกเซ็นเซอร์

ตัวอย่างในชีวิตจริงของการเซ็นเซอร์ไม่ได้มีการบันทึกไว้ในคะแนนสอบภาษาโปแลนด์มาตูราซึ่งได้รับความสนใจจากอินเทอร์เน็ตเป็นอย่างมาก การสอบจะดำเนินการในตอนท้ายของโรงเรียนมัธยมและนักเรียนจะต้องผ่านการทดสอบเพื่อให้สามารถสมัครเข้าศึกษาระดับอุดมศึกษาได้ คุณสามารถเดาจากพล็อตด้านล่างจำนวนคะแนนขั้นต่ำที่นักเรียนต้องผ่านการสอบคืออะไร ไม่น่าแปลกใจที่ "ช่องว่าง" ในการแจกแจงแบบปกติมิฉะนั้นสามารถ "กรอก" ได้อย่างง่ายดายหากคุณใช้ส่วนที่เหมาะสมของคะแนนที่แสดงมากกว่าเหนือขอบเขตการเซ็นเซอร์

ป้อนคำอธิบายรูปภาพที่นี่

ในกรณีของการวิเคราะห์การอยู่รอด

การเซ็นเซอร์เกิดขึ้นเมื่อเรามีข้อมูลบางอย่างเกี่ยวกับเวลารอดของแต่ละบุคคล แต่เราไม่รู้เวลารอดแน่นอน

(Kleinbaum และ Klein, 2005, p. 5) ตัวอย่างเช่นคุณรักษาผู้ป่วยด้วยยาบางตัวและสังเกตพวกเขาจนกว่าจะจบการศึกษา แต่คุณไม่มีความรู้ว่าจะเกิดอะไรขึ้นกับพวกเขาหลังจากจบการศึกษา (มีอาการกำเริบหรือผลข้างเคียงหรือไม่?) สิ่งเดียวที่คุณรู้คือ รอดชีวิต " อย่างน้อยก็จนกว่าจะสิ้นสุดการศึกษา

ด้านล่างคุณสามารถค้นหาตัวอย่างของข้อมูลที่สร้างจากการแจกแจงแบบWeibull ที่จำลองโดยใช้ตัวประมาณ Kaplan – Meier แบบจำลองเส้นโค้งสีน้ำเงินที่ประเมินบนชุดข้อมูลแบบเต็มในพล็อตตรงกลางคุณสามารถดูตัวอย่างที่ถูกตรวจสอบและแบบจำลองที่ประมาณไว้ในข้อมูลการตรวจสอบ (เส้นโค้งสีแดง) ทางด้านขวาคุณจะเห็นตัวอย่างที่ถูกตัดทอน อย่างที่คุณเห็นข้อมูลที่ขาดหายไป (การตัดปลาย) มีผลกระทบอย่างมีนัยสำคัญต่อการประมาณการ แต่การจัดการเซ็นเซอร์สามารถจัดการได้อย่างง่ายดายโดยใช้แบบจำลองการวิเคราะห์การอยู่รอดมาตรฐาน

ป้อนคำอธิบายรูปภาพที่นี่

นี่ไม่ได้หมายความว่าคุณไม่สามารถวิเคราะห์ตัวอย่างที่ถูกตัดทอนได้ แต่ในกรณีเช่นนี้คุณต้องใช้แบบจำลองสำหรับข้อมูลที่หายไปซึ่งพยายาม "เดา" ข้อมูลที่ไม่รู้จัก


Kleinbaum, DG และ Klein, M. (2005) การวิเคราะห์การอยู่รอด: ข้อความเรียนรู้ด้วยตนเอง สปริงเกอร์

Gelman, A. , Carlin, JB, Stern, HS, และ Rubin, DB (2005) การวิเคราะห์ข้อมูลแบบเบส์ แชปแมน & ฮอล / CRC


คุณรู้หรือไม่ว่าพล็อต Matura นี้มาจากไหน ฉันลอง googling และรับลิงค์ reddit ต่อไป แต่ไม่มีการอ้างอิงใด ๆ มันนำไปสู่ ​​imgur.com โดยไม่มีการระบุแหล่งที่มา ปรับปรุง: พบมัน cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/…หน้า 18
อะมีบาพูดว่า Reinstate Monica

1
@ amoeba หากคุณสนใจในรายละเอียดเพิ่มเติมอย่าลังเลที่จะติดต่อฉัน เนื้อหาส่วนใหญ่ในหัวข้อนี้ฉันรู้ว่าน่าเสียดายที่เป็นภาษาโปแลนด์ ภาพเป็นสิ่งหนึ่ง แต่เพื่อนของฉันทำการวิเคราะห์ข้อมูลนี้อย่างละเอียดมากขึ้น (btw สามารถขอได้)
ทิม

2

การเซ็นเซอร์เป็นหัวใจสำคัญของการวิเคราะห์ความอยู่รอด

แนวคิดพื้นฐานคือข้อมูลถูกเซ็นเซอร์คุณจะมองไม่เห็น อธิบายอย่างง่ายๆการแจกแจงเวลาชีวิตที่ถูกเซ็นเซอร์จะได้รับถ้าคุณบันทึกเวลาชีวิตก่อนที่ทุกคนในกลุ่มตัวอย่างจะเสียชีวิต หากคุณคิดว่าเวลาจะเคลื่อนที่ "ไปทางขวา" บนแกน X สิ่งนี้สามารถเรียกได้ว่าเป็นการเซ็นเซอร์ที่เหมาะสม

นอกจากนี้ยังมีประเภทอื่น ๆ : เซ็นเซอร์ด้านซ้ายและเซ็นเซอร์หน้าต่าง ดูตัวอย่างข้อความของแอลลิสันในปี 1984 เกี่ยวกับการวิเคราะห์ประวัติเหตุการณ์จัดพิมพ์โดย Sage สำหรับคำแนะนำเบื้องต้น

ตัวอย่าง: หากคุณกำลังคำนวณอัตราการหย่าร้างในประชากรคุณเพียงต้องการรวมบุคคลที่มีความเสี่ยงในการหย่า (นั่นคือพวกเขาแต่งงานแล้ว) หากผู้คนยุติการแต่งงานของพวกเขาด้วยเหตุผลอื่นนอกจากการหย่าร้าง (การสูญเสีย, การยกเลิก) แล้วคุณต้องการเซ็นเซอร์พวกเขา พวกเขาไม่มีความเสี่ยงต่อการหย่าร้างอีกต่อไป การประมาณ Kaplan-Meier ของคุณ (และแปลง) ไม่ควรรวมการสังเกตที่ถูกเซ็นเซอร์หลังจากจุดเวลาที่ถูกเซ็นเซอร์ แต่ควรรวมไว้จนถึงจุดเวลานั้น


กราฟิกหรือแปลง?
RustyStatistician
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.