ในการศึกษาระยะยาวฉันควรใส่นัยยะผลลัพธ์ Y ที่วัดได้ในเวลา 2 สำหรับบุคคลที่หลงหายไปจากการติดตาม?


10

ฉันมีมาตรการซ้ำ ๆ ที่ 2 ครั้งในกลุ่มตัวอย่าง มีคน 18k ในเวลา 1 และ 13k ในเวลา 2 (5,000 คนหายไปจากการติดตาม)

ฉันต้องการถอยหลังผลลัพธ์ Y ที่วัดได้ในเวลา 2 (และผลลัพธ์ไม่สามารถวัดได้ในเวลา 1) ในชุดของตัวทำนาย X วัดในเวลาที่ 1 ตัวแปรทั้งหมดมีข้อมูลที่ขาดหายไปบางส่วน ส่วนใหญ่มันจะค่อนข้างสุ่มหรือความหายไปดูเหมือนจะอธิบายได้ดีจากข้อมูลที่สังเกต อย่างไรก็ตามการหายไปส่วนใหญ่ในผลลัพธ์ Y นั้นเกิดจากการติดตามผลที่สูญเสียไป ฉันจะใช้การใส่หลายครั้ง (R :: mice) และจะใช้ชุดข้อมูลแบบเต็มเพื่อใส่ค่าสำหรับ X แต่ฉันได้รับคำแนะนำที่ขัดแย้งกัน 2 ชิ้นเกี่ยวกับการใส่ความเห็นของ Y:

1) Impute Y จาก X และ V (V = ตัวแปรเสริมที่มีประโยชน์) ในตัวอย่างเต็มรูปแบบของ 18k

2) ห้ามใส่ Y ในการติดตามบุคคล (และทำให้พวกเขาตกจากการสร้างแบบจำลองการถดถอยตามมา)

อดีตมีเหตุผลเพราะข้อมูลเป็นข้อมูลดังนั้นทำไมไม่ใช้มันทั้งหมด แต่สิ่งหลังนั้นสมเหตุสมผลด้วยวิธีที่เข้าใจง่ายกว่า - ดูเหมือนผิดที่จะใส่ร้ายผลลัพธ์สำหรับคน 5000 คนบนพื้นฐานของ Y ~ X + V แล้วหันหลังกลับและประมาณ Y ~ X

ข้อใดถูกต้อง (เพิ่มเติม)

คำถามก่อนหน้านี้มีประโยชน์ แต่ไม่ได้เน้นที่ความหายไปโดยตรงเนื่องจากการติดตามผลหายไป (แม้ว่าอาจจะเป็นคำตอบเดียวกัน แต่ฉันไม่รู้)

การใส่หลายครั้งสำหรับตัวแปรผลลัพธ์


สิ่งนี้ขัดแย้งกับฉัน - คุณช่วยอธิบายได้ไหม: "ส่วนใหญ่มันดูค่อนข้างสุ่ม
rolando2

1
การใส่ข้อมูลหลายครั้งและขั้นตอนการใส่เพิ่มอื่น ๆ ต้องการข้อมูลของคุณที่ขาดหายไปโดยการสุ่ม จำเป็นต้องเข้าใจกลไกการขัดสีในการศึกษาของคุณ ฉันสงสัยว่าในการติดตามผลของคุณอย่างไรก็ตามค่าที่หายไปของคุณนั้นไม่ใช่ MAR หรือ MCAR
StatsStudent

คำตอบ:


2

ฉันคิดว่านี่เป็นกรณีใช้เครื่องมือ คุณต้องการ X ที่หายไปไม่ใช่ Y ที่ขาดหายไป

Y~X

แต่ X หายไปบ่อยครั้งหรือไม่ตรงกัน

X~Z and Z does not impact Y- except through X.

จากนั้นคุณสามารถเรียกใช้:

 X~Z
 Y~Predicted(X)

และต้องการการปรับแต่งสำหรับข้อผิดพลาดมาตรฐาน

คุณอาจต้องการดูขั้นตอนขั้นตอน Heckmann 2 หากคุณมีตัวอย่างการขัดสีจำนวนมาก http://en.wikipedia.org/wiki/Heckman_correction


2

ฉันจะยืนยันว่าไม่เหมาะสมที่สุด

XY

การทิ้งข้อมูลที่หายไปทั้งหมดจากข้อมูลของคุณทำให้พารามิเตอร์ของคุณมีอคติ (หากข้อมูลไม่ใช่ MCAR ดูด้านบน) และลดความแม่นยำของการประมาณการของคุณอย่างมาก นี่คือการวิเคราะห์ "กรณีที่สมบูรณ์" และไม่น่าสนใจ

Y

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.