ฉันมีมาตรการซ้ำ ๆ ที่ 2 ครั้งในกลุ่มตัวอย่าง มีคน 18k ในเวลา 1 และ 13k ในเวลา 2 (5,000 คนหายไปจากการติดตาม)
ฉันต้องการถอยหลังผลลัพธ์ Y ที่วัดได้ในเวลา 2 (และผลลัพธ์ไม่สามารถวัดได้ในเวลา 1) ในชุดของตัวทำนาย X วัดในเวลาที่ 1 ตัวแปรทั้งหมดมีข้อมูลที่ขาดหายไปบางส่วน ส่วนใหญ่มันจะค่อนข้างสุ่มหรือความหายไปดูเหมือนจะอธิบายได้ดีจากข้อมูลที่สังเกต อย่างไรก็ตามการหายไปส่วนใหญ่ในผลลัพธ์ Y นั้นเกิดจากการติดตามผลที่สูญเสียไป ฉันจะใช้การใส่หลายครั้ง (R :: mice) และจะใช้ชุดข้อมูลแบบเต็มเพื่อใส่ค่าสำหรับ X แต่ฉันได้รับคำแนะนำที่ขัดแย้งกัน 2 ชิ้นเกี่ยวกับการใส่ความเห็นของ Y:
1) Impute Y จาก X และ V (V = ตัวแปรเสริมที่มีประโยชน์) ในตัวอย่างเต็มรูปแบบของ 18k
2) ห้ามใส่ Y ในการติดตามบุคคล (และทำให้พวกเขาตกจากการสร้างแบบจำลองการถดถอยตามมา)
อดีตมีเหตุผลเพราะข้อมูลเป็นข้อมูลดังนั้นทำไมไม่ใช้มันทั้งหมด แต่สิ่งหลังนั้นสมเหตุสมผลด้วยวิธีที่เข้าใจง่ายกว่า - ดูเหมือนผิดที่จะใส่ร้ายผลลัพธ์สำหรับคน 5000 คนบนพื้นฐานของ Y ~ X + V แล้วหันหลังกลับและประมาณ Y ~ X
ข้อใดถูกต้อง (เพิ่มเติม)
คำถามก่อนหน้านี้มีประโยชน์ แต่ไม่ได้เน้นที่ความหายไปโดยตรงเนื่องจากการติดตามผลหายไป (แม้ว่าอาจจะเป็นคำตอบเดียวกัน แต่ฉันไม่รู้)