ฉันแค่สงสัยเกี่ยวกับคำถามเดียวกันทั้งหมดเมื่อวิเคราะห์ข้อมูลการสำรวจโรงพยาบาลแห่งชาติล่าสุด ตัวแปรหลายตัวมีค่าที่ขาดหายไปมากเช่นสถานะการสมรสและประเภทของขั้นตอน ปัญหานี้มาถึงความสนใจของฉันเพราะหมวดหมู่เหล่านี้ปรากฏขึ้นกับผลกระทบที่แข็งแกร่ง (และที่สำคัญ) ในการวิเคราะห์การถดถอยโลจิสติกส่วนใหญ่ที่ฉันกำลังทำงาน
มีใครสงสัยว่าทำไมรหัสที่หายไปจะได้รับ ในกรณีของสถานภาพการสมรสเป็นไปได้ที่ความล้มเหลวในการให้ข้อมูลนี้อาจเชื่อมโยงกับปัจจัยสำคัญเช่นสถานะทางเศรษฐกิจและสังคมหรือประเภทของโรค ในกรณีของคุณที่มีความดันโลหิตสูงเราควรถามว่าทำไมค่าจะไม่เป็นที่รู้จักหรือปฏิเสธ? สิ่งนี้อาจเกี่ยวข้องกับการปฏิบัติที่สถาบัน (อาจเป็นวิธีการที่หละหลวม) หรือแม้แต่กับบุคคล (เช่นความเชื่อทางศาสนา) ลักษณะเหล่านั้นอาจเกี่ยวข้องกับโรคเบาหวาน ดังนั้นดูเหมือนว่าจะดำเนินการต่อไปตามที่คุณคาดไว้แทนที่จะเขียนโค้ดเหล่านี้ว่าหายไป (ยกเว้นการวิเคราะห์ทั้งหมด) หรือพยายามที่จะกำหนดค่า (ซึ่งปิดบังข้อมูลที่พวกเขาให้และสามารถมีอคติผลลัพธ์) ไม่ยากอีกต่อไปที่จะทำ: คุณเพียงแค่ต้องแน่ใจว่าตัวแปรนี้ถือเป็นหมวดหมู่และคุณจะได้ค่าสัมประสิทธิ์เพิ่มขึ้นอีกหนึ่งตัวในผลลัพธ์การถดถอย นอกจากนี้ฉันสงสัยว่าชุดข้อมูล BRFSS มีขนาดใหญ่พอที่คุณไม่ต้องกังวลเกี่ยวกับพลังงาน