ฉันคิดว่าการสร้างแบบจำลองเชิงสาเหตุเป็นกุญแจสำคัญในการตอบคำถามนี้ สิ่งแรกคือต้องเผชิญกับการเริ่มต้นเพื่อระบุผลที่ถูกต้อง / การแบ่งชั้น / การควบคุมที่ถูกต้องก่อนที่จะดูข้อมูล ถ้าฉันจะประเมินความสัมพันธ์ความสูง / ความจุปอดในผู้ใหญ่ฉันจะปรับสถานะการสูบบุหรี่เนื่องจากการสูบบุหรี่ต้องเลิกการเจริญเติบโตและมีผลต่อความจุปอด Confounders เป็นตัวแปรที่เกี่ยวข้องกับสาเหตุของการทำนายผลประโยชน์และสัมพันธ์กับผลลัพธ์ของผลประโยชน์ ดู Causality จาก Judea Pearl, 2nd ed. หนึ่งควรระบุและพลังการวิเคราะห์ของพวกเขาสำหรับตัวแปรรบกวนที่ถูกต้องก่อนที่กระบวนการรวบรวมข้อมูลจะเริ่มใช้ตรรกะเหตุผลและความรู้ก่อนหน้านี้จากการศึกษาเชิงสำรวจก่อนหน้านี้
R2สำหรับโมเดลเชิงเส้นสำหรับตัวแปรการปรับค่าเหล่านี้ อีกกระบวนการที่พบบ่อยในระบาดวิทยาคือที่ซึ่งตัวแปรถูกเพิ่มเข้ากับโมเดลเท่านั้นหากพวกเขาเปลี่ยนการประเมินผลกระทบหลัก (เช่นอัตราส่วนอัตราต่อรองหรืออัตราส่วนอันตราย) อย่างน้อย 10% แม้ว่านี่จะถูกต้องมากกว่าการเลือกแบบจำลอง AIC แต่ก็ยังคิดว่ามีข้อควรระวังสำคัญในวิธีการนี้
ข้อเสนอแนะของฉันคือการวิเคราะห์ที่ต้องการล่วงหน้าซึ่งเป็นส่วนหนึ่งของสมมติฐาน การปรับความเสี่ยงในการสูบบุหรี่ / มะเร็งอายุเป็นพารามิเตอร์ที่แตกต่างกันและนำไปสู่การอนุมานที่แตกต่างกันในการศึกษาที่มีการควบคุมมากกว่าความเสี่ยงการสูบบุหรี่ / มะเร็งดิบ การใช้ความรู้ในสาระการเรียนรู้เป็นวิธีที่ดีที่สุดในการเลือกตัวทำนายสำหรับการปรับในการวิเคราะห์การถดถอยหรือการแบ่งชั้นการจับคู่หรือตัวแปรถ่วงน้ำหนักในการวิเคราะห์ "ควบคุม" ประเภทอื่น ๆ ของการออกแบบการทดลองและกึ่งทดลอง