ตามที่เอ็มแคทซ์ในหนังสือของเขาวิเคราะห์หลายตัวแปร (มาตรา 1.2, หน้า 6), " ปัจจัยรบกวนมีความเกี่ยวข้องกับปัจจัยเสี่ยงที่เกี่ยวข้องและเหตุผลเพื่อผล. " ทำไมต้องปัจจัยรบกวนจะเหตุผลที่เกี่ยวข้องกับผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?
ตามที่เอ็มแคทซ์ในหนังสือของเขาวิเคราะห์หลายตัวแปร (มาตรา 1.2, หน้า 6), " ปัจจัยรบกวนมีความเกี่ยวข้องกับปัจจัยเสี่ยงที่เกี่ยวข้องและเหตุผลเพื่อผล. " ทำไมต้องปัจจัยรบกวนจะเหตุผลที่เกี่ยวข้องกับผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?
คำตอบ:
เหตุใดผู้ที่สับสนจึงต้องเกี่ยวข้องกับผลลัพธ์อย่างสมเหตุสมผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?
ไม่มันไม่เพียงพอ
เริ่มจากกรณีที่คุณสามารถมีตัวแปรซึ่งเกี่ยวข้องกับผลลัพธ์และการรักษา แต่การควบคุมมันจะทำให้คุณประเมิน
ในกรณีนี้ไม่มีความสับสนคุณสามารถประมาณผลกระทบของ X ต่อ Y ได้โดยตรง
อย่างไรก็ตามสังเกตุว่า Z มีความสัมพันธ์กับการรักษาและผลลัพธ์ แต่มันก็ยังไม่สับสน ในความเป็นจริงถ้าคุณควบคุม Z ในกรณีนี้คุณจะมีอคติประมาณการของคุณ สถานการณ์นี้เรียกว่า M-bias (เนื่องจากโครงสร้างกราฟ)
ที่นี่อีกครั้ง Z เกี่ยวข้องกับ X และ Y แต่ไม่ใช่ผู้ร่วมก่อตั้ง คุณไม่ควรควบคุมมัน
ทีนี้มันก็คุ้มค่าที่จะสังเกตว่าถึงแม้ว่าตัวแปรจะมีความสัมพันธ์เชิงสาเหตุกับผลลัพธ์แต่ก็ไม่จำเป็นต้องเป็นคนสับสน
ลองพิจารณากรณีของผู้ไกล่เกลี่ยในกราฟง่ายๆด้านล่าง:
หากคุณต้องการวัดผลรวมของ D ต่อ Y คุณไม่ควรควบคุมสิ่งที่ไกล่เกลี่ยเอฟเฟ็กต์ --- ในกรณีนี้ M นั่นคือ M มีความสัมพันธ์เชิงสาเหตุกับ Y แต่ก็ไม่ใช่คนสับสนที่เกี่ยวข้องกับ ผลรวมของ D ต่อ Y เช่นกัน
แจ้งให้ทราบล่วงหน้า แต่ที่กำหนดconfoudingจะง่ายกว่าการกำหนดสิ่งที่ปัจจัยรบกวนเป็น สำหรับการอภิปรายที่เข้มงวดมากขึ้นของความหมายของconfouder , คุณอาจต้องการที่จะอ่านบทความนี้โดย VanderWeele และ Shpitser
เหตุใดจึงเป็นเช่นนี้ เพราะแนวคิดหลักของที่นี่คือความสับสน สำหรับคำถามการวิจัยคุณควรถามตัวเองว่า "ฉันจะกำจัดสิ่งรบกวนได้อย่างไร" แทนที่จะเป็น "ตัวแปรนี้เป็นตัวรบกวนหรือไม่"
และในฐานะที่เป็นโน้ตสุดท้ายก็ควรค่าแก่การกล่าวถึงว่าความเข้าใจผิดเหล่านี้ยังคงแพร่หลายอยู่ เพียงเพื่ออธิบายให้ใช้การอ้างอิงนี้จากกระดาษ 2016 :
การอนุมานเชิงสาเหตุในกรณีที่ไม่มีการทดลองแบบสุ่มหรือการออกแบบการทดลองแบบกึ่งแข็งต้องมีการปรับเงื่อนไขตัวแปรการรักษาล่วงหน้าทั้งหมดอย่างเหมาะสมเพื่อทำนายการรักษาและผลลัพธ์
ดังที่เราได้แสดงในตัวอย่างก่อนหน้านี้สิ่งนี้ไม่ถูกต้อง Confounders ไม่ใช่ "ตัวแปรการรักษาล่วงหน้าทั้งหมดที่ทำนายทั้งการรักษาและผลลัพธ์" การควบคุมสำหรับสิ่งเหล่านั้นอาจไม่จำเป็นสำหรับการขจัดสิ่งรบกวนหรืออาจทำให้เกิดผลลัพธ์ของคุณได้ Pearl มีภาพรวมที่ดีมากในการรบกวนที่นี่