Confounder - คำจำกัดความ


14

ตามที่เอ็มแคทซ์ในหนังสือของเขาวิเคราะห์หลายตัวแปร (มาตรา 1.2, หน้า 6), " ปัจจัยรบกวนมีความเกี่ยวข้องกับปัจจัยเสี่ยงที่เกี่ยวข้องและเหตุผลเพื่อผล. " ทำไมต้องปัจจัยรบกวนจะเหตุผลที่เกี่ยวข้องกับผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?


5
สวัสดี @marco ยินดีต้อนรับสู่เว็บไซต์! Miguel Hernanมีไฟล์ PDF ของหนังสือ "Causal Inference" ฟรี ส่วนที่ 1 (บทที่ 7 ในหน้า 83) กล่าวถึงโครงสร้างของการรบกวน นั่นอาจเป็นการอ่านที่น่าสนใจ โดยเฉพาะเขาเขียนว่า: "การรบกวนคือความเอนเอียงที่เกิดขึ้นเมื่อการรักษาและผลลัพธ์มีสาเหตุร่วมกัน"
COOLSerdash

2
โพสต์นี้ยังให้ความกระจ่างในการทำให้สับสน
COOLSerdash

คำตอบ:


21

เหตุใดผู้ที่สับสนจึงต้องเกี่ยวข้องกับผลลัพธ์อย่างสมเหตุสมผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?

ไม่มันไม่เพียงพอ

เริ่มจากกรณีที่คุณสามารถมีตัวแปรซึ่งเกี่ยวข้องกับผลลัพธ์และการรักษา แต่การควบคุมมันจะทำให้คุณประเมิน

Z

ป้อนคำอธิบายรูปภาพที่นี่

ในกรณีนี้ไม่มีความสับสนคุณสามารถประมาณผลกระทบของ X ต่อ Y ได้โดยตรง

อย่างไรก็ตามสังเกตุว่า Z มีความสัมพันธ์กับการรักษาและผลลัพธ์ แต่มันก็ยังไม่สับสน ในความเป็นจริงถ้าคุณควบคุม Z ในกรณีนี้คุณจะมีอคติประมาณการของคุณ สถานการณ์นี้เรียกว่า M-bias (เนื่องจากโครงสร้างกราฟ)

XY

ป้อนคำอธิบายรูปภาพที่นี่

ที่นี่อีกครั้ง Z เกี่ยวข้องกับ X และ Y แต่ไม่ใช่ผู้ร่วมก่อตั้ง คุณไม่ควรควบคุมมัน

ทีนี้มันก็คุ้มค่าที่จะสังเกตว่าถึงแม้ว่าตัวแปรจะมีความสัมพันธ์เชิงสาเหตุกับผลลัพธ์แต่ก็ไม่จำเป็นต้องเป็นคนสับสน

ลองพิจารณากรณีของผู้ไกล่เกลี่ยในกราฟง่ายๆด้านล่าง:

ป้อนคำอธิบายรูปภาพที่นี่

หากคุณต้องการวัดผลรวมของ D ต่อ Y คุณไม่ควรควบคุมสิ่งที่ไกล่เกลี่ยเอฟเฟ็กต์ --- ในกรณีนี้ M นั่นคือ M มีความสัมพันธ์เชิงสาเหตุกับ Y แต่ก็ไม่ใช่คนสับสนที่เกี่ยวข้องกับ ผลรวมของ D ต่อ Y เช่นกัน


แจ้งให้ทราบล่วงหน้า แต่ที่กำหนดconfoudingจะง่ายกว่าการกำหนดสิ่งที่ปัจจัยรบกวนเป็น สำหรับการอภิปรายที่เข้มงวดมากขึ้นของความหมายของconfouder , คุณอาจต้องการที่จะอ่านบทความนี้โดย VanderWeele และ Shpitser

เหตุใดจึงเป็นเช่นนี้ เพราะแนวคิดหลักของที่นี่คือความสับสน สำหรับคำถามการวิจัยคุณควรถามตัวเองว่า "ฉันจะกำจัดสิ่งรบกวนได้อย่างไร" แทนที่จะเป็น "ตัวแปรนี้เป็นตัวรบกวนหรือไม่"

และในฐานะที่เป็นโน้ตสุดท้ายก็ควรค่าแก่การกล่าวถึงว่าความเข้าใจผิดเหล่านี้ยังคงแพร่หลายอยู่ เพียงเพื่ออธิบายให้ใช้การอ้างอิงนี้จากกระดาษ 2016 :

การอนุมานเชิงสาเหตุในกรณีที่ไม่มีการทดลองแบบสุ่มหรือการออกแบบการทดลองแบบกึ่งแข็งต้องมีการปรับเงื่อนไขตัวแปรการรักษาล่วงหน้าทั้งหมดอย่างเหมาะสมเพื่อทำนายการรักษาและผลลัพธ์

ดังที่เราได้แสดงในตัวอย่างก่อนหน้านี้สิ่งนี้ไม่ถูกต้อง Confounders ไม่ใช่ "ตัวแปรการรักษาล่วงหน้าทั้งหมดที่ทำนายทั้งการรักษาและผลลัพธ์" การควบคุมสำหรับสิ่งเหล่านั้นอาจไม่จำเป็นสำหรับการขจัดสิ่งรบกวนหรืออาจทำให้เกิดผลลัพธ์ของคุณได้ Pearl มีภาพรวมที่ดีมากในการรบกวนที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.