ทำไมการจับคู่คะแนนความชอบมีเหตุผลสำหรับการอนุมานสาเหตุ


13

การจับคู่คะแนนความชอบใช้สำหรับการหาสาเหตุในการศึกษาเชิงสังเกตการณ์ (ดูที่กระดาษ Rosenbaum / Rubin ) สัญชาตญาณง่าย ๆ ของเบื้องหลังทำไมมันทำงาน

อีกนัยหนึ่งทำไมถ้าเราแน่ใจว่าความน่าจะเป็นของการมีส่วนร่วมในการรักษานั้นเท่ากันทั้งสองกลุ่มผลข้างเคียงที่หายไปและเราสามารถใช้ผลลัพธ์เพื่อสรุปข้อสรุปเกี่ยวกับการรักษาได้?


8
ของฉันอาจเป็นความคิดเห็นที่ไม่เป็นที่นิยม แต่ฉันคิดว่าการที่ PSM อนุญาตให้คุณทำการอนุมานเชิงสาเหตุยืดออกไปเล็กน้อย ใช่มันเป็นวิธีการจับคู่ที่ดีกว่าการจับคู่แบบ "หยาบ" ในตัวแปรจำนวนหนึ่ง แต่ในตอนท้ายของวันคุณยังคงจับคู่เฉพาะกับตัวแปรที่สามารถสังเกตได้เท่านั้น คุณอาจยังคงได้รับการรักษาภายนอก แต่คุณสันนิษฐานว่าหลังจากการจับคู่การรักษาภายนอก แต่แล้วอีกครั้งฉันไม่มีใครเทียบกับชอบของรูบิน :)
กีส์เดอ Carabas

5
มีคนที่ไม่เห็นด้วยกับ Rosenbaum และ Rubin Gary King แย้งอย่างมีประสิทธิภาพว่าผลลัพธ์จากการจับคู่โดยใช้ PSM นั้นด้อยกว่าผลลัพธ์ที่ได้จากการจับคู่ตามระยะทาง Mahalanobis ดูกระดาษของเขาที่นี่ ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 นอกจากนี้การสัมมนาผ่านเว็บนี้มีหลักฐานที่น่าสนใจมากขึ้น ... methods-colloquium.com/
Mike Hunter

4
ในทางทฤษฎีคุณสามารถอนุมานสาเหตุได้โดยใช้แบบจำลองเชิงสาเหตุของรูบินถ้าพบสมมติฐานทั้งหมด แต่แน่นอนมารอยู่ในรายละเอียดของข้อสันนิษฐานเสมอและสำหรับฉันข้อสันนิษฐานของคนที่ไม่ได้รับความไว้วางใจมักเป็นเรื่องที่ยาก ในความเป็นจริงมันเป็นไปไม่ได้ที่จะพิสูจน์ แต่อย่างน้อยคุณสามารถทำการวิเคราะห์ความอ่อนไหวเพื่อกำหนดว่าจะต้องใช้อะไรเพื่อให้ข้อสรุปของคุณเปลี่ยนแปลงหากคุณมีคู่สนทนาที่ไม่ได้รับการตรวจสอบ
StatsStudent

5
จุดที่ดี @ จอห์นสัน นอกจากนี้ยังมีสิ่งที่ชอบของจูเดียเพิร์ลเอียนเชเออร์และอาร์วิดซอโจลันเดอร์ที่มีความสำคัญต่อศักยภาพของรูบินสำหรับการอนุมานสาเหตุเนื่องจากความเป็นไปได้ที่จะแนะนำ "M-bias" ผ่านสิ่งที่พวกเขาเรียกว่า พวกเขาน่าอ่านและควรเสริมการอ่านใด ๆ จาก Rubin
StatsStudent

คำตอบ:


12

ฉันจะพยายามทำให้คุณเข้าใจได้ง่ายขึ้นโดยเน้นที่คณิตศาสตร์น้อยที่สุด

ปัญหาหลักที่มีข้อมูลจากการสังเกตและการวิเคราะห์ที่เกิดจากมันคือความสับสน การรบกวนเกิดขึ้นเมื่อตัวแปรส่งผลกระทบไม่เพียง แต่การรักษาที่ได้รับมอบหมาย แต่ยังรวมถึงผลลัพธ์ด้วย เมื่อทำการทดลองแบบสุ่มกลุ่มตัวอย่างจะได้รับการสุ่มเพื่อการรักษาดังนั้นโดยเฉลี่ยแล้วอาสาสมัครที่ได้รับมอบหมายให้รักษาแต่ละคนควรมีความคล้ายคลึงกันกับผู้ที่ได้รับการเลี้ยงดู (อายุเชื้อชาติเพศ ฯลฯ ) เป็นผลมาจากการสุ่มนี้ไม่น่า (โดยเฉพาะอย่างยิ่งในกลุ่มตัวอย่างขนาดใหญ่) ที่ความแตกต่างในผลมาจากการ covariates ใด ๆ แต่เนื่องจากการรักษาที่ใช้เนื่องจากเฉลี่ย covariates ในกลุ่มการรักษามีความคล้ายคลึงกัน

ในทางตรงกันข้ามกับข้อมูลการสังเกตไม่มีกลไกการสุ่มที่กำหนดวิชาที่จะรักษา ยกตัวอย่างเช่นการศึกษาเพื่อตรวจสอบอัตราการรอดชีวิตของผู้ป่วยหลังการผ่าตัดหัวใจใหม่เมื่อเทียบกับขั้นตอนการผ่าตัดมาตรฐาน โดยทั่วไปแล้วไม่สามารถสุ่มผู้ป่วยแต่ละขั้นตอนด้วยเหตุผลทางจริยธรรม เป็นผลให้ผู้ป่วยและแพทย์เลือกด้วยตนเองเป็นหนึ่งในการรักษามักจะเกิดจากเหตุผลหลายประการที่เกี่ยวข้องกับ covariates ของพวกเขา ตัวอย่างเช่นขั้นตอนใหม่อาจค่อนข้างเสี่ยงหากคุณมีอายุมากขึ้นและแพทย์อาจแนะนำให้รักษาผู้ป่วยอายุน้อยได้บ่อยขึ้น หากสิ่งนี้เกิดขึ้นและคุณดูที่อัตราการรอดชีวิตการรักษาใหม่อาจดูเหมือนมีประสิทธิภาพมากขึ้น แต่สิ่งนี้อาจทำให้เข้าใจผิดได้เนื่องจากผู้ป่วยอายุน้อยได้รับมอบหมายให้รักษานี้และผู้ป่วยอายุน้อยมักจะมีอายุยืนยาวขึ้น ทุกอย่างเท่าเทียมกัน นี่คือที่คะแนนความชอบเข้ามามีประโยชน์

คะแนนความน่าเชื่อถือช่วยให้มีปัญหาพื้นฐานของการอนุมานสาเหตุ - ซึ่งคุณอาจสับสนเนื่องจากการไม่สุ่มตัวอย่างของการรักษาและนี่อาจเป็นสาเหตุของ "ผลกระทบ" ที่คุณเห็นมากกว่าการแทรกแซงหรือการรักษาเพียงอย่างเดียว หากคุณสามารถปรับเปลี่ยนการวิเคราะห์ของคุณเพื่อให้โควาเรีย (อายุเพศเพศสถานะสุขภาพ) มี“ สมดุล” ระหว่างกลุ่มการรักษาคุณจะมีหลักฐานที่ชัดเจนว่าความแตกต่างของผลลัพธ์เกิดจากการแทรกแซง / การรักษา มากกว่า covariates เหล่านี้ คะแนนความเป็นไปได้กำหนดความน่าจะเป็นของแต่ละวิชาที่ได้รับมอบหมายให้รักษาที่พวกเขาได้รับเนื่องจากชุดของโควารีที่สังเกตได้ หากคุณจับคู่กับความน่าจะเป็นเหล่านี้ (คะแนนความชอบ)

คุณอาจถามว่าทำไมไม่ตรงกับ covariates (เช่นให้แน่ใจว่าคุณตรงกับชายชราอายุ 40 ปีในสุขภาพที่ดีในการรักษา 1 กับผู้ชายอายุ 40 ปีในสุขภาพที่ดีในการรักษา 2)? วิธีนี้ใช้ได้ผลดีสำหรับตัวอย่างขนาดใหญ่และ covariates สองสามอัน แต่แทบจะเป็นไปไม่ได้เลยที่จะทำเมื่อขนาดตัวอย่างเล็กและจำนวน covariates ยังมีขนาดปานกลาง .

ตอนนี้ทั้งหมดนี้ถูกกล่าวว่าจุดอ่อนของคะแนนความชอบคือข้อสันนิษฐานของคนที่ไม่มีคนรู้จัก สมมติฐานนี้ระบุว่าคุณไม่ได้ล้มเหลวในการรวม covariates ใด ๆ ในการปรับค่าใช้จ่ายของคุณซึ่งเป็นคู่หูที่อาจเกิดขึ้นได้ สังหรณ์ใจเหตุผลที่อยู่เบื้องหลังนี้คือถ้าคุณยังไม่ได้รวม confounder เมื่อสร้างคะแนนความชอบคุณจะปรับได้อย่างไร นอกจากนี้ยังมีข้อสันนิษฐานเพิ่มเติมเช่นสมมติฐานค่ารักษาหน่วยที่มั่นคงซึ่งระบุว่าการรักษาที่กำหนดให้กับหนึ่งวิชาไม่ส่งผลกระทบต่อผลลัพธ์ที่เป็นไปได้ของวิชาอื่น ๆ


7

ในความหมายที่เข้มงวดการปรับคะแนนความชอบไม่มีส่วนเกี่ยวข้องกับการอนุมานสาเหตุมากกว่าการสร้างแบบจำลองการถดถอย ความแตกต่างที่แท้จริงเพียงอย่างเดียวกับคะแนนความชอบคือพวกเขาทำให้ง่ายต่อการปรับเปลี่ยนสำหรับนักรบกวนที่มีศักยภาพที่สังเกตได้มากกว่าขนาดตัวอย่างนั้นอาจทำให้แบบจำลองการถดถอยรวม การปรับคะแนนความชอบ (ทำได้ดีที่สุดผ่านการปรับ covariate ในกรณีส่วนใหญ่โดยใช้ spline ใน logit PS) สามารถคิดได้ว่าเป็นเทคนิคการลดข้อมูลที่มีการลดลงตามแกนที่สำคัญ - รบกวน อย่างไรก็ตามมันไม่ได้จัดการกับความแตกต่างของผลลัพธ์ (อคติต่อความอ่อนไหว) ดังนั้นคุณต้องปรับตัวสำหรับตัวแปรสำคัญที่สำคัญแม้ว่าจะใช้โพรเพนซิตี (ดูประเด็นที่เกี่ยวข้องกับการไม่ยุบตัวของอัตราต่อรอง

การจับคู่คะแนนความชอบสามารถยกเว้นการสังเกตจำนวนมากและทำให้ไม่มีประสิทธิภาพมากนัก ฉันดูวิธีการใด ๆ ที่ไม่รวมข้อสังเกตที่เกี่ยวข้องว่าเป็นปัญหา ปัญหาที่แท้จริงของการจับคู่คือมันไม่รวมการสังเกตที่จับคู่ได้ง่ายเนื่องจากความต้องการการรับรู้ที่มีการจับคู่ 1: 1 และอัลกอริทึมการจับคู่ส่วนใหญ่นั้นขึ้นอยู่กับลำดับการสังเกต

โปรดทราบว่ามันง่ายมากเมื่อทำการปรับการถดถอยมาตรฐานเพื่อให้เกิดความสับสนในการตรวจสอบและยกเว้นภูมิภาคที่ไม่ทับซ้อนกัน ผู้ใช้คะแนนความชอบจะได้รับการสอนให้ทำสิ่งนี้และผู้สร้างแบบจำลองการถดถอยด้วยเหตุผลเพียงอย่างเดียวคือพวกเขาไม่ได้รับการสอน

การวิเคราะห์คะแนนความน่าจะซ่อนการโต้ตอบใด ๆ กับการสัมผัสและการจับคู่คะแนนความชอบนอกจากนี้ความสัมพันธ์ที่เป็นไปได้ระหว่าง PS และผลการรักษา

การวิเคราะห์ความไว (สำหรับผู้สับสนที่ไม่ได้วัด) ได้รับการดำเนินการสำหรับ PS แต่ทำได้ง่ายยิ่งขึ้นด้วยการสร้างแบบจำลองการถดถอยมาตรฐาน

หากคุณใช้วิธีการถดถอยแบบยืดหยุ่นเพื่อประมาณค่า PS (เช่นอย่าสันนิษฐานว่าตัวแปรต่อเนื่องทำหน้าที่เป็นเส้นตรง) คุณไม่จำเป็นต้องตรวจสอบยอดคงเหลือ - ต้องมียอดคงเหลือหรือรูปแบบการถดถอย PS ไม่ได้ระบุอย่างถูกต้องในตอนเริ่มต้น . คุณจะต้องตรวจสอบว่าไม่มีการทับซ้อนกัน นี่ถือว่าไม่มีการโต้ตอบที่สำคัญที่ถูกตัดออกจากโมเดลความชอบ การจับคู่ทำให้สมมติฐานเดียวกัน


3

ฉันขอแนะนำให้ตรวจสอบเศรษฐมิติที่ไม่เป็นอันตราย - พวกเขามีคำอธิบายที่ดีเกี่ยวกับเรื่องนี้ในระดับที่เข้าใจง่าย

xiY0ผม,Y1ผมxY0ผม,Y1ผมxY0ผม,Y1ผม มีความสัมพันธ์กับการรักษา

xxxxx

xxxx

Y0ผม,Y1ผมxผมพี(xผม)พี(x)xx

พี(x)xxxY0ผม,Y1ผมจะไม่เกี่ยวข้องกับการรักษา เงื่อนไขนี้ทำให้มั่นใจได้ว่าความแตกต่างของค่าเฉลี่ยตัวอย่างย่อยของผลลัพธ์ระหว่างการรักษาและไม่ได้รับการรักษาเป็นค่าประมาณที่สอดคล้องกันของผลการรักษาโดยเฉลี่ยในตัวอย่างย่อยนี้เช่น

E[Yผม|ได้รับการรักษา,พี(x)]-E[Yผม|ไม่ถูกรักษา,พี(x)]

เป็นการประมาณการที่สอดคล้องกันของผลการรักษาโดยเฉลี่ยในท้องถิ่น

อ่านเพิ่มเติม:

เราควรใช้การจับคู่คะแนนความชอบในทางปฏิบัติจริงหรือไม่

คำถามที่เกี่ยวข้องเปรียบเทียบการจับคู่และการถดถอย


1

มัน "ทำงาน" ด้วยเหตุผลเดียวกับที่การถดถอย "ทำงาน" - คุณควบคุมปัจจัยที่ทำให้สับสนทั้งหมด

คุณสามารถควบคุมการวิเคราะห์ดังกล่าวได้โดยใช้โมเดลการถดถอยที่ระบุอย่างสมบูรณ์พร้อมกับตัวแปรที่สับสนหลายตัวหรือแบบจำลองการถดถอยที่มีเพียงตัวแปรเดียวเท่านั้น - คะแนนความชอบ (ซึ่งอาจเป็นหรือไม่เป็นรูปแบบที่ซับซ้อนเท่ากัน คุณสามารถยึดติดกับการถดถอยนี้กับคะแนนความชอบหรือคุณสามารถเปรียบเทียบการตอบสนองภายในกลุ่มที่คล้ายกันซึ่งความคล้ายคลึงกันถูกกำหนดโดยคะแนนความชอบ ในจิตวิญญาณคุณกำลังทำสิ่งเดียวกัน แต่บางคนรู้สึกว่าวิธีหลังดีกว่าเน้นภารกิจเชิงสาเหตุที่ดีกว่า

อัปเดตข้อเสนอแนะดังต่อไปนี้

Y(0),Y(1)T|XY(0),Y(1)T|พี(X),
และอ่านเกี่ยวกับการจับคู่เพื่อนบ้านที่ใกล้ที่สุดรุ่นหนึ่งที่เรียกว่า "การจับคู่คาลิปเปอร์" (หน้า 108) ซึ่งคะแนนความชอบของการรักษาและกรณีการควบคุมที่ใกล้ที่สุดจะต้องอยู่ในระยะห่างสูงสุด ในกรณีนี้วิธีนี้จะยังคงทำงานโดยการปรับคะแนนความชอบโดยใช้อะนาล็อกแบบไม่พารามิเตอร์เพื่อการถดถอย แต่ยังทำให้ชัดเจนว่าสิ่งใดที่ไม่สามารถทราบได้จากข้อมูลเพียงอย่างเดียว (โดยไม่มีแบบจำลองเพื่อคาดการณ์ ปริมาณสาเหตุที่ได้รับข้อมูลที่มีอยู่

1
คำตอบนี้ถูกกำหนดไว้ว่าจะไม่ชอบเพราะมันทำให้วิธีคะแนนคะแนนความเอนเอียงลดลงเมื่อเปรียบเทียบกับการถดถอยซึ่งเป็นคำที่สกปรกในวงกลมสาเหตุ แต่คำตอบชั้นนำยอมรับว่า "จุดอ่อนของคะแนนความชอบเป็นข้อสันนิษฐานของคนที่ไม่มีคนรู้จัก" มันเป็นส้น Achilles ที่ค่อนข้างใหญ่ สมมติว่าเป็นไปตามข้อสันนิษฐานและฉันได้รับชุดข้อมูลพร้อมกับคู่หูทั้งหมดในจักรวาล ช่วยฉันเข้าใจว่าทำไมการถดถอยไม่ทำงานเพื่อค้นหาความจริงเชิงสาเหตุ แต่การจับคู่คะแนนความโน้มเอียงจะเกิดขึ้น
Ben Ogorek

1
เหตุผลที่การถดถอยมักเป็นปัญหาก็คือผลลัพธ์จากการถดถอยนั้นเป็นสิ่งที่คาดการณ์ ด้วยคะแนนความชอบทำให้เรามั่นใจได้ว่าระหว่างการตรวจสอบความสมดุลของโควารีเอทว่ามีการซ้อนทับกันที่เพียงพอระหว่างกลุ่มการรักษา นี่ไม่ใช่กรณีในการถดถอยและสามารถนำไปสู่การประมาณการที่ไม่ถูกต้องเนื่องจากไม่มีการตรวจสอบวินิจฉัยมาตรฐานที่จะบอกคุณว่าแบบจำลองการถดถอยของคุณกำลังคาดการณ์ นั่นเป็นเหตุผลที่ฉันมักจะใช้การตรวจสอบคะแนนสมดุลนิสัยชอบแม้ว่าฉันจะใช้โมเดลการถดถอยและไม่ได้วางแผนที่จะใช้คะแนนนิสัยชอบด้วยตนเอง
StatsStudent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.