คะแนนความชอบต่างจากการเพิ่ม covariates ในการถดถอยอย่างไรและเมื่อใดที่พวกเขาต้องการคะแนนหลัง


41

ฉันยอมรับว่าฉันค่อนข้างใหม่กับคะแนนความชอบและการวิเคราะห์เชิงสาเหตุ

สิ่งหนึ่งที่ไม่ชัดเจนสำหรับฉันในฐานะผู้มาใหม่คือ "การปรับสมดุล" โดยใช้คะแนนความชอบมีความแตกต่างทางคณิตศาสตร์จากสิ่งที่เกิดขึ้นเมื่อเราเพิ่ม covariates ลงในการถดถอย มีอะไรแตกต่างกันเกี่ยวกับการผ่าตัดและทำไมมันถึงดีกว่าการเพิ่มประชากรย่อยในการถดถอย

ฉันเคยเห็นการศึกษาบางอย่างที่ทำการเปรียบเทียบเชิงประจักษ์ของวิธีการ แต่ฉันไม่เคยเห็นการสนทนาที่ดีเกี่ยวกับคุณสมบัติทางคณิตศาสตร์ของทั้งสองวิธีและทำไม PSM ให้ยืมตัวเองไปสู่การตีความเชิงสาเหตุ ดูเหมือนจะมีความสับสนและการโต้เถียงกันมากมายในสาขานี้ซึ่งทำให้สิ่งต่าง ๆ ยากขึ้น

ความคิดใด ๆ เกี่ยวกับสิ่งนี้หรือตัวชี้ไปยังแหล่งข้อมูลที่ดี / กระดาษเพื่อทำความเข้าใจความแตกต่าง? (ฉันค่อย ๆ เดินผ่านหนังสือเวรกรรมของจูเดียเพิร์ลดังนั้นไม่จำเป็นต้องชี้ให้ฉันเห็น)


3
แนะนำให้คุณอ่านมอร์แกนและ Winship 2007 บทที่ 4 และ 5 ทำการเปรียบเทียบอย่างชัดเจนและความคมชัดของการถดถอยและการจับคู่สำหรับการระบุผลกระทบเชิงสาเหตุ
conjugateprior

1
เมื่อคุณตรวจสอบสถิติยอดคงเหลือคุณจะมั่นใจได้ว่าไม่มีการคาดการณ์ระหว่างกลุ่มการรักษาที่คุณกำลังเปรียบเทียบกับพื้นที่ covariate หลายมิติ การถดถอยเพียงประมาณค่าโดยไม่ตรวจสอบสิ่งนี้ดังนั้นการคาดการณ์สามารถให้การคาดการณ์ที่ไม่ดีได้
StatsStudent

คำตอบ:


17

ความแตกต่างที่สำคัญอย่างหนึ่งคือการถดถอย "ควบคุม" ลักษณะเหล่านั้นในแบบเชิงเส้น การจับคู่ด้วยคะแนนความชอบช่วยขจัดข้อสมมติเชิงเส้น แต่เนื่องจากข้อสังเกตบางอย่างอาจไม่ตรงกันคุณอาจไม่สามารถพูดอะไรเกี่ยวกับกลุ่มบางกลุ่มได้

ตัวอย่างเช่นหากคุณกำลังศึกษาโครงการฝึกอบรมผู้ปฏิบัติงานคุณอาจมีผู้สมัครทั้งหมดเป็นผู้ชาย แต่การควบคุมประชากรที่ไม่เข้าร่วมจะประกอบด้วยผู้ชายและผู้หญิง เมื่อใช้การถดถอยคุณสามารถถดถอยรายได้พูดกับตัวแปรตัวบ่งชี้การมีส่วนร่วมและตัวบ่งชี้ชาย คุณจะใช้ข้อมูลทั้งหมดของคุณและสามารถประเมินรายได้ของผู้หญิงที่เธอเข้าร่วมในโปรแกรม

หากคุณทำการจับคู่คุณสามารถจับคู่ผู้ชายกับผู้ชายเท่านั้น เป็นผลให้คุณจะไม่ใช้ผู้หญิงคนใดในการวิเคราะห์ของคุณและผลลัพธ์ของคุณจะไม่เกี่ยวข้องกับพวกเขา

การถดถอยสามารถประมาณค่าได้โดยใช้ข้อสมมติเชิงเส้น แต่การจับคู่ไม่สามารถทำได้ สมมติฐานอื่น ๆ ทั้งหมดจะเหมือนกันระหว่างการถดถอยและการจับคู่ ประโยชน์ของการจับคู่เหนือการถดถอยก็คือมันไม่ใช่พารามิเตอร์ (ยกเว้นคุณต้องสมมติว่าคุณมีคะแนนความชอบที่ถูกต้องหากนั่นคือวิธีที่คุณทำการจับคู่)

สำหรับการสนทนาเพิ่มเติมดูหน้าของฉันที่นี่สำหรับหลักสูตรที่เน้นวิธีการจับคู่อย่างมาก ดูโดยเฉพาะอย่างยิ่งสมมติฐานเชิงสาเหตุผลกระทบต่อการประเมินกลยุทธ์

นอกจากนี้อย่าลืมอ่านบทความRosenbaum และ Rubin (1983)ที่สรุปการจับคู่คะแนนความชอบ

ท้ายสุดการจับคู่มานานตั้งแต่ปี 1983 ลองดูหน้าเว็บของ Jas Sekhonเพื่อเรียนรู้เกี่ยวกับอัลกอริทึมการจับคู่ทางพันธุกรรมของเขา


3
อาจเป็นเพราะฉันไม่ใช่นักสถิติ แต่เมื่อคุณดูเหมือนว่าคุณจะใช้การถดถอยเชิงเส้นเมื่อ OP ถามเกี่ยวกับการถดถอยโดยทั่วไป แต่ฉันเดาว่าสิ่งสำคัญคือการเพิ่ม covariates ให้กับ regressor ชนิดใดทำให้สมมติฐานบางอย่างเกี่ยวกับพื้นที่อินพุตดังนั้นมันจึงสามารถคาดการณ์ถึงตัวอย่างใหม่
rrenaud

2
คุณทำสมมติฐานบางอย่างเกี่ยวกับรูปแบบการทำงานของตัวแปรที่รบกวนเมื่อคุณประเมินฟังก์ชันความเอนเอียง ต่อมาคุณยังจับคู่กับบุคคลที่มีค่า "ใกล้เคียง" ของความชอบดังนั้นฉันจะไม่คิดทันทีว่าการจับคู่ความเอนเอียงจะแก้ปัญหาของเอฟเฟกต์แบบไม่เชิงเส้น
AdamO

2
ลิงก์เสีย
Carlos Cinelli

11

คำตอบสั้น ๆ คือคะแนนความชอบนั้นไม่ได้ดีไปกว่าแบบจำลอง ANCOVA ที่เทียบเท่าโดยเฉพาะอย่างยิ่งในเรื่องการตีความเชิงสาเหตุ

คะแนนความชอบนั้นเป็นวิธีการลดข้อมูลที่ดีที่สุด เป็นวิธีที่มีประสิทธิภาพในการลดโควาเรียร์จำนวนมากให้เป็นคะแนนเดียวซึ่งสามารถใช้เพื่อปรับเอฟเฟกต์ของดอกเบี้ยสำหรับชุดตัวแปร ในการทำเช่นนี้คุณประหยัดองศาอิสระโดยการปรับคะแนนความชอบเดียวแทนที่จะเป็นเพื่อนร่วมหลายคน สิ่งนี้นำเสนอข้อได้เปรียบทางสถิติอย่างแน่นอน แต่ไม่มีอะไรเพิ่มเติม

คำถามหนึ่งที่อาจเกิดขึ้นเมื่อใช้การปรับการถดถอยด้วยคะแนนความชอบคือว่ามีประโยชน์ในการใช้คะแนนความเอนเอียงมากกว่าการปรับการถดถอยด้วย covariates ทั้งหมดที่ใช้ในการประเมินคะแนนความชอบรวมอยู่ในแบบจำลองหรือไม่ Rosenbaum และ Rubin แสดงให้เห็นว่า "การประเมินจุดของผลการรักษาจากการวิเคราะห์การปรับความแปรปรวนร่วมสำหรับตัวแปรหลายตัวแปร X เท่ากับการประมาณที่ได้จากการปรับค่าความแปรปรวนร่วม univariate สำหรับการจำแนกเชิงเส้นตัวอย่างตาม X เมื่อใดก็ตามที่เมทริกซ์ความแปรปรวนร่วมตัวอย่างเดียวกัน สำหรับทั้งการปรับความแปรปรวนร่วมและการวิเคราะห์จำแนก " ดังนั้นผลลัพธ์จากทั้งสองวิธีควรนำไปสู่ข้อสรุปเดียวกัน อย่างไรก็ตาม ข้อดีอย่างหนึ่งในการดำเนินการตามกระบวนการสองขั้นตอนคือการที่หนึ่งสามารถพอดีกับรูปแบบคะแนนความชอบที่ซับซ้อนมากกับการโต้ตอบและเงื่อนไขการสั่งซื้อที่สูงขึ้นก่อน เนื่องจากเป้าหมายของแบบจำลองคะแนนความโน้มเอียงนี้คือการได้รับโอกาสในการรักษาที่ดีที่สุดโดยประมาณจึงไม่เกี่ยวข้องกับการกำหนดพารามิเตอร์มากเกินไปของแบบจำลองนี้

จาก:

วิธีการประเมินความเป็นไปได้ในการลดก๊าซชีวภาพในการเปรียบเทียบกลุ่มการรักษากับกลุ่มควบคุมที่ไม่ได้ควบคุม

D 'Agostino (ข้อความจาก Rosenbaum และ Rubin)

D'agostino, RB 1998 คะแนนความชอบจับคู่เพื่อลดอคติในการเปรียบเทียบการรักษากับกลุ่มควบคุมที่ไม่ได้สุ่ม เวชศาสตร์สถิติ 17: 2265–2281


5
(+1) นอกจากนี้ยังมีหัวข้อที่น่าสนใจเกี่ยวกับปัญหาเวรกรรมในคำถามที่เกี่ยวข้องนี้จากมุมมองทางสถิติเราสามารถสรุปความเป็นเวรกรรมโดยใช้คะแนนความชอบด้วยการศึกษาเชิงสังเกตการณ์ได้หรือไม่? .
chl

3
ฉันเห็นด้วยกับสถานที่ตั้งทั่วไปของคำตอบนี้ แต่เมื่อการแข่งขันหนึ่งรายการขึ้นอยู่กับคะแนนความชอบมันจะไม่เหมือนกับการแปรสภาพ covariates ทั้งหมดลงในแบบจำลอง (และไม่ใช่เพียงเทคนิคการลดขนาด) มันไม่เหมือนกันหากน้ำหนักตัวเดียวด้วยคะแนนความชอบเช่นกัน
Andy W

1
ฉันไม่เห็นด้วยกับคำตอบนี้ คะแนนความชอบโดยประมาณนั้นดีเมื่อพวกเขาปรับค่าความแปรปรวนร่วมในการรักษาและกลุ่มควบคุมและไม่ดีเมื่อไม่ เช่นเดียวกับวิธีการปรับเงื่อนไขการถดถอย ไม่ว่าพวกเขาจะ 'ดีกว่า' ขึ้นอยู่กับคุณสมบัตินั้นเท่านั้นซึ่งจะแตกต่างกันไปในแต่ละปัญหา
conjugateprior

1
ฉันไม่เห็นด้วยเพราะในขณะที่เกณฑ์ความสมดุลเป็นเหมือนกันทั้งสองกลยุทธ์จะแตกต่างกันเช่นเดียวกับจุดแข็งและจุดอ่อนของพวกเขา อาจเป็นวิธีที่ดีกว่าหรือไม่ขึ้นอยู่กับปัญหา อันที่จริง ' โมเดล ANCOVA ที่เทียบเท่า ' ดูเหมือนว่าฉันจะไม่ได้นิยามไว้อย่างชัดเจน (วิธีที่เท่าเทียมกันอย่างไร)
conjugateprior

1
ขวา. ตอนนี้ฉันเห็นความหมาย 'เทียบเท่า' แต่ประโยคที่เริ่มต้น 'อย่างไรก็ตาม' ในคำพูดของคุณแนะนำความแตกต่างที่เกี่ยวข้อง: ในการฝึกปฏิบัติ การประเมินคะแนนแยกกันอย่างแม่นยำเพื่อให้พวกเขาสามารถวิธีที่น่ากลัวกว่าแบบจำลองการวิเคราะห์ (และมีความแตกต่างในวรรคต่อไปของบทความนี้ไม่ได้ยกมาอีก)
conjugateprior

7

การอ้างอิงที่ป้านน่าจะเป็นไปได้ แต่หากคุณมีโอกาสเข้าถึงได้ฉันขอแนะนำให้อ่านบทหนังสือเล่มนี้ ( Apel and Sweeten, 2010 ) มันมีจุดมุ่งหมายที่นักวิทยาศาสตร์ทางสังคมและอาจไม่เข้มงวดกับคณิตศาสตร์เท่าที่คุณต้องการ แต่ควรมีความลึกพอที่จะเป็นมากกว่าคำตอบที่น่าพอใจสำหรับคำถามของคุณ

มีวิธีการที่แตกต่างกันสองสามวิธีที่คนปฏิบัติกับคะแนนความชอบซึ่งอาจส่งผลให้เกิดข้อสรุปที่แตกต่างกันจากการรวม covariates ในแบบจำลองการถดถอย เมื่อการจับคู่หนึ่งคะแนนไม่จำเป็นต้องได้รับการสนับสนุนร่วมกันสำหรับการสังเกตทั้งหมด (เช่นมีข้อสังเกตบางอย่างที่ดูเหมือนจะไม่มีโอกาสได้อยู่ในกลุ่มการรักษาและบางอย่างที่อยู่ในกลุ่มการรักษาเสมอ) นอกจากนี้หนึ่งสามารถสังเกตน้ำหนักในรูปแบบต่าง ๆ ที่อาจส่งผลให้ข้อสรุปที่แตกต่างกัน

นอกจากคำตอบที่นี่ฉันขอแนะนำให้คุณตรวจสอบคำตอบของคำถามที่อ้างถึง มีสารอื่น ๆ ที่อยู่เบื้องหลังคะแนนความชอบมากกว่าเพียงแค่กลอุบายทางสถิติเพื่อให้ได้สมดุล covariate คุณอ่านและทำความเข้าใจกับบทความที่ถูกอ้างถึงอย่างสูงโดย Rosenbaum และ Rubin มันจะมีความชัดเจนมากขึ้นว่าทำไมวิธีการที่แตกต่างจากการเพิ่ม covariates ในรูปแบบการถดถอย ฉันคิดว่าคำตอบที่น่าพอใจสำหรับคำถามของคุณไม่จำเป็นต้องอยู่ในคณิตศาสตร์ที่อยู่เบื้องหลังคะแนนความชอบ แต่เป็นไปตามตรรกะ


@Andy W ดูคำพูดจาก Rosenbaum และ Rubin เกี่ยวกับความเท่าเทียมกันของการถดถอยกับ covariates และการปรับคะแนนความชอบในโพสต์ที่อัปเดตของฉัน
เบร็ท

0

ฉันชอบคิดว่า PS เป็นส่วนหนึ่งของการออกแบบซึ่งแยกออกจากการวิเคราะห์อย่างสมบูรณ์ นั่นคือคุณอาจต้องการคิดในแง่ของการออกแบบ (PS) และการวิเคราะห์ (การถดถอย ฯลฯ ... ) นอกจากนี้ PS ยังสนับสนุนวิธีการแลกเปลี่ยนสำหรับการรักษาแบบไบนารี บางทีคนอื่น ๆ สามารถแสดงความคิดเห็นว่าการรวม covariates ในแบบจำลองผลลัพธ์สามารถกระตุ้นการแลกเปลี่ยนได้หรือไม่หรือว่าใครสมมติว่าสามารถแลกเปลี่ยนได้ก่อนที่จะรวม covariates ในรูปแบบผลลัพธ์


-3

วิธีการทางสถิติ 2016 19 เมษายน

การประเมินความเอนเอียงในแบบจำลองการถดถอยแบบไม่เชิงเส้น

โดยทั่วไปจะใช้วิธีคะแนนความชอบเพื่อปรับให้เข้ากับความสับสนเมื่อสังเกตถึงการประเมินผลการรักษาตามเงื่อนไขในการศึกษาเชิงสังเกตการณ์ วิธีหนึ่งที่ได้รับความนิยมคือการปรับค่าความแปรปรวนร่วมของโควาเรียตในแบบจำลองการถดถอยได้แสดงให้เห็นอย่างชัดเจนว่ามีอคติในแบบจำลองที่ไม่ใช่เชิงเส้น อย่างไรก็ตามไม่มีเหตุผลทางทฤษฎีที่น่าสนใจถูกนำเสนอ เราเสนอกรอบใหม่ในการตรวจสอบอคติและความสอดคล้องของผลการรักษาที่ปรับคะแนนความชอบในแบบจำลองที่ไม่ใช่เชิงเส้นซึ่งใช้วิธีการทางเรขาคณิตอย่างง่ายเพื่อสร้างการเชื่อมโยงระหว่างความมั่นคงของตัวประมาณคะแนนความเอนเอียงและการยุบตัว ภายใต้กรอบนี้เราแสดงให้เห็นว่าการปรับคะแนนความชอบในแบบจำลองผลลัพธ์ส่งผลให้เกิดการสลายตัวของค่าความแปรปรวนร่วมที่สังเกตได้เป็นคะแนนความชอบและระยะเวลาที่เหลือ การไม่เข้าร่วมคำที่เหลือนี้จากแบบจำลองการถดถอยแบบไม่ยุบจะนำไปสู่การประมาณการแบบลำเอียงของอัตราต่อรองแบบมีเงื่อนไขและอัตราส่วนอันตรายตามเงื่อนไข แต่ไม่ใช่สำหรับอัตราส่วนอัตราแบบมีเงื่อนไข เราแสดงให้เห็นต่อไปโดยผ่านการศึกษาแบบจำลองสถานการณ์ความเอนเอียงในตัวประมาณค่าการปรับค่าความเอนเอียงเหล่านี้เพิ่มขึ้นตามขนาดผลการรักษาที่ใหญ่ขึ้นผล covariate ที่ใหญ่ขึ้นและความแตกต่างระหว่างสัมประสิทธิ์ของ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.