การจับคู่คะแนนความโน้มเอียงหลังจากการใส่หลายครั้ง


34

ฉันอ้างถึงเอกสารนี้ : Hayes JR, Groner JI "การใช้คะแนนความชอบและคะแนนความชอบหลายระดับเพื่อทดสอบผลกระทบของเบาะรถยนต์และการใช้เข็มขัดนิรภัยต่อความรุนแรงของการบาดเจ็บจากข้อมูลทะเบียนอุบัติเหตุ" J Pediatr Surg. 2008 พฤษภาคม; 43 (5): 924-7

ในการศึกษานี้ได้ทำการใส่ข้อมูลหลายชุดเพื่อรับชุดข้อมูลที่สมบูรณ์ 15 ชุด คะแนนความน่าเชื่อถือถูกคำนวณแล้วสำหรับแต่ละชุดข้อมูล จากนั้นสำหรับแต่ละหน่วยสังเกตการณ์บันทึกถูกเลือกแบบสุ่มจากหนึ่งใน 15 ชุดข้อมูลที่เสร็จสมบูรณ์ (รวมถึงคะแนนความชอบที่เกี่ยวข้อง) ดังนั้นการสร้างชุดข้อมูลสุดท้ายเดียวซึ่งถูกวิเคราะห์โดยการจับคู่คะแนนความชอบ

คำถามของฉันคือ: นี่เป็นวิธีที่ถูกต้องหรือไม่ที่จะทำการจับคู่คะแนนความชอบหลังจากการใส่หลายครั้ง มีวิธีอื่นในการทำหรือไม่?

สำหรับบริบท: ในโครงการใหม่ของฉันฉันมุ่งมั่นที่จะเปรียบเทียบผลของวิธีการรักษา 2 วิธีโดยใช้การจับคู่คะแนนความชอบ มีข้อมูลที่ขาดหายไปและฉันตั้งใจจะใช้MICEแพ็กเกจใน R เพื่อใส่ค่าที่หายไปจากนั้นtwangทำการจับคู่คะแนนความชอบและlme4วิเคราะห์ข้อมูลที่ตรงกัน

Update1:

ฉันได้พบบทความนี้ซึ่งใช้แนวทางที่แตกต่าง: Mitra, Robin และ Reiter, Jerome P. (2011) คะแนนความตรงกับการหายไปของโควาเรียผ่านการใส่ซ้ำหลายครั้งตามลำดับ [Working Paper]

ในบทความนี้ผู้เขียนคำนวณคะแนนความน่าเชื่อถือในชุดข้อมูลที่กำหนดทั้งหมดแล้วรวมค่าเฉลี่ยด้วยการหาค่าเฉลี่ยซึ่งอยู่ในจิตวิญญาณของการใส่ความคิดหลายครั้งโดยใช้กฎของ Rubin สำหรับการประเมินจุด - แต่มันใช้ได้จริงหรือไม่

มันจะดีจริงๆถ้าทุกคนใน CV สามารถให้คำตอบกับความเห็นเกี่ยวกับวิธีการที่แตกต่างกันทั้งสองนี้และ / หรืออื่น ๆ ....

คำตอบ:


20

สิ่งแรกที่จะพูดได้คือสำหรับฉันวิธีที่ 1 (การสุ่มตัวอย่าง) ดูเหมือนจะไม่มีบุญมาก - มันเป็นการทิ้งข้อดีของการใส่หลาย ๆ แบบและลดการใส่ร้ายเดียวสำหรับการสังเกตแต่ละครั้งดังที่ Stas กล่าวไว้ ฉันไม่เห็นความได้เปรียบใด ๆ ในการใช้มัน

มีการสนทนาที่ดีของปัญหารอบการวิเคราะห์คะแนนความโน้มเอียงที่มีข้อมูลที่หายไปในฮิลล์ (2004) คือฮิลล์, เจ"การลดอคติในการรักษาผลการประเมินในเชิงการศึกษาที่ทุกข์ทรมานจากข้อมูลที่หายไป" ISERP ทำงานเอกสารปี 2004 มันสามารถดาวน์โหลดได้จากที่นี่

กระดาษพิจารณาสองวิธีในการใช้การใส่หลายแบบ (และวิธีการอื่นในการจัดการกับข้อมูลที่หายไป) และคะแนนความชอบ:

  • ค่าเฉลี่ยของคะแนนความชอบหลังจากการใส่หลายครั้งตามด้วยการอนุมานเชิงสาเหตุ (วิธีที่ 2 ในโพสต์ของคุณด้านบน)

  • การอนุมานเชิงสาเหตุโดยใช้คะแนนความชอบแต่ละชุดจากการใส่หลายครั้งตามด้วยค่าเฉลี่ยของการประมาณเชิงสาเหตุ

นอกจากนี้บทความยังพิจารณาว่าควรรวมผลลัพธ์ไว้เป็นตัวทำนายในรูปแบบการใส่ข้อมูลหรือไม่

เขายืนยันว่าในขณะที่วิธีการอื่น ๆ ที่เป็นที่นิยมใช้วิธีการอื่นในการจัดการกับข้อมูลที่ขาดหายไปโดยทั่วไปไม่มีความสำคัญเหตุผลที่ต้องการหนึ่งในเทคนิคเหล่านี้มากกว่าที่อื่น อย่างไรก็ตามอาจมีเหตุผลที่ต้องการคะแนนเฉลี่ยความชอบโดยเฉพาะเมื่อใช้อัลกอริทึมการจับคู่ที่แน่นอน เขาทำการศึกษาแบบจำลองสถานการณ์ในกระดาษแผ่นเดียวกันและพบว่าค่าเฉลี่ยความเอนเอียงคะแนนก่อนการอนุมานสาเหตุเมื่อรวมถึงผลลัพธ์ในแบบจำลองการใส่ความคิดให้ผลลัพธ์ที่ดีที่สุดในแง่ของความคลาดเคลื่อนกำลังสองเฉลี่ยและเฉลี่ยคะแนนก่อน แต่ไม่ได้ผลลัพธ์ ในรูปแบบการใส่ร้ายผลิตผลลัพธ์ที่ดีที่สุดในแง่ของอคติเฉลี่ย (ความแตกต่างที่แน่นอนระหว่างผลการรักษาโดยประมาณและจริง) โดยทั่วไปจะแนะนำให้รวมผลลัพธ์ในโมเดลการใส่ข้อมูล (ตัวอย่างดูที่นี่ )

ดังนั้นดูเหมือนว่าวิธีที่ 2 ของคุณเป็นวิธีที่จะไป


1
ฉันเข้าใจหมายเลขวิธีที่ 2 แต่ฉันก็ไม่รู้ว่าจะใช้มันอย่างไรในอาร์ไม่มีใครมีการอ้างอิงใด ๆ ที่ชี้ให้ฉัน
แซม

1
รหัส R สำหรับทั้งสองวิธีมีให้ในบทความสั้นสำหรับcobaltแพ็คเกจที่มีชื่อว่า "การใช้โคบอลต์กับข้อมูลที่ซับซ้อน" ท่านสามารถเข้าใช้งานได้ที่นี่: CRAN.R-project.org/package=cobalt
โนอาห์

13

อาจมีการปะทะกันของสองกระบวนทัศน์ การใส่ร้ายหลายครั้งเป็นวิธีการแก้ปัญหาแบบเบย์ที่มีรูปแบบเป็นอย่างมาก: แนวคิดของการใส่ความถูกต้องเป็นหลักระบุว่าคุณจำเป็นต้องสุ่มตัวอย่างจากการแจกแจงด้านหลังของข้อมูลที่ชัดเจน ในทางกลับกันการจับคู่คะแนนความน่าจะเป็นขั้นตอนกึ่งพารามิเตอร์: เมื่อคุณคำนวณคะแนนความชอบ (ไม่ว่าคุณจะใช้การประมาณความหนาแน่นของเคอร์เนลได้อย่างไรไม่จำเป็นต้องเป็นแบบจำลอง logit) คุณสามารถทำส่วนที่เหลือได้ โดยเพียงแค่นำความแตกต่างระหว่างการสังเกตที่ได้รับการรักษาและไม่ได้รับการรักษาด้วยคะแนนความเอนเอียงเดียวกันซึ่งตอนนี้เป็นแบบไม่ใช่พารามิเตอร์ตอนนี้เนื่องจากไม่มีรูปแบบที่เหลือสำหรับการควบคุมเพื่อนร่วมพันธุ์อื่น ๆ ฉันไม่ 'Abadie และ Imbens (2008)กล่าวถึงว่ามันเป็นไปไม่ได้ที่จะได้รับข้อผิดพลาดมาตรฐานในบางสถานการณ์ที่ตรงกัน) ฉันจะให้ความไว้วางใจมากขึ้นกับวิธีการที่ราบรื่นกว่าเช่นการถ่วงน้ำหนักด้วยความเอนเอียงแบบผกผัน สิ่งที่ฉันชอบในการอ้างอิงนี้คือ"เศรษฐีที่ไม่เป็นอันตรายมากที่สุด"ซึ่งมีชื่อว่า "นักประจักษ์นิยม" และนักเศรษฐศาสตร์ แต่ฉันคิดว่าหนังสือเล่มนี้ควรจะเป็นสิ่งที่จำเป็นสำหรับนักวิทยาศาสตร์สังคมอื่น ๆ นักชีวสถิติส่วนใหญ่ พวกเขารู้ว่าสาขาวิชาอื่น ๆ ใช้วิธีการวิเคราะห์ข้อมูลอย่างไร

ไม่ว่าในกรณีใดการใช้เพียงหนึ่งใน 15 บรรทัดของข้อมูลที่สมบูรณ์แบบจำลองต่อการสังเกตนั้นเทียบเท่ากับการใส่เข้าไปเพียงครั้งเดียว เป็นผลให้คุณสูญเสียประสิทธิภาพเมื่อเทียบกับชุดข้อมูลที่เสร็จสมบูรณ์ทั้งหมด 15 ชุดและคุณไม่สามารถประเมินข้อผิดพลาดมาตรฐานได้อย่างเหมาะสม ดูเหมือนว่าขั้นตอนการขาดฉันจากมุมใด

แน่นอนว่าเรากวาดภายใต้พรมอย่างมีความสุขสมมติฐานที่ว่าทั้งแบบจำลองหลายแบบและแบบจำลองความชอบนั้นถูกต้องในแง่ของการมีตัวแปรที่ถูกต้องในรูปแบบการทำงานที่ถูกต้องทั้งหมด มีวิธีเล็กน้อยที่จะตรวจสอบว่า (แม้ว่าฉันยินดีที่จะได้ยินเป็นอย่างอื่นเกี่ยวกับมาตรการการวินิจฉัยสำหรับทั้งสองวิธี)


(+1) โดยเฉพาะอย่างยิ่งสำหรับผมไม่รู้สึกดีเกี่ยวกับการต่อเนื่องที่นำโดยการดำเนินงานที่แท้จริงของการจับคู่ (พบการควบคุมที่มีค่าที่เป็นไปได้ใกล้เคียงที่สุดของคะแนนนิสัยชอบและไม่สนใจส่วนที่เหลือ) การให้คะแนนความชอบมักทำให้ฉันรู้สึกว่าเป็นกระบวนการที่ค่อนข้างหยาบ
พระคาร์ดินัล

@ cardinal โปรดดูการอัปเดต
StasK

ฉันเคยเห็นคำวิจารณ์ของ IPTW มากกว่าที่ฉันจับคู่ด้วยวิธีอื่น (ฉันจะต้องอ่าน) ดูถดถอยน้ำหนักด้วยคะแนนเอนเอียง ( อิสระและ Berk 2008 ) และสำหรับตัวอย่างการประยุกต์ใช้ดูBjerk 2009 ฉันไม่แน่ใจว่าทำไมคุณถึงแนะนำHarmet เศรษฐมิติให้ตอบที่นี่ แต่มันเป็นคำแนะนำที่ดีสำหรับผู้ที่สนใจศึกษาเชิงสังเกตการณ์ไม่น้อยเลย
Andy W

@ Andy ชิ้นส่วนของ Freedman & Berk ดูเหมือนจะจัดการกับสถานการณ์ที่ง่ายกว่ามากเมื่อคุณสามารถทำแบบจำลองทุกอย่างในการถดถอยโลจิสติก ความเข้าใจของฉันคือว่าวิธีการเช่น PSM ถูกนำไปใช้ในสถานการณ์ที่ยุ่งเหยิงมากขึ้นเมื่อคุณมีโควาเรียร์จำนวนมากและคุณไม่เชื่อถือโมเดลที่ดีพอที่จะคิดว่ามันถูกระบุไว้อย่างถูกต้อง พวกเขาสังเกตเห็นว่าสถานการณ์นั้นดีสำหรับการถ่วงน้ำหนัก แต่ฉันคิดว่ามันเป็นสิ่งที่ดีสำหรับตัวแบบเมื่อเทียบกับวิธีการอื่น ๆ ที่เป็นไปได้
StasK

2
เนื่องจากข้อมูลของคุณไม่ได้เป็น iid และทฤษฎีความน่าจะเป็นสูงสุดเกี่ยวกับความเท่าเทียมกันของ Hessian ผกผันและผลิตภัณฑ์ด้านนอกของการไล่ระดับสีไม่ได้เก็บไว้อีกต่อไปและไม่มีการประมาณความแปรปรวนที่สอดคล้องกัน หนึ่งต้องใช้ตัวประมาณความแปรปรวนแซนวิช, aka การประมาณเชิงเส้นในสถิติการสำรวจ, aka ตัวประมาณที่แข็งแกร่งในเศรษฐมิติ
StasK

10

ฉันไม่สามารถพูดถึงแง่มุมทางทฤษฎีของคำถามได้ แต่ฉันจะให้ประสบการณ์ของฉันโดยใช้แบบจำลอง PS / IPTW และการใส่ความหลากหลาย

  1. ฉันไม่เคยได้ยินใครบางคนที่ใช้ชุดข้อมูลที่มีการคูณและสุ่มตัวอย่างแบบสุ่มเพื่อสร้างชุดข้อมูลเดียว ไม่ได้แปลว่าผิดแต่เป็นวิธีการใช้ที่แปลก ชุดข้อมูลยังไม่ใหญ่พอที่คุณจะต้องใช้ความคิดสร้างสรรค์ในการใช้งานโมเดล 3-5 รุ่นแทนที่จะเป็นรุ่นเดียวเพื่อประหยัดเวลาและการคำนวณ
  2. กฎของรูบินและวิธีการรวมกำไรเป็นเครื่องมือทั่วไปที่ค่อนข้างดี เมื่อพิจารณาผลลัพธ์ที่ถูกรวมเข้าด้วยกันจำนวนมากสามารถคำนวณได้โดยใช้ความแปรปรวนและการประมาณการเท่านั้นไม่มีเหตุผลที่ฉันเห็นว่ามันไม่สามารถใช้สำหรับโครงการของคุณได้ - การสร้างข้อมูลที่ถูกประมวลผลการวิเคราะห์ในแต่ละชุดแล้วรวมกำไร มันเป็นสิ่งที่ฉันทำไปแล้วมันเป็นสิ่งที่ฉันเห็นมาแล้วและถ้าคุณไม่มีเหตุผลเฉพาะที่จะทำมันฉันก็ไม่สามารถเห็นเหตุผลที่จะไปกับสิ่งที่แปลกใหม่มากขึ้น - โดยเฉพาะอย่างยิ่งถ้าคุณไม่เข้าใจว่ามีอะไรบ้าง เกิดขึ้นกับวิธีการ

+1 นี่เป็นคำถามที่ยากที่จะให้คำตอบที่ดีเพราะดูเหมือนว่าจะเป็นกระดาษที่มีความเชี่ยวชาญสูง แต่นอกเหนือจากการอ้างว่าได้สูญเสียเงินรางวัลไปกับคำถามที่คล้ายกันก่อนหน้านี้ OP ได้เพิ่มคำถามเพื่อขอคำตอบสำหรับโซลูชันที่ย้ายไปยังเมตาดาต้า ฉันแสดงความคิดเห็นแบบเดียวกันกับคุณในคำตอบที่นั่น ฉันสงสัยอย่างมากเกี่ยวกับตัวอย่างจากชุดข้อมูลที่มีการเพิ่มจำนวน
Michael Chernick

ขอบคุณมาก! คุณมีข้อมูลอ้างอิงเกี่ยวกับตำแหน่งที่ใช้วิธีที่ 2 หรือไม่
Joe King

@ JoeKing น่าเศร้าที่ไม่ได้ขึ้นไปบนหัวของฉัน
Fomite
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.