อะไรคือความแตกต่างในการประมาณ
ความแตกต่างความแตกต่าง (DiD) เป็นเครื่องมือในการประเมินผลการรักษาเปรียบเทียบความแตกต่างก่อนและหลังการรักษาในผลลัพธ์ของการรักษาและกลุ่มควบคุม โดยทั่วไปเรามีความสนใจในการประเมินผลของการรักษา (เช่นสถานะสหภาพยา ฯลฯ ) ต่อผลลัพธ์ (เช่นค่าจ้างสุขภาพ ฯลฯ ) ในขณะที่
โดยที่เป็นผลกระทบคงที่เป็นรายบุคคล (ลักษณะของบุคคลที่ไม่เปลี่ยนแปลงตลอดเวลา),เป็นผลคงที่เวลาเป็นตัวแปรแปรผันตามเวลาเช่นอายุของแต่ละบุคคลและY ฉันY ฉันT = α ฉัน + λ T + ρ D ฉันT + X ' ฉันที β + ε ฉันที α ฉันλ เสื้อX ฉันที ε ฉันทีDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
αiλtXitϵitเป็นคำที่ผิดพลาด บุคคลและเวลาจะถูกจัดทำดัชนีโดยและตามลำดับ หากมีความสัมพันธ์กันระหว่างเอฟเฟกต์คงที่และดังนั้นการประเมินการถดถอยนี้ผ่านทาง OLS จะมีอคติเนื่องจากจะไม่มีการควบคุมเอฟเฟกต์ถาวร นี่คือแบบฉบับละเว้นอคติตัวแปร
ทีD ฉันทีitDit
หากต้องการดูผลกระทบของการรักษาเราต้องการทราบความแตกต่างระหว่างบุคคลในโลกที่เธอได้รับการรักษาและสิ่งที่เธอไม่ได้ทำ แน่นอนมีเพียงหนึ่งในสิ่งเหล่านี้เท่านั้นที่สามารถสังเกตได้ในทางปฏิบัติ ดังนั้นเราจึงมองหาคนที่มีแนวโน้มก่อนการรักษาเหมือนกันในผลลัพธ์ สมมติว่าเรามีสองช่วงเวลาและทั้งสองกลุ่ม B จากนั้นภายใต้สมมติฐานว่าแนวโน้มในกลุ่มการรักษาและกลุ่มควบคุมจะยังคงดำเนินต่อไปเช่นเดียวกับก่อนหน้านี้หากไม่ได้รับการรักษาเราสามารถประเมินผลการรักษาได้เช่น
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
กราฟิกนี้จะมีลักษณะดังนี้:
คุณสามารถคำนวณค่าเฉลี่ยเหล่านี้ได้ด้วยมือเช่นได้ผลลัพธ์เฉลี่ยของกลุ่มในทั้งสองช่วงเวลาและรับผลต่าง จากนั้นรับค่าเฉลี่ยผลลัพธ์ของกลุ่มทั้งสองช่วงเวลาและรับผลต่าง จากนั้นนำความแตกต่างในความแตกต่างและนั่นคือผลการรักษา อย่างไรก็ตามจะสะดวกกว่าในการทำกรอบการถดถอยเพราะจะช่วยให้คุณAB
- เพื่อควบคุมการแปรปรวนร่วม
- เพื่อรับข้อผิดพลาดมาตรฐานสำหรับผลการรักษาเพื่อดูว่ามีความสำคัญ
เมื่อต้องการทำเช่นนี้คุณสามารถทำตามกลยุทธ์ที่เทียบเท่ากันอย่างใดอย่างหนึ่ง สร้างกลุ่มควบคุม dummyซึ่งเท่ากับ 1 หากบุคคลอยู่ในกลุ่มและ 0 มิฉะนั้นสร้าง dummy เวลาซึ่งเท่ากับ 1 ถ้าและ 0 เป็นอย่างอื่น จากนั้นถอยหลัง
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
หรือคุณเพียงแค่สร้างหุ่นจำลองซึ่งเท่ากับหนึ่งถ้าบุคคลที่อยู่ในกลุ่มการรักษาและช่วงเวลาเป็นระยะหลังการรักษาและเป็นศูนย์เป็นอย่างอื่น จากนั้นคุณจะถอยหลัง
Y ฉันt = β 1 γ s + β 2 λ t + ρ T ฉันt + ϵ ฉันtTit
Yit=β1γs+β2λt+ρTit+ϵit
โดยที่เป็นตัวจำลองสำหรับกลุ่มควบคุมอีกครั้งและเป็นช่วงเวลา การถดถอยทั้งสองให้ผลลัพธ์ที่เหมือนกันสำหรับสองจุดและสองกลุ่ม สมการที่สองนั้นกว้างกว่าแม้ว่ามันจะขยายไปถึงหลายกลุ่มและช่วงเวลาอย่างง่ายดาย ในทั้งสองกรณีนี่คือวิธีที่คุณสามารถประมาณความแตกต่างของพารามิเตอร์ความแตกต่างในแบบที่คุณสามารถรวมตัวแปรควบคุม (ฉันออกจากสมการข้างต้นเพื่อไม่ให้ยุ่งเหยิง แต่คุณสามารถรวมไว้) และได้รับข้อผิดพลาดมาตรฐาน สำหรับการอนุมานλ tγsλt
เหตุใดเครื่องมือประมาณการความแตกต่างจึงมีประโยชน์
ตามที่ระบุไว้ก่อนหน้า DiD เป็นวิธีการประเมินผลการรักษาด้วยข้อมูลที่ไม่ใช่การทดลอง นั่นเป็นคุณสมบัติที่มีประโยชน์ที่สุด DiD ยังเป็นรุ่นของการประเมินผลกระทบคงที่ ในขณะที่โมเดลเอฟเฟกต์คงที่ถือว่า , DiD ทำให้สมมติฐานคล้ายกัน แต่ในระดับกลุ่ม\ ค่าคาดหวังของผลลัพธ์ที่นี่คือผลรวมของกลุ่มและผลกระทบของเวลา ดังนั้นความแตกต่างคืออะไร? สำหรับไม่คุณไม่จำเป็นต้องข้อมูลแผงจำเป็นต้องเป็นเวลานานเป็นส่วนข้ามซ้ำของคุณจะถูกดึงออกมาจากที่เดียวกันหน่วยรวมsสิ่งนี้ทำให้ DiD สามารถใช้กับข้อมูลที่กว้างกว่าแบบจำลองเอฟเฟกต์มาตรฐานที่ต้องการข้อมูลพาเนล E ( Y 0 i t | s , t ) = γ s + λ t sE(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
เราสามารถเชื่อถือความแตกต่างในความแตกต่างได้หรือไม่?
ข้อสันนิษฐานที่สำคัญที่สุดใน DiD คือการคาดการณ์แนวโน้มแบบขนาน (ดูรูปด้านบน) อย่าเชื่อถือการศึกษาที่ไม่แสดงแนวโน้มเหล่านี้อย่างชัดเจน! บทความในปี 1990 อาจจะหายไปจากเรื่องนี้ แต่ทุกวันนี้ความเข้าใจของเราเกี่ยวกับ DiD นั้นดีขึ้นมาก หากไม่มีกราฟที่น่าเชื่อถือที่แสดงแนวโน้มแบบขนานในผลลัพธ์ของการรักษาก่อนการรักษาและกลุ่มควบคุมให้ระมัดระวัง หากสมมติฐานแนวโน้มคู่ขนานมีไว้และเราสามารถแยกแยะการเปลี่ยนแปลงตัวแปรเวลาอื่น ๆ ที่อาจทำให้การรักษาสับสนได้ DiD นั้นเป็นวิธีที่เชื่อถือได้
ควรใช้คำเตือนอีกข้อเมื่อพูดถึงการรักษาข้อผิดพลาดมาตรฐาน ด้วยข้อมูลหลายปีคุณจำเป็นต้องปรับเปลี่ยนข้อผิดพลาดมาตรฐานสำหรับการหาค่าอัตโนมัติ ในอดีตสิ่งนี้ถูกทอดทิ้ง แต่เนื่องจากเบอร์ทรานด์และคณะ (2004) "เราควรเชื่อความแตกต่างในการประมาณการต่างกันมากแค่ไหน" เรารู้ว่านี่เป็นปัญหา ในกระดาษพวกเขาให้การเยียวยาหลายประการสำหรับการจัดการกับความสัมพันธ์อัตโนมัติ วิธีที่ง่ายที่สุดคือการทำคลัสเตอร์บนตัวระบุพาเนลแต่ละตัวซึ่งอนุญาตให้มีความสัมพันธ์โดยพลการของค่าตกค้างในอนุกรมเวลาแต่ละชุด สิ่งนี้ถูกต้องสำหรับทั้ง autocorrelation และ heteroscedasticity
สำหรับการอ้างอิงต่อไปดูบันทึกการบรรยายเหล่านี้โดยWaldingerและPischke