ความแตกต่างในความแตกต่างคืออะไร?


43

ความแตกต่างในความแตกต่างได้รับความนิยมในฐานะเครื่องมือที่ไม่ได้ทดลองโดยเฉพาะอย่างยิ่งในด้านเศรษฐศาสตร์ ใครช่วยกรุณาให้คำตอบที่ชัดเจนและไม่ใช่เทคนิคคำถามต่อไปนี้เกี่ยวกับความแตกต่างในความแตกต่าง

ตัวประมาณความแตกต่างคืออะไร
เหตุใดเครื่องมือประมาณการความแตกต่างในการใช้งานจึงเป็นสิ่งใด
เราสามารถเชื่อถือการประมาณการที่แตกต่างกันได้หรือไม่?


ไม่มีใครรู้วิธีการประเมินความแตกต่างในการถดถอยที่แตกต่างในเกรต? ฉันต้องทำงานกับ OLS หรือแผงข้อมูลหรือไม่

3
@Pyca ดูเหมือนว่ามีการใช้ความคิดเห็นที่ไม่เหมาะสม คุณควรโพสต์คำถามใหม่โดยอ้างอิงถึงคำถามนี้
chl

คำตอบ:


66

อะไรคือความแตกต่างในการประมาณ
ความแตกต่างความแตกต่าง (DiD) เป็นเครื่องมือในการประเมินผลการรักษาเปรียบเทียบความแตกต่างก่อนและหลังการรักษาในผลลัพธ์ของการรักษาและกลุ่มควบคุม โดยทั่วไปเรามีความสนใจในการประเมินผลของการรักษา (เช่นสถานะสหภาพยา ฯลฯ ) ต่อผลลัพธ์ (เช่นค่าจ้างสุขภาพ ฯลฯ ) ในขณะที่ โดยที่เป็นผลกระทบคงที่เป็นรายบุคคล (ลักษณะของบุคคลที่ไม่เปลี่ยนแปลงตลอดเวลา),เป็นผลคงที่เวลาเป็นตัวแปรแปรผันตามเวลาเช่นอายุของแต่ละบุคคลและY ฉันY ฉันT = α ฉัน + λ T + ρ D ฉันT + X ' ฉันที β + ε ฉันที α ฉันλ เสื้อX ฉันที ε ฉันทีDiYi

Yit=αi+λt+ρDit+Xitβ+ϵit
αiλtXitϵitเป็นคำที่ผิดพลาด บุคคลและเวลาจะถูกจัดทำดัชนีโดยและตามลำดับ หากมีความสัมพันธ์กันระหว่างเอฟเฟกต์คงที่และดังนั้นการประเมินการถดถอยนี้ผ่านทาง OLS จะมีอคติเนื่องจากจะไม่มีการควบคุมเอฟเฟกต์ถาวร นี่คือแบบฉบับละเว้นอคติตัวแปรทีD ฉันทีitDit

หากต้องการดูผลกระทบของการรักษาเราต้องการทราบความแตกต่างระหว่างบุคคลในโลกที่เธอได้รับการรักษาและสิ่งที่เธอไม่ได้ทำ แน่นอนมีเพียงหนึ่งในสิ่งเหล่านี้เท่านั้นที่สามารถสังเกตได้ในทางปฏิบัติ ดังนั้นเราจึงมองหาคนที่มีแนวโน้มก่อนการรักษาเหมือนกันในผลลัพธ์ สมมติว่าเรามีสองช่วงเวลาและทั้งสองกลุ่ม B จากนั้นภายใต้สมมติฐานว่าแนวโน้มในกลุ่มการรักษาและกลุ่มควบคุมจะยังคงดำเนินต่อไปเช่นเดียวกับก่อนหน้านี้หากไม่ได้รับการรักษาเราสามารถประเมินผลการรักษาได้เช่น t=1,2s=A,B

ρ=(E[Yist|s=A,t=2]E[Yist|s=A,t=1])(E[Yist|s=B,t=2]E[Yist|s=B,t=1])

กราฟิกนี้จะมีลักษณะดังนี้: ป้อนคำอธิบายรูปภาพที่นี่

คุณสามารถคำนวณค่าเฉลี่ยเหล่านี้ได้ด้วยมือเช่นได้ผลลัพธ์เฉลี่ยของกลุ่มในทั้งสองช่วงเวลาและรับผลต่าง จากนั้นรับค่าเฉลี่ยผลลัพธ์ของกลุ่มทั้งสองช่วงเวลาและรับผลต่าง จากนั้นนำความแตกต่างในความแตกต่างและนั่นคือผลการรักษา อย่างไรก็ตามจะสะดวกกว่าในการทำกรอบการถดถอยเพราะจะช่วยให้คุณAB

  • เพื่อควบคุมการแปรปรวนร่วม
  • เพื่อรับข้อผิดพลาดมาตรฐานสำหรับผลการรักษาเพื่อดูว่ามีความสำคัญ

เมื่อต้องการทำเช่นนี้คุณสามารถทำตามกลยุทธ์ที่เทียบเท่ากันอย่างใดอย่างหนึ่ง สร้างกลุ่มควบคุม dummyซึ่งเท่ากับ 1 หากบุคคลอยู่ในกลุ่มและ 0 มิฉะนั้นสร้าง dummy เวลาซึ่งเท่ากับ 1 ถ้าและ 0 เป็นอย่างอื่น จากนั้นถอยหลัง treatiAtimett=2

Yit=β1+β2(treati)+β3(timet)+ρ(treatitimet)+ϵit

หรือคุณเพียงแค่สร้างหุ่นจำลองซึ่งเท่ากับหนึ่งถ้าบุคคลที่อยู่ในกลุ่มการรักษาและช่วงเวลาเป็นระยะหลังการรักษาและเป็นศูนย์เป็นอย่างอื่น จากนั้นคุณจะถอยหลัง Y ฉันt = β 1 γ s + β 2 λ t + ρ T ฉันt + ϵ ฉันtTit

Yit=β1γs+β2λt+ρTit+ϵit

โดยที่เป็นตัวจำลองสำหรับกลุ่มควบคุมอีกครั้งและเป็นช่วงเวลา การถดถอยทั้งสองให้ผลลัพธ์ที่เหมือนกันสำหรับสองจุดและสองกลุ่ม สมการที่สองนั้นกว้างกว่าแม้ว่ามันจะขยายไปถึงหลายกลุ่มและช่วงเวลาอย่างง่ายดาย ในทั้งสองกรณีนี่คือวิธีที่คุณสามารถประมาณความแตกต่างของพารามิเตอร์ความแตกต่างในแบบที่คุณสามารถรวมตัวแปรควบคุม (ฉันออกจากสมการข้างต้นเพื่อไม่ให้ยุ่งเหยิง แต่คุณสามารถรวมไว้) และได้รับข้อผิดพลาดมาตรฐาน สำหรับการอนุมานλ tγsλt

เหตุใดเครื่องมือประมาณการความแตกต่างจึงมีประโยชน์
ตามที่ระบุไว้ก่อนหน้า DiD เป็นวิธีการประเมินผลการรักษาด้วยข้อมูลที่ไม่ใช่การทดลอง นั่นเป็นคุณสมบัติที่มีประโยชน์ที่สุด DiD ยังเป็นรุ่นของการประเมินผลกระทบคงที่ ในขณะที่โมเดลเอฟเฟกต์คงที่ถือว่า , DiD ทำให้สมมติฐานคล้ายกัน แต่ในระดับกลุ่ม\ ค่าคาดหวังของผลลัพธ์ที่นี่คือผลรวมของกลุ่มและผลกระทบของเวลา ดังนั้นความแตกต่างคืออะไร? สำหรับไม่คุณไม่จำเป็นต้องข้อมูลแผงจำเป็นต้องเป็นเวลานานเป็นส่วนข้ามซ้ำของคุณจะถูกดึงออกมาจากที่เดียวกันหน่วยรวมsสิ่งนี้ทำให้ DiD สามารถใช้กับข้อมูลที่กว้างกว่าแบบจำลองเอฟเฟกต์มาตรฐานที่ต้องการข้อมูลพาเนล E ( Y 0 i t | s , t ) = γ s + λ t sE(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts

เราสามารถเชื่อถือความแตกต่างในความแตกต่างได้หรือไม่?
ข้อสันนิษฐานที่สำคัญที่สุดใน DiD คือการคาดการณ์แนวโน้มแบบขนาน (ดูรูปด้านบน) อย่าเชื่อถือการศึกษาที่ไม่แสดงแนวโน้มเหล่านี้อย่างชัดเจน! บทความในปี 1990 อาจจะหายไปจากเรื่องนี้ แต่ทุกวันนี้ความเข้าใจของเราเกี่ยวกับ DiD นั้นดีขึ้นมาก หากไม่มีกราฟที่น่าเชื่อถือที่แสดงแนวโน้มแบบขนานในผลลัพธ์ของการรักษาก่อนการรักษาและกลุ่มควบคุมให้ระมัดระวัง หากสมมติฐานแนวโน้มคู่ขนานมีไว้และเราสามารถแยกแยะการเปลี่ยนแปลงตัวแปรเวลาอื่น ๆ ที่อาจทำให้การรักษาสับสนได้ DiD นั้นเป็นวิธีที่เชื่อถือได้

ควรใช้คำเตือนอีกข้อเมื่อพูดถึงการรักษาข้อผิดพลาดมาตรฐาน ด้วยข้อมูลหลายปีคุณจำเป็นต้องปรับเปลี่ยนข้อผิดพลาดมาตรฐานสำหรับการหาค่าอัตโนมัติ ในอดีตสิ่งนี้ถูกทอดทิ้ง แต่เนื่องจากเบอร์ทรานด์และคณะ (2004) "เราควรเชื่อความแตกต่างในการประมาณการต่างกันมากแค่ไหน" เรารู้ว่านี่เป็นปัญหา ในกระดาษพวกเขาให้การเยียวยาหลายประการสำหรับการจัดการกับความสัมพันธ์อัตโนมัติ วิธีที่ง่ายที่สุดคือการทำคลัสเตอร์บนตัวระบุพาเนลแต่ละตัวซึ่งอนุญาตให้มีความสัมพันธ์โดยพลการของค่าตกค้างในอนุกรมเวลาแต่ละชุด สิ่งนี้ถูกต้องสำหรับทั้ง autocorrelation และ heteroscedasticity

สำหรับการอ้างอิงต่อไปดูบันทึกการบรรยายเหล่านี้โดยWaldingerและPischke


6

Wikipedia มีรายการที่เหมาะสมในเรื่องนี้แต่ทำไมไม่ใช้การถดถอยเชิงเส้นเพื่อให้เกิดการโต้ตอบระหว่างตัวแปรอิสระที่คุณสนใจ? ดูเหมือนว่าฉันจะตีความได้มากกว่านี้ จากนั้นคุณอาจอ่านการวิเคราะห์ความลาดชันแบบง่าย ๆ (ในโคเฮนและหนังสือฟรีบน Google หนังสือ)หากตัวแปรที่คุณสนใจนั้นมีปริมาณ


0

มันเป็นเทคนิคที่ใช้กันอย่างแพร่หลายในเศรษฐมิติเพื่อตรวจสอบอิทธิพลของเหตุการณ์ภายนอกใด ๆ ในอนุกรมเวลา คุณเลือกกลุ่มข้อมูลสองกลุ่มที่เกี่ยวข้องกับก่อนและหลังเหตุการณ์ที่ศึกษา การอ้างอิงที่ดีเพื่อเรียนรู้เพิ่มเติมคือหนังสือIntroduction to เศรษฐมิติโดย Wooldridge


2
ในฐานะที่เป็นคำตอบที่ไม่ใช้เทคนิคอย่างกระชับนี่เป็นคำตอบเสริมของแอนดี้ แต่ฉันไม่คิดว่ามันจะครอบคลุม
Silverfish

0

ระวัง:

สองจุดเพิ่มเติมมีมูลค่า noting ประการแรก 80 จากเอกสารต้นฉบับ 92 DD มีปัญหาที่อาจเกิดขึ้นกับเงื่อนไขข้อผิดพลาดที่จัดกลุ่มเนื่องจากหน่วยการสังเกตมีรายละเอียดมากกว่าระดับของการเปลี่ยนแปลง (จุดที่กล่าวถึงโดย Donald และ Lang [2001]) เอกสารเหล่านี้มีเพียง 36 ฉบับเท่านั้นที่จัดการปัญหานี้ไม่ว่าจะโดยการรวมกลุ่มข้อผิดพลาดมาตรฐานหรือโดยการรวมข้อมูล ประการที่สองใช้เทคนิคหลายอย่าง (ไม่เป็นทางการมากขึ้นหรือน้อยลง) เพื่อจัดการกับความเป็นไปได้ของตัวแปรการแทรกแซง ตัวอย่างเช่นสามเอกสารรวมถึงตัวแปรที่ล้าหลังในสมการ (1), เจ็ดรวมถึงแนวโน้มเวลาเฉพาะสำหรับรัฐที่ได้รับการปฏิบัติสิบห้าพล็อตกราฟบางอย่างเพื่อตรวจสอบการเปลี่ยนแปลงของผลการรักษาสามตรวจสอบว่ามี "ผล" ก่อน กฎหมายทดสอบสองครั้งว่าผลกระทบจะยังคงอยู่หรือไม่ และสิบเอ็ดอย่างเป็นทางการพยายามทำความแตกต่างสาม (DDD) โดยการค้นหากลุ่มควบคุมอื่น ใน Bertrand, Duflo และ Mullainathan [2002] เราแสดงให้เห็นว่าเทคนิคเหล่านี้ส่วนใหญ่ไม่ได้ช่วยบรรเทาปัญหาความสัมพันธ์แบบอนุกรม

(เบอร์ทรานด์ดูฟอลและมัลไลธาธาน 2547, 253)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.