คุณลักษณะที่ดีของความแตกต่างความแตกต่าง (DiD) คือจริง ๆ แล้วว่าคุณไม่จำเป็นต้องใช้ข้อมูลพาเนล เมื่อการรักษาเกิดขึ้นในระดับของการรวมกลุ่ม (ในเมืองกรณีของคุณ) คุณจะต้องสุ่มตัวอย่างบุคคลจากเมืองก่อนและหลังการรักษา สิ่งนี้ช่วยให้คุณสามารถประมาณ
และได้รับผลกระทบเชิงสาเหตุของการรักษาเนื่องจากความแตกต่างของผลลัพธ์หลังการคาดการณ์ล่วงหน้าสำหรับ รับการรักษาลบความแตกต่างผลลัพธ์ที่คาดไว้หลังการควบคุม
Yฉันเป็นคนที= Aก.+ Bเสื้อ+ βDs T+ c Xฉันเป็นคนที+ ϵฉันเป็นคนที
มีบางกรณีที่ผู้คนใช้เอฟเฟกต์คงที่แต่ละตัวแทนที่จะเป็นตัวบ่งชี้การรักษาและนี่คือเมื่อเราไม่มีระดับการรวมที่กำหนดไว้อย่างดีซึ่งการรักษาเกิดขึ้น ในกรณีนั้นคุณจะประมาณ
โดยที่เป็นตัวบ่งชี้ระยะเวลาการรักษาหลังการรักษาสำหรับบุคคลที่ ได้รับการรักษา (ตัวอย่างเช่นโครงการตลาดงานที่เกิดขึ้นทุกที่) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้โปรดดูบันทึกการบรรยายเหล่านี้โดย Steve Pischke D ฉันที
Yฉันที= αผม+ Bเสื้อ+ βDฉันที+ c Xฉันที+ ϵฉันที
Dฉันที
Aก.
นี่คือตัวอย่างรหัสที่แสดงว่าเป็นกรณีนี้ ฉันใช้ Stata แต่คุณสามารถทำซ้ำสิ่งนี้ได้ในแพ็คเกจทางสถิติที่คุณเลือก "บุคคล" ที่นี่เป็นจริงประเทศ แต่พวกเขายังคงจัดกลุ่มตามตัวบ่งชี้การรักษาบางอย่าง
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
ดังนั้นคุณจะเห็นว่าค่าสัมประสิทธิ์ DiD ยังคงเหมือนเดิมเมื่อรวมเอฟเฟกต์คงที่แต่ละตัว ( areg
เป็นหนึ่งในคำสั่งการประมาณเอฟเฟกต์คงที่ใน Stata) ข้อผิดพลาดมาตรฐานจะเข้มงวดขึ้นเล็กน้อยและตัวบ่งชี้การรักษาดั้งเดิมของเราถูกดูดซับโดยผลกระทบคงที่ของแต่ละบุคคลและดังนั้นจึงลดลงในการถดถอย
ในการตอบกลับความคิดเห็น
ฉันได้กล่าวถึงตัวอย่างของ Pischke ที่จะแสดงเมื่อผู้คนใช้เอฟเฟกต์คงที่แต่ละตัวแทนที่จะเป็นกลุ่มตัวชี้วัด การตั้งค่าของคุณมีโครงสร้างกลุ่มที่กำหนดไว้อย่างดีดังนั้นวิธีที่คุณเขียนแบบจำลองของคุณนั้นดีมาก ข้อผิดพลาดมาตรฐานควรทำคลัสเตอร์ที่ระดับเมืองเช่นระดับของการรวมที่การรักษาเกิดขึ้น (ฉันไม่ได้ทำสิ่งนี้ในรหัสตัวอย่าง แต่ในการตั้งค่า DiD ข้อผิดพลาดมาตรฐานจำเป็นต้องได้รับการแก้ไขตามที่แสดงโดย Bertrand et al )
Ds Tsเสื้อ
c = [ E( yฉันเป็นคนที| s=1,t=1)-E( yฉันเป็นคนที| s=1,t=0)]- [ E( yฉันเป็นคนที| s=0,t=1)-E( yฉันเป็นคนที| s=0,t=0)]
E( yฉันเป็นคนที| s=1,t=1)E( yฉันเป็นคนที| s=0,t=1). เพื่อให้ชัดเจนว่าเหตุใดการระบุจึงมาจากความแตกต่างของกลุ่มเมื่อเวลาผ่านไปไม่ใช่จากตัวย้ายคุณสามารถเห็นภาพนี้ด้วยกราฟอย่างง่าย สมมติว่าการเปลี่ยนแปลงในผลลัพธ์เป็นเพียงเพราะการรักษาและมันมีผลกระทบที่เกิดขึ้นพร้อมกัน หากเรามีบุคคลที่อาศัยอยู่ในเมืองที่ได้รับการรักษาหลังจากเริ่มการรักษา แต่จากนั้นย้ายไปที่เมืองควบคุมผลลัพธ์ของพวกเขาควรกลับไปที่เดิมก่อนที่พวกเขาจะได้รับการรักษา แสดงในกราฟด้านล่าง
คุณอาจยังต้องการคิดถึงนักเคลื่อนไหวด้วยเหตุผลอื่น ๆ ตัวอย่างเช่นหากการรักษามีผลยาวนาน (เช่นมันยังคงส่งผลกระทบต่อผลแม้ว่าบุคคลได้ย้าย)