การตั้งค่าข้อมูลสำหรับความแตกต่าง


9

การตั้งค่าใดถูกต้องสำหรับความแตกต่างของรูปแบบการถดถอยที่ใช้

Yผมsเสื้อ=α+γs* * * *T+λdเสื้อ+δ* * * *(T* * * *dเสื้อ)+εผมsเสื้อ

โดยที่ T คือดัมมี่ที่มีค่าเท่ากับ 1 ถ้าการสังเกตมาจากกลุ่มการรักษาและ d คือดัมมีที่เท่ากับ 1 ในช่วงเวลาหลังจากการรักษาเกิดขึ้น

1) สุ่มตัวอย่างจากแต่ละกลุ่มและเวลา (เช่น 4 ตัวอย่างสุ่ม)

หรือ

2) ข้อมูลพาเนลที่มีการติดตามหน่วยเดียวกันตลอดช่วงเวลาทั้งสองหรือไม่

เป็นเรื่องสำคัญหรือไม่หากใช้ OLS กับกรณีใดกรณีหนึ่งไม่ได้


1
ฉันไม่ได้เห็น (1) เสร็จแล้ว - การวิเคราะห์ดูเหมือนว่า = (2) เสมอ ไม่แน่ใจว่าทำไมคุณถึงต้องทำ (1) แต่ฉันไม่ได้เห็นการศึกษา DID มากมาย
charles

1
ตัวอย่างของ 1 แสดงอยู่ในเศรษฐมิติเบื้องต้น Wooldridge มาตรา 13.2
B_Miner

คำตอบ:


19

ข้อสันนิษฐานที่สำคัญของความแตกต่างในความแตกต่าง (DID) คือทั้งสองกลุ่มมีแนวโน้มร่วมกันในตัวแปรผลลัพธ์ก่อนการรักษา นี่เป็นสิ่งสำคัญเพื่อให้การโต้แย้งว่าการเปลี่ยนแปลงสำหรับกลุ่มที่ได้รับการรักษานั้นเป็นเพราะการรักษาและไม่ใช่เพราะทั้งสองกลุ่มมีความแตกต่างจากกันเพื่อเริ่มต้นด้วย

หากคุณสุ่มตัวอย่างผู้คนที่แตกต่างกันก่อนและหลังการรักษาสิ่งนี้จะทำให้การโต้แย้งอ่อนแอลงเว้นแต่กลุ่มตัวอย่างของคุณจากกลุ่มการรักษาและกลุ่มควบคุมนั้นจะสุ่มและใหญ่ ดังนั้นอาจเป็นไปได้ว่ามีใครบางคนกำลังถามคุณว่า: "คุณจะทำให้แน่ใจได้อย่างไรว่าผลกระทบนี้เกิดจากการรักษาและไม่ใช่เพียงเพราะคุณสุ่มตัวอย่างคนอื่น" - และนั่นจะยากที่จะตอบ คำถามนี้คุณสามารถหลีกเลี่ยงได้โดยใช้ข้อมูลพาเนลเนื่องจากคุณติดตามหน่วยสถิติเดียวกันตลอดเวลาและโดยทั่วไปนี่เป็นวิธีที่มั่นคงกว่า

เพื่อตอบคำถามสุดท้ายของคุณ: ใช่ข้อมูลมีความสำคัญ แต่คุณสามารถใช้ OLS เพื่อประเมินสมการของคุณด้านบน สิ่งสำคัญที่ในอดีตมักถูกมองข้ามคือการประเมินความผิดพลาดมาตรฐานที่ถูกต้อง หากคุณไม่แก้ไขให้ถูกต้องความสัมพันธ์แบบอนุกรมจะประเมินค่าต่ำเกินไปด้วยจำนวนที่เหมาะสมและคุณจะพบผลกระทบที่สำคัญแม้ว่าคุณอาจไม่ควรทำก็ตาม สำหรับการอ้างอิงและคำแนะนำสำหรับวิธีการจัดการกับปัญหานี้โปรดดูเบอร์แทรนด์และคณะ (2004) "เราควรเชื่อความแตกต่างในการประมาณการต่างกันมากแค่ไหน" .

สิ่งสุดท้ายคือถ้าคุณมีข้อมูลรวม (เช่นในระดับรัฐ) หรือถ้าคุณสามารถรวบรวมข้อมูลของคุณได้อย่างง่ายดายและถ้าคุณต้องการใช้วิธีเศรษฐมิติที่ใหม่กว่า DID คุณอาจต้องการดูAbadie et al (2010) "วิธีการควบคุมสังเคราะห์สำหรับการเปรียบเทียบกรณีศึกษา" วิธีการควบคุมแบบสังเคราะห์ถูกนำมาใช้มากขึ้นเรื่อย ๆ ในการวิจัยในปัจจุบันและมีการจัดทำเป็นเอกสารที่ดีสำหรับ R และ Stata บางทีนี่อาจเป็นสิ่งที่น่าสนใจสำหรับคุณเช่นกัน


นี่คือแอนดี้ที่ยอดเยี่ยม! ฉันสามารถสรุปได้ด้วยการบอกว่าการตั้งค่าข้อมูลทั้งสองนั้นเป็นที่ยอมรับ แต่ข้อมูลพาเนลนั้นง่ายกว่าที่จะทำการโต้แย้งเกี่ยวกับสมมติฐาน ซึ่งทั้งสองอย่างเหมาะสมโดย OLS แต่ข้อผิดพลาดมาตรฐานของ (โดยเฉพาะการตั้งค่าข้อมูลแผงที่ฉันเข้าใจ) เป็นที่น่าสงสัยเนื่องจากมีความสัมพันธ์แบบอนุกรมที่เป็นไปได้ การตั้งค่าพาเนลกับ Newey West SE จะเป็นทางออกที่ดีหรือไม่
B_Miner

6
ใช่สำหรับประเภทข้อมูลแรกคุณต้องมีสมมติฐานมากขึ้นและมากขึ้น สำหรับข้อผิดพลาดมาตรฐานการแก้ไข Newey West ควรทำงาน ที่จริงแล้วมันคล้ายกับหนึ่งในวิธีการแก้ไขที่เสนอโดย Bertrand และคณะ (พวกเขาใช้ข้อผิดพลาดมาตรฐานคลัสเตอร์) วิธีการใหม่กว่านี้ใช้ bootstrap ซึ่งทำงานได้ค่อนข้างดี (ดูrbnz.govt.nz/research_and_publications/seminars_and_workshops/… ) หวังว่านี่จะช่วยได้!
Andy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.