วิธีการตีความสัมประสิทธิ์ระยะที่สองในการถดถอยตัวแปรเครื่องมือด้วยเครื่องมือไบนารีและตัวแปรภายนอกไบนารี?


11

(โพสต์ค่อนข้างยาวขออภัยมีข้อมูลพื้นหลังมากมายดังนั้นโปรดข้ามไปที่คำถามด้านล่าง)

Intro:ฉันกำลังทำงานในโครงการที่เรากำลังพยายามที่จะระบุผลกระทบของตัวแปรภายนอกไบนารีบนผลอย่างต่อเนื่องปีเราได้สร้างเครื่องมือขึ้นมาซึ่งเราเชื่อมั่นอย่างยิ่งว่าจะได้รับการมอบหมายแบบสุ่มx1yz1

ข้อมูล:ข้อมูลอยู่ในโครงสร้างแผงซึ่งมีการสังเกตการณ์ประมาณ 34,000 ครั้งกระจายไปทั่ว 1,000 หน่วยและประมาณ 56 ช่วงเวลา ใช้ค่า 1 สำหรับการสังเกตประมาณ 700 (2%) และทำประมาณ 3000 (9%) 111 (0.33%) สังเกตคะแนน 1 ทั้งและและมันก็เป็นสองเท่าแนวโน้มสำหรับข้อสังเกตที่จะทำคะแนน 1ถ้ามันยังคะแนน 1 z_1x1z1z1x1x1z1

การประมาณ:เราประเมินโมเดล 2SLS ต่อไปนี้ผ่านขั้นตอน ivreg2 ของ Stata:

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

โดยที่เป็นเวกเตอร์ของตัวแปรภายนอกอื่น ๆ คือค่าที่คาดการณ์ของจากระยะแรกและและเป็นคำที่ผิดพลาดZx1x1uv

ผลลัพธ์:ดูเหมือนว่าทุกอย่างจะทำงานได้ดี การประมาณการมีความสำคัญสูงในขั้นตอนแรกและการประมาณการมีความสำคัญสูงในขั้นตอนที่สอง สัญญาณทั้งหมดเป็นไปตามที่คาดไว้รวมถึงสัญญาณสำหรับตัวแปรภายนอกอื่น ๆ อย่างไรก็ตามปัญหาคือว่าการประมาณของ - สัมประสิทธิ์ของความน่าเชื่อถือนั้นมีขนาดใหญ่มาก (หรืออย่างน้อยก็เป็นไปตามที่เราตีความมาก่อน)π1β1β1

yอยู่ในช่วงประมาณ 2 ถึงประมาณ 26 ด้วยค่าเฉลี่ยและค่ามัธยฐานของ 17 แต่ค่าประมาณของมีช่วงตั้งแต่ 30 ถึง 40 (ขึ้นอยู่กับสเปค)!β1

อ่อนแอ IV:ความคิดแรกของเราคือว่านี่เป็นเพราะเครื่องมืออ่อนแอเกินไป นั่นคือไม่สัมพันธ์กับตัวแปรภายนอกมากนัก แต่สิ่งนี้ดูเหมือนจะไม่เป็นเช่นนั้น ในการตรวจสอบจุดอ่อนของเครื่องมือเราใช้ Finlay, Magnusson และแพ็คเกจอ่อนแอของ Schaffer เนื่องจากมีการทดสอบที่แข็งแกร่งต่อการละเมิดสมมติฐาน (ซึ่งมีความเกี่ยวข้องที่นี่เนื่องจากเรามีข้อมูลแผงและจัดกลุ่ม SE ของเราที่ ระดับหน่วย)i.i.d.

ตามการทดสอบ AR ของพวกเขาขอบเขตล่างของช่วงความมั่นใจ 95% สำหรับค่าสัมประสิทธิ์ระยะที่สองอยู่ระหว่าง 16 และ 29 (ขึ้นอยู่กับข้อกำหนดอีกครั้ง) ความน่าจะเป็นในการปฏิเสธนั้นเป็นจริง 1 สำหรับทุกค่าใกล้กับศูนย์

การสังเกตที่มีอิทธิพล: เราได้ลองประเมินแบบจำลองด้วยการลบแต่ละหน่วยออกทีละการสังเกตแต่ละครั้งจะถูกลบออกและแยกกลุ่มออก ไม่มีการเปลี่ยนแปลงที่แท้จริง

วิธีแก้ปัญหาที่เสนอ: มีคนเสนอว่าเราไม่ควรสรุปผลกระทบโดยประมาณของเครื่องมือในเมตริกดั้งเดิม (0-1) แต่ในเมตริกของเวอร์ชันที่คาดการณ์ไว้ อยู่ในช่วง -0.01 ถึง 0.1 โดยมีค่าเฉลี่ยและค่ามัธยฐานประมาณ 0.02 และ SD ประมาณ 0.018 ถ้าเราจะสรุปผลโดยประมาณของโดยให้เพิ่มหนึ่ง SD ในนั่นคือ (ข้อกำหนดอื่น ๆ ให้ผลลัพธ์ที่เหมือนกันเกือบทั้งหมด) นี่จะเป็นวิธีที่สมเหตุสมผลมากขึ้น (แต่ก็ยังเป็นรูปธรรม) ดูเหมือนว่าโซลูชั่นที่สมบูรณ์แบบ ยกเว้นว่าฉันไม่เคยเห็นใครทำอย่างนั้น ทุกคนดูเหมือนจะตีความค่าสัมประสิทธิ์ระยะที่สองโดยใช้เมตริกของตัวแปรภายนอกเดิมx1x1x1x10.01830=0.54

คำถาม:ในแบบจำลอง IV มันถูกต้องหรือไม่ที่จะสรุปผลกระทบโดยประมาณ (LATE จริง ๆ ) ของการเพิ่มขึ้นของตัวแปรภายนอกโดยใช้ตัวชี้วัดของเวอร์ชันที่ทำนายไว้ ในกรณีของเราเมตริกนั้นคาดว่าน่าจะเป็น

หมายเหตุ:เราใช้ 2SLS แม้ว่าเราจะมีตัวแปร endogenous แบบไบนารี (ทำให้ระยะแรกเป็น LPM) สิ่งนี้ตามด้วย Angrist & Krueger (2001):“ ตัวแปรเครื่องมือและการค้นหาเพื่อระบุ: จากอุปสงค์และอุปทานสู่การทดลองตามธรรมชาติ”) เราได้ลองใช้กระบวนการสามขั้นตอนที่ใช้ใน Adams, Almeida และ Ferreira (2009):“ ทำความเข้าใจเกี่ยวกับความสัมพันธ์ระหว่างผู้ก่อตั้ง - ซีอีโอกับประสิทธิภาพของ บริษัท ” วิธีหลังซึ่งประกอบด้วยโมเดล probit ตามด้วย 2SLS ให้ค่าสัมประสิทธิ์ที่เล็กลงและมีเหตุผลมากขึ้น แต่ยังคงมีขนาดใหญ่มากหากตีความใน 0-1 เมตริก (ประมาณ 9-10) เราได้ผลลัพธ์เดียวกันกับการคำนวณด้วยตนเองเหมือนกับ probit-2sls-option ใน Cerulli ivtreatreg


คุณเคยลองetregress/treatregไหม
Dimitriy V. Masterov

สวัสดี Dimitriy ขอบคุณสำหรับคำตอบ! ฉันลอง etregress แล้วและมันก็ให้ผลลัพธ์ที่คล้ายกันบ้าง อย่างไรก็ตามการอ่านคู่มือ Stata และ Wooldridge (2002): "การวิเคราะห์ทางเศรษฐมิติของข้อมูลภาคตัดขวางและข้อมูลพาเนล" ฉันได้รับความประทับใจว่ารูปแบบการถดถอยการรักษาแบบนี้ถือว่าไม่สามารถรักษาได้ นั่นคือเงื่อนไขกับตัวแปรที่สังเกตว่าหน่วยได้รับการปฏิบัติหรือไม่เป็นอิสระจากผล (ศักยภาพ) ของมันภายใต้ทั้งการรักษาและการควบคุม
Bertel

(ต่อ) ในข้อมูลของเราเราไม่สามารถรักษาสมมติฐานนี้ได้จริง เราเพียงแค่มีแหล่งที่มาของการเปลี่ยนแปลงแบบสุ่มในx. ดังนั้น IV ดูเหมือนตัวเลือกที่เหมาะสม ถ้าฉันมีสมมติฐานถูกต้องล่ะก็
Bertel

มันจะมีประโยชน์จริง ๆ ถ้ามีกราฟเช่น scatterplots หรือ kernel density Plots ของ raw varables และส่วนที่เหลือเป็นต้นโปรดจำไว้ว่า plim β^1=β1+Cov(z1,u)Cov(z1,x1)แม้ความสัมพันธ์เล็ก ๆ ระหว่างเครื่องมือกับคำผิดพลาดอาจทำให้การประมาณที่ไม่สอดคล้องกันของ ! β1
Arne Jonas Warnke

คำตอบ:


2

นี่เป็นคำถามเก่า แต่สำหรับใครก็ตามที่สะดุดในอนาคตการประมาณ 2SLS ของคือจากการถดถอยแบบ "ลดรูปแบบ"β1α1

y=α0+α1z1+Zα+u

หารด้วยจากการถดถอย "ขั้นแรก"π1

x1=π0+π1Z1+Zπ+โวลต์

ดังนั้นหาก 2SLS ประมาณการของคือ "ขนาดใหญ่ implausibly" ตรวจสอบ OLS ประมาณการของและ\β1α1π1

หากการประมาณการนั้น "สมเหตุสมผล" อาจเป็นไปได้ว่าการประมาณการนั้น "เล็กมาก" หารด้วย "ขนาดเล็กมาก"สามารถผลิต "ขนาดใหญ่ implausibly" \α1π1α^1π^1β^1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.