เพื่อตอบคำถามแรกของคุณคุณถูกต้องว่าการเลือกตัวอย่างเป็นรูปแบบเฉพาะของ endogeneity (ดู Antonakis et al. 2010 สำหรับการทบทวนพื้นฐานของ endogeneity และการเยียวยาทั่วไป) อย่างไรก็ตามคุณไม่ถูกต้องในการบอกว่าโอกาสที่จะได้รับการรักษา เป็นตัวแปร endogenous เนื่องจากเป็นตัวแปรการรักษาตัวเอง ("การมอบหมายการรักษาแบบไม่สุ่ม") - มากกว่าความเป็นไปได้ที่จะได้รับการรักษา - นั่นคือภายนอกในการเลือกตัวอย่าง โปรดจำไว้ว่า endogeneity หมายถึงสถานการณ์ที่คุณระบุความสัมพันธ์เชิงสาเหตุระหว่างปัจจัย X และปัจจัย Y อย่างไม่ถูกต้องเมื่อสังเกตุ "ความสัมพันธ์" ที่สังเกตได้นั้นเกิดจากปัจจัยอีกอย่างหนึ่งที่ส่งผลต่อทั้ง X และ Y ใส่วิธีอื่น :
yi=β0+β1xi+...+ϵi
endogeneity เกิดขึ้นเมื่อตัวทำนายของคุณตั้งแต่หนึ่งตัวขึ้นไปเกี่ยวข้องกับคำที่ผิดพลาดในแบบจำลอง นั่นคือเมื่อCov(x,ϵ)≠0 0
สาเหตุทั่วไปของ endogenity รวมถึง:
- ละเว้นตัวแปร (บางสิ่งที่เราไม่สามารถวัดได้)
- แรงจูงใจ / ทางเลือก
- ความสามารถ / ความสามารถ
- เลือกเอง
- ข้อผิดพลาดการวัด
(เราต้องการรวมxjแต่เราสังเกตเพียงxj∗ )
- พร้อมกัน / แบบสองทิศทาง (ในเด็กอายุต่ำกว่า 5 ปีความสัมพันธ์ระหว่างตัวบ่งชี้ภาวะโภชนาการ“ น้ำหนักสำหรับอายุ” และว่าเด็กที่ป่วยด้วยโรคล่าสุดอาจจะพร้อมกันหรือไม่
ปัญหาประเภทต่างๆต้องการวิธีแก้ไขที่แตกต่างกันเล็กน้อยซึ่งเป็นจุดที่ความแตกต่างระหว่างการแก้ไขประเภท IV และ Heckman อยู่ แน่นอนว่ามีความแตกต่างในกลไกพื้นฐานของวิธีการเหล่านี้ แต่หลักฐานเหมือนกัน: ซึ่งเป็นการลบ endogeneity โดยนึกคิดผ่านข้อ จำกัด การแยกคือหนึ่งหรือมากกว่าหนึ่งเครื่องมือในกรณีของ IV หรือตัวแปรที่มีผลต่อการเลือก แต่ไม่ ผลลัพธ์ในกรณีของ Heckman
ในการตอบคำถามที่สองคุณต้องคำนึงถึงความแตกต่างในประเภทของข้อ จำกัด ของข้อมูลที่ก่อให้เกิดการพัฒนาโซลูชันเหล่านี้ ฉันชอบที่จะคิดว่าวิธีการใช้เครื่องมือตัวแปร (IV) ถูกใช้เมื่อหนึ่งหรือมากกว่าหนึ่งตัวแปรเป็นภายนอกและไม่มีพร็อกซี่ที่ดีที่จะติดอยู่ในรูปแบบที่จะลบ endogeneity แต่ covariates และผลลัพธ์ที่ได้สำหรับการสังเกตทั้งหมด ในทางกลับกันการแก้ไขแบบ Heckman จะใช้เมื่อคุณมีการตัดทอนนั่นคือข้อมูลจะไม่ถูกตรวจสอบสำหรับตัวอย่างในกรณีที่ค่าของตัวแปรการเลือก == 0
วิธีการของเครื่องมือ (IV)
ลองคิดถึงตัวอย่างเศรษฐมิติแบบคลาสสิกสำหรับการถดถอย IV ด้วยตัวประมาณกำลังสองน้อยที่สุดสองขั้นตอน (2SLS): ผลของการศึกษาต่อรายได้
(1)Earningsi=β0+β1OwnEdi+ϵi
ระดับความสำเร็จของการศึกษาที่นี่อยู่ภายนอกเนื่องจากมีการกำหนดส่วนหนึ่งจากแรงจูงใจและความสามารถของแต่ละบุคคล แรงจูงใจและความสามารถไม่ได้วัดจากการสำรวจครัวเรือนหรือเศรษฐกิจ ดังนั้นสมการที่ 1 สามารถเขียนเพื่อรวมแรงจูงใจและความสามารถอย่างชัดเจน:
(2)Earningsi=β0+{β1OwnEdi+β2Motivi+β3Abili}+ϵi
ตั้งแต่และขฉันลิตรจะไม่ได้สังเกตจริง 2 สมการสามารถเขียนเป็น:MotivAbil
(3),Earningsi=β0+β1OwnEdi+ui
ที่ (4)ui=β2Motivi+β3Abili+ϵi
ดังนั้นการประเมินแบบไร้การศึกษาเกี่ยวกับผลกระทบของการศึกษาที่มีต่อผลประกอบการผ่าน OLS จะมีอคติ ตอนนี้คุณรู้แล้ว
ในอดีตผู้คนเคยใช้การศึกษาของผู้ปกครองเป็นเครื่องมือสำหรับระดับการศึกษาของผู้เข้าร่วมเนื่องจากพวกเขามีคุณสมบัติครบ 3 ข้อสำหรับเครื่องมือที่ใช้งานได้ ( ):z
- จะต้องเกี่ยวข้องกับทำนายภายนอก - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) ≠ 0 ,zCov(z,x)≠0
- ไม่สามารถจะเกี่ยวข้องโดยตรงกับผล - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0และzCov(z,y)=0
- ไม่สามารถที่เกี่ยวข้องกับการสำรวจ (U) ลักษณะ (นั่นคือ Zเป็นภายนอก) - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0zzCov(z,u)=0
เมื่อคุณทำประเมินการศึกษาเรื่องของ ( ) โดยใช้การศึกษาของผู้ปกครอง ( M o มอีdและD d E d ) ในขั้นตอนแรกและใช้ค่าที่คาดการณ์ของการศึกษา ( ^ O W n E d ) เพื่อประมาณการE R n ฉันn กรัมsในขั้นตอนที่สองคุณมี (ในแง่ง่ายมาก) การประเมินE R n ฉันn กรัมsขึ้นอยู่กับส่วนหนึ่งของOwnEdMomEdDadEdOwnEdˆEarningsEarningsที่ไม่ได้กำหนดโดยแรงจูงใจ / ความสามารถOwnEd
การแก้ไข Heckman ประเภท
ดังที่เราได้ก่อตั้งขึ้นมาก่อนการเลือกตัวอย่างที่ไม่ได้สุ่มเป็นประเภทของ endogeneity ในกรณีนี้ตัวแปรที่ละเว้นคือวิธีการที่ผู้คนถูกเลือกในตัวอย่าง โดยทั่วไปเมื่อคุณมีปัญหาการเลือกตัวอย่างผลลัพธ์ของคุณจะถูกตรวจสอบเฉพาะสำหรับผู้ที่เลือกตัวอย่างvariable == 1
เท่านั้น ปัญหานี้เป็นที่รู้จักกันในชื่อ "การตัดโดยไม่ตั้งใจ" และวิธีการแก้ปัญหานี้เป็นที่รู้จักกันทั่วไปในชื่อการแก้ไข Heckman ตัวอย่างคลาสสิกในสาขาเศรษฐศาสตร์คือข้อเสนอค่าจ้างของผู้หญิงที่แต่งงานแล้ว:
(5 )Wagei=β0+β1Educi+β2Experiencei+β3Experience2i+ϵi
ปัญหาที่นี่คือว่าเป็นเพียงการปฏิบัติสำหรับผู้หญิงที่ทำงานให้ค่าจ้างดังนั้นตัวประมาณการไร้เดียงสาจะลำเอียงในขณะที่เราไม่ทราบว่าข้อเสนอค่าจ้างสำหรับผู้ที่ไม่ได้มีส่วนร่วมในกำลังแรงงานการเลือก ตัวแปรs สมการที่ 5 สามารถเขียนใหม่เพื่อแสดงว่ามันถูกกำหนดร่วมกันโดยแบบจำลองแฝงสองแบบ:Wages
(6)Wage∗i=Xβ′+ϵi
(7)LaborForce∗i=Zγ′+νi
นั่นคือ IFF L ขo R F o R คอี* ฉัน > 0และ W กรัมE = IFF L ขo R F o R คอี* ฉัน ≤ 0Wage=Wage∗iLaborForce∗i>0Wage=.LaborForce∗i≤0
วิธีการแก้ปัญหาที่นี่จึงเป็นที่จะคาดการณ์โอกาสในการมีส่วนร่วมในกำลังแรงงานในขั้นตอนแรกโดยใช้แบบจำลอง probit และข้อ จำกัด การยกเว้น (เกณฑ์เหมือนกันสำหรับเครื่องมือที่ถูกต้องใช้ที่นี่) คำนวณคาดการณ์ผกผัน Mills อัตราส่วน ( λ ) สำหรับแต่ละสังเกต และในขั้นตอนที่สองประเมินข้อเสนอค่าจ้างโดยใช้λเป็นปัจจัยบ่งชี้ในรูปแบบ A (Wooldridge 2009) ถ้าค่าสัมประสิทธิ์ในλเป็นสถิติเท่ากับศูนย์มีหลักฐานของการเลือกตัวอย่าง (endogeneity) ไม่มีและ OLS ผลที่สอดคล้องกันและสามารถนำเสนอ ถ้าค่าสัมประสิทธิ์ในλλ^λ^λ^λ^ แตกต่างอย่างมีนัยสำคัญทางสถิติจากศูนย์คุณจะต้องรายงานค่าสัมประสิทธิ์จากแบบจำลองที่แก้ไข
อ้างอิง
- Antonakis, John, Samuel Bendahan, Philippe Jacquart และ Rafael Lalive 2010“ ในการเรียกร้องเชิงสาเหตุ: การทบทวนและข้อเสนอแนะ” ภาวะผู้นำไตรมาสที่ 21 (6): 1086–1120 ดอย: 10.1016 / j.leaqua.2010.10.010
- Wooldridge, Jeffrey M. 2009. เศรษฐมิติเบื้องต้น: แนวทางที่ทันสมัย วันที่ 4 Mason, OH, USA: South-Western, Cengage Learning