ความสอดคล้องของ 2SLS พร้อมกับตัวแปรภายนอก Binary


10

ฉันได้อ่านว่าตัวประมาณค่า 2SLS ยังคงสอดคล้องกันแม้จะมีตัวแปร endogenous แบบไบนารี ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ) ในระยะแรกจะใช้โมเดลการรักษาแบบ Probit แทนแบบจำลองเชิงเส้น

มีหลักฐานที่เป็นทางการใด ๆ ที่แสดงว่า 2SLS ยังคงสอดคล้องกันแม้ในระยะที่ 1 เป็น probit หรือ logit model?

แล้วถ้าผลออกมาเป็นเลขฐานสองล่ะ? ฉันเข้าใจว่าถ้าเรามีผลลัพธ์แบบไบนารีและตัวแปร endogenous แบบไบนารี (ขั้นตอนที่ 1 และ 2 เป็นทั้งแบบไบนารี probit / logit) การเลียนแบบวิธี 2SLS จะสร้างการประมาณที่ไม่สอดคล้องกัน มีหลักฐานอย่างเป็นทางการสำหรับเรื่องนี้หรือไม่? หนังสือเศรษฐมิติของ Wooldridge มีการพูดคุยกันบ้าง แต่ฉันคิดว่ามันไม่มีข้อพิสูจน์ที่ชัดเจนในการแสดงความไม่ลงรอยกัน

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

p = 1.19984ค่าสัมประสิทธิ์ของ ฉันรันการจำลองเพียงอย่างเดียว แต่มีขนาดตัวอย่างใหญ่


คุณไม่จำเป็นต้องเพิ่มlink = probitลงในคำสั่ง model?
Mike Hunter

คำตอบ:


10

มีคำถามคล้ายกันเกี่ยวกับขั้นตอนแรกของ probit และขั้นตอนที่สองของ OLS ในคำตอบฉันได้ให้ลิงค์ไปยังบันทึกที่มีหลักฐานอย่างเป็นทางการของความไม่สอดคล้องกันของการถดถอยนี้ซึ่งเป็นที่รู้จักกันอย่างเป็นทางการว่า "การถดถอยต้องห้าม" ตามที่มันถูกเรียกโดย Jerry Hausman เหตุผลหลักสำหรับความไม่สอดคล้องกันของขั้นตอนวิธีแรกของ probit / OLS ขั้นที่สองก็คือทั้งตัวดำเนินการความคาดหวังและตัวดำเนินการประมาณการเชิงเส้นจะไม่ผ่านขั้นตอนแรกที่ไม่ใช่เชิงเส้น ดังนั้นค่าติดตั้งจาก probit ขั้นแรกจะไม่เกี่ยวข้องกับข้อผิดพลาดระยะที่สองเท่านั้นภายใต้สมมติฐานที่เข้มงวดมากซึ่งแทบไม่เคยมีมาก่อนในทางปฏิบัติ โปรดทราบว่าการพิสูจน์อย่างเป็นทางการของความไม่สอดคล้องกันของการถดถอยต้องห้ามนั้นค่อนข้างซับซ้อนหากฉันจำได้อย่างถูกต้อง

หากคุณมีโมเดล โดยที่เป็นผลลัพธ์ต่อเนื่องและเป็นตัวแปร endogenous แบบไบนารีคุณสามารถเรียกใช้ ผ่าน OLS ได้ และใช้ค่าติดตั้งแทนในขั้นตอนที่สอง นี่คือโมเดลความน่าจะเป็นแบบเชิงเส้นที่คุณอ้างถึง ระบุว่ามีเป็นปัญหาสำหรับความคาดหวังหรือการคาดการณ์เชิงเส้นสำหรับขั้นตอนแรกนี้เชิงเส้นไม่มีประมาณการ 2SLS ของคุณจะสอดคล้องแม้จะมีประสิทธิภาพน้อยกว่าที่ควรจะเป็นถ้าเราจะคำนึงถึงลักษณะที่ไม่ใช่เชิงเส้นของx_iY ฉันX ฉันX ฉัน = + Z ' ฉันเธ+ η ฉันXฉันX ฉันX ฉัน

Yi=α+βXi+ϵi
YiXi
Xi=a+Ziπ+ηi
X^iXiXi

ความสอดคล้องของวิธีการนี้เกิดขึ้นจากข้อเท็จจริงที่ว่าในขณะที่ตัวแบบที่ไม่ใช่เชิงเส้นอาจเหมาะสมกับความคาดหวังตามเงื่อนไขทำงานอย่างใกล้ชิดสำหรับตัวแปรที่ จำกัด ขึ้นอยู่กับสิ่งนี้ไม่สำคัญมากถ้าคุณสนใจผลกระทบ ในแบบจำลองความน่าจะเป็นแบบเชิงเส้นสัมประสิทธิ์ตัวเองเป็นผลกระทบเล็กน้อยที่ประเมินที่ค่าเฉลี่ยดังนั้นหากผลกระทบส่วนเพิ่มที่ค่าเฉลี่ยคือสิ่งที่คุณเป็นหลังจากนั้น (และโดยปกติคือคน) นี่คือสิ่งที่คุณต้องการ ฟังก์ชันการคาดการณ์ตามเงื่อนไขที่ไม่ใช่เชิงเส้น
เช่นเดียวกันถือเป็นจริงถ้าเป็นไบนารีเช่นกันYi

สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการสนทนานี้ให้ดูที่บันทึกการบรรยายที่ยอดเยี่ยมของ Kit Baum ในหัวข้อนี้ จากสไลด์ 7 เขาอธิบายการใช้โมเดลความน่าจะเป็นเชิงเส้นในบริบท 2SLS

ท้ายที่สุดถ้าคุณต้องการใช้ probit จริงๆเพราะคุณต้องการการประมาณที่มีประสิทธิภาพมากกว่านั้นก็มีอีกวิธีหนึ่งที่กล่าวไว้ใน Wooldridge (2010) "การวิเคราะห์ทางเศรษฐมิติของข้อมูลส่วนและข้อมูลพาเนล" คำตอบที่เชื่อมโยงข้างต้นรวมถึงมันฉันทำซ้ำที่นี่เพื่อความสมบูรณ์ เป็นตัวอย่างที่ใช้ดูAdams และคณะ (2009)ผู้ใช้ขั้นตอนสามขั้นตอนที่ดำเนินการดังนี้:

  1. ใช้ probit เพื่อถดถอยตัวแปรภายนอกในตราสารและตัวแปรภายนอก
  2. ใช้ค่าที่คาดการณ์จากขั้นตอนก่อนหน้าในขั้นตอนแรกของ OLS พร้อมกับตัวแปรภายนอก (แต่ไม่มีเครื่องมือ)
  3. ทำขั้นตอนที่สองตามปกติ

ขั้นตอนนี้ไม่ตกสำหรับปัญหาการถดถอยที่ต้องห้าม แต่อาจส่งมอบการประมาณที่มีประสิทธิภาพมากขึ้นของพารามิเตอร์ที่คุณสนใจ


สวัสดีแอนดี้ขอบคุณสำหรับคำตอบของคุณ คุณกำลังแนะนำ "ความไม่สอดคล้องกันของขั้นตอนแรกของ probit / วิธี OLS second stage" หรือไม่? นั่นไม่ใช่สิ่งที่ฉันอ่านในลิงค์ที่ฉันให้ Probit ขั้นแรก / OLS ขั้นตอนวิธีที่สองกล่าวกันว่าสอดคล้องกัน
Vincent

นั่นไม่ใช่สิ่งที่โพสต์ของนักสถิติกล่าว หากคุณดูที่ส่วน "วิธีการและสูตร" สำหรับคำสั่ง treatreg (ซึ่งตอนนี้เรียกว่า etregress) ในเอกสารคุณจะเห็นว่าตัวประมาณค่า 2 ขั้นตอนไม่ใช่ 2SLS ที่มี probit ระยะแรก / OLS ระยะที่สอง แต่จะใช้ probit เป็นครั้งแรกเพื่อให้ได้อัตราส่วนความเป็นอันตรายซึ่งจะใช้ในการถดถอย OLS เพื่อให้ได้ค่าประมาณที่สอดคล้องกัน
Andy

ขอบคุณแอนดี้ มันกำลังได้รับความสนใจ ดูเหมือนว่าการเลียนแบบ 2SLS กับรุ่น probit ในระยะที่ 1 จะไม่ได้รับการยอมรับ ฉันจะอ่าน "การห้ามการถดถอย" ด้วยเหตุผลทางเหตุผล โดยวิธีการที่ฉันพยายามจำลองโดยใช้ SAS และผลลัพธ์ไม่ได้ดูแย่สำหรับ 2SLS ด้วย probit 1st / ols 2nd
Vincent

ฉันกำลังโพสต์รหัสในคำถามหลักและชอบที่จะได้ยินความคิดเห็นของคุณ ขอบคุณ!
Vincent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.