2SLS แต่ Probit ขั้นที่สอง


15

ฉันพยายามใช้การวิเคราะห์ตัวแปรเครื่องมือเพื่ออนุมานสาเหตุของข้อมูลเชิงสังเกต

ฉันได้เจอการถดถอยสองขั้นตอนสองขั้น (2SLS) ซึ่งมีแนวโน้มที่จะแก้ไขปัญหา endogeneity ในการวิจัยของฉัน อย่างไรก็ตามฉันอยากจะเป็นด่านแรกที่จะเป็น OLS และด่านที่สองเพื่อเป็นผู้ที่อยู่ภายใน 2SLS จากการอ่านและการค้นหาของฉันฉันได้เห็นนักวิจัยใช้ 2SLS หรือ prost ขั้นตอนแรกและขั้นตอนที่สอง OLS แต่ไม่ใช่รอบอื่น ๆ ซึ่งเป็นสิ่งที่ฉันพยายามบรรลุ

ฉันกำลังใช้คำสั่งStata และivregใน Stata สำหรับ 2SLS แบบตรง

คำตอบ:


12

กรณีของคุณมีปัญหาน้อยกว่าวิธีอื่น ๆ ความคาดหวังและตัวดำเนินการประมาณการแบบเชิงเส้นต้องผ่านขั้นตอนแรกของแบบเชิงเส้น (เช่น OLS) แต่ไม่ผ่านแบบที่ไม่ใช่เชิงเส้นเช่น probit หรือ logit ดังนั้นจึงไม่ใช่ปัญหาหากคุณย้อนกลับตัวแปรภายนอกที่ต่อเนื่องของคุณในเครื่องมือ , จากนั้นใช้ค่าติดตั้งในระยะที่สองของ probit เพื่อประมาณ XZ

Xผม=a+Zผม'π+ηผม
ราคา(Yผม=1|X^ผม)=ราคา(βX^ผม+εผม>0)

ข้อผิดพลาดมาตรฐานจะไม่ถูกต้องเนื่องจากไม่ใช่ตัวแปรสุ่ม แต่เป็นปริมาณโดยประมาณ คุณสามารถแก้ไขสิ่งนี้ได้โดยการเริ่มต้นขั้นตอนที่หนึ่งและสองพร้อมกัน ใน Stata นี่จะเป็นสิ่งที่ต้องการX^ผม

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

ในตัวอย่างนี้เราต้องการประเมินผลกระทบของปีการศึกษาที่มีต่อความน่าจะเป็นที่จะอยู่ในสหภาพแรงงาน เนื่องจากปีการศึกษามีแนวโน้มที่จะเป็นภายนอกเราใช้มันกับปีของการดำรงตำแหน่งในระยะแรก แน่นอนว่ามันไม่สมเหตุสมผลเลยจากจุดตีความ แต่มันแสดงรหัส

ตรวจสอบให้แน่ใจว่าคุณใช้ตัวแปรควบคุมภายนอกที่เหมือนกันในขั้นตอนที่หนึ่งและขั้นที่สอง ในตัวอย่างข้างต้นสิ่งเหล่านั้นอยู่age, raceในขณะที่เครื่องมือ (ไม่ใช่ความรู้สึก) tenureมีเฉพาะในระยะแรก


ขอบคุณมากสิ่งนี้แก้ไขปัญหาที่ฉันเผชิญ ขอบคุณอีกครั้ง.
Veronica

1
การวิจัยจริงแนะนำให้ใช้วิธีการควบคุมฟังก์ชั่นสำหรับโมเดลที่ไม่ใช่เชิงเส้นเช่น logit ซึ่งจะใช้ส่วนที่เหลือจากขั้นตอนแรกพร้อมกับตัวแปรภายนอกมากกว่าค่าที่คาดการณ์ไว้ แม้ว่าดูเหมือนว่าจะมีความก้าวหน้าบ่อยครั้งโปรดดู: stat.wharton.upenn.edu/~zijguo/…
robin.datadrivers

1
ขออภัยฉันไม่ได้ให้การอ้างอิงสำหรับการเปรียบเทียบทั้งสองวิธีสำหรับโมเดลเชิงเส้นและไม่เชิงเส้น ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers

-1 ฉันต้องลงคะแนนคำตอบนี้เนื่องจากโดยทั่วไปแล้วมันเป็นไปไม่ได้ที่จะนำแนวคิดของตัวประมาณค่า 2SLS ไปใช้กับโมเดลที่ไม่ใช่เชิงเส้นในระยะแรกและ / หรือระยะที่สอง มันอาจจะเป็นจริงสำหรับกรณีของ 1st stage LS และ 2nd stage probit (@Andy คุณมีการอ้างอิงเพื่อสนับสนุนสิ่งนี้หรือไม่) แต่อย่างน้อย caveat นั้นเป็นไปตามที่ฉันเห็นคนจำนวนมากที่ทำแนวคิด 2SLS ในทุกประเภท กรณีของโมเดลที่ไม่ใช่เชิงเส้นในระยะที่หนึ่งและสองและนั่นคือการปฏิบัติที่มีปัญหา
Momo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.