กรณีของคุณมีปัญหาน้อยกว่าวิธีอื่น ๆ ความคาดหวังและตัวดำเนินการประมาณการแบบเชิงเส้นต้องผ่านขั้นตอนแรกของแบบเชิงเส้น (เช่น OLS) แต่ไม่ผ่านแบบที่ไม่ใช่เชิงเส้นเช่น probit หรือ logit ดังนั้นจึงไม่ใช่ปัญหาหากคุณย้อนกลับตัวแปรภายนอกที่ต่อเนื่องของคุณในเครื่องมือ ,
จากนั้นใช้ค่าติดตั้งในระยะที่สองของ probit เพื่อประมาณ
XZ
Xผม= a + Z'ผมπ+ ηผม
Pr ( Yผม= 1 | Xˆผม) = Pr ( βXˆผม+ ϵผม> 0 )
ข้อผิดพลาดมาตรฐานจะไม่ถูกต้องเนื่องจากไม่ใช่ตัวแปรสุ่ม แต่เป็นปริมาณโดยประมาณ คุณสามารถแก้ไขสิ่งนี้ได้โดยการเริ่มต้นขั้นตอนที่หนึ่งและสองพร้อมกัน ใน Stata นี่จะเป็นสิ่งที่ต้องการXˆผม
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
ในตัวอย่างนี้เราต้องการประเมินผลกระทบของปีการศึกษาที่มีต่อความน่าจะเป็นที่จะอยู่ในสหภาพแรงงาน เนื่องจากปีการศึกษามีแนวโน้มที่จะเป็นภายนอกเราใช้มันกับปีของการดำรงตำแหน่งในระยะแรก แน่นอนว่ามันไม่สมเหตุสมผลเลยจากจุดตีความ แต่มันแสดงรหัส
ตรวจสอบให้แน่ใจว่าคุณใช้ตัวแปรควบคุมภายนอกที่เหมือนกันในขั้นตอนที่หนึ่งและขั้นที่สอง ในตัวอย่างข้างต้นสิ่งเหล่านั้นอยู่age, race
ในขณะที่เครื่องมือ (ไม่ใช่ความรู้สึก) tenure
มีเฉพาะในระยะแรก