[ต่อไปนี้อาจดูเหมือนเทคนิคเล็กน้อยเนื่องจากการใช้สมการ แต่สร้างบนแผนภูมิลูกศรเป็นหลักเพื่อให้ปรีชาญาณซึ่งต้องการเพียงความเข้าใจพื้นฐานของ OLS เท่านั้น - ดังนั้นอย่าถูกปฏิเสธ]
สมมติว่าคุณต้องการประเมินผลเชิงสาเหตุของต่อy i ที่ได้จากสัมประสิทธิ์โดยประมาณสำหรับβแต่ด้วยเหตุผลบางอย่างมีความสัมพันธ์ระหว่างตัวแปรอธิบายของคุณและคำผิด:xผมyiβ
yi=α+βxi+↖corrϵi↗
สิ่งนี้อาจเกิดขึ้นเพราะเราลืมที่จะรวมตัวแปรสำคัญที่สัมพันธ์กับด้วย ปัญหานี้เป็นที่รู้จักกันละเว้นอคติตัวแปรแล้วคุณβจะไม่ให้ผลกระทบเชิงสาเหตุ (ดูที่นี่สำหรับรายละเอียด) นี่เป็นกรณีที่คุณต้องการใช้เครื่องดนตรีเพราะเมื่อนั้นคุณจะพบผลกระทบที่แท้จริงได้xiβˆ
เป็นเครื่องมือที่เป็นตัวแปรใหม่ซึ่งเป็น uncorrelated กับε ฉันแต่ความสัมพันธ์ที่ดีกับx ฉันและที่เดียวที่มีอิทธิพลต่อปีฉันผ่านx ฉัน - ดังนั้นเครื่องมือของเราคือสิ่งที่เรียกว่า "ภายนอก" มันเหมือนในแผนภูมินี้ที่นี่:ziϵixiyixi
zi→xi↑ϵi→↗yi
แล้วเราจะใช้ตัวแปรใหม่นี้อย่างไร
บางทีคุณอาจจำแนวคิดประเภท ANOVA ที่อยู่เบื้องหลังการถดถอยที่คุณแบ่งความแปรปรวนรวมของตัวแปรตามให้เป็นองค์ประกอบที่อธิบายและไม่ได้อธิบาย ตัวอย่างเช่นหากคุณถอยหลังของคุณลงบนอุปกรณ์xi
xitotal variation=a+πziexplained variation+ηiunexplained variation
zixiziηiϵixiˆ
xi=a+πzigood variation=xˆi+ηibad variation
yi=α+βxˆi+ϵi
xˆiϵixiηiβxizi
ϵixiyixˆi
zi→xi↗→xˆi↓yi
β
ziϵi