ถดถอยของบนไม่จำเป็นต้องเป็นสาเหตุถ้ามีจะถูกตัดตัวแปรที่มีอิทธิพลต่อทั้งและy ที่แต่ถ้าไม่ใช่สำหรับตัวแปรที่ละเว้นและข้อผิดพลาดการวัดสาเหตุการถดถอยคืออะไร นั่นคือถ้าทุกตัวแปรที่เป็นไปได้รวมอยู่ในการถดถอย?
ถดถอยของบนไม่จำเป็นต้องเป็นสาเหตุถ้ามีจะถูกตัดตัวแปรที่มีอิทธิพลต่อทั้งและy ที่แต่ถ้าไม่ใช่สำหรับตัวแปรที่ละเว้นและข้อผิดพลาดการวัดสาเหตุการถดถอยคืออะไร นั่นคือถ้าทุกตัวแปรที่เป็นไปได้รวมอยู่ในการถดถอย?
คำตอบ:
ไม่ไม่ฉันจะแสดงตัวอย่างให้คุณดู
ที่แรกก็คือทำให้เกิดผลย้อนกลับ พิจารณาแบบจำลองเชิงสาเหตุคือโดยที่และเป็นตัวแปรสุ่มแบบเกาส์มาตรฐาน จากนั้นเนื่องจากไม่ก่อให้เกิดแต่จะขึ้นอยู่กับX
ตัวอย่างที่สองคือการควบคุมสำหรับ colliders (ดูที่นี่ ) พิจารณาแบบจำลองเชิงสาเหตุนั่นคือไม่ทำให้และเป็นสาเหตุทั่วไป แต่โปรดทราบว่าถ้าคุณเรียกใช้การถดถอยรวมถึงสัมประสิทธิ์การถดถอยของจะไม่เป็นศูนย์เพราะการปรับสภาพที่สาเหตุทั่วไปจะทำให้เกิดการเชื่อมโยงระหว่างและ (คุณอาจต้องการดูที่นี่เช่นกันการวิเคราะห์เส้นทางในสถานะ เงื่อนไข Collider - เมื่อ )
โดยทั่วไปการถดถอยของในจะเป็นสาเหตุหากตัวแปรที่รวมอยู่ในการถดถอยตอบสนองเกณฑ์ลับๆ
นอกเหนือจากคำตอบที่สำคัญของ Carlos Cinelli แล้วยังมีอีกสองสามเหตุผลที่สัมประสิทธิ์การถดถอยอาจไม่เป็นสาเหตุ
ประการแรกการสะกดผิดแบบจำลองสามารถทำให้พารามิเตอร์ไม่เป็นสาเหตุได้ เพียงเพราะคุณมีตัวแปรที่เกี่ยวข้องทั้งหมดในแบบจำลองของคุณไม่ได้หมายความว่าคุณได้ปรับตัวแปรเหล่านั้นในวิธีที่ถูกต้อง เป็นตัวอย่างที่ง่ายมากพิจารณาตัวแปรที่มีการกระจายสมมาตรรอบ 0. สมมติว่าผลตัวแปรของคุณเป็นผลกระทบจากในลักษณะที่ 2 ถอยบน (เมื่อเทียบกับใน ) จะแล้วจะให้ค่าสัมประสิทธิ์ประมาณสำหรับประมาณ 0, ลำเอียงอย่างชัดเจนแม้จะมีคุณมีการตั้งค่าทั้งหมด (เท่านั้น) ตัวแปรที่มีผลต่อY
ประการที่สองและเกี่ยวข้องกับหัวข้อของสาเหตุเชิงย้อนกลับนอกจากนี้ยังมีความเสี่ยงที่คุณสามารถมีอคติในการคัดเลือกเช่นตัวอย่างของคุณได้รับการคัดเลือกในลักษณะที่ไม่ได้เป็นตัวแทนของประชากรที่คุณต้องการอนุมาน นอกจากนี้ข้อมูลที่หายไปยังสามารถทำให้มีอคติได้หากข้อมูลไม่ได้สุ่มโดยสมบูรณ์