เพื่อประกอบการอธิบายฉันจะใช้รูปแบบการถดถอยที่ซับซ้อนน้อยกว่าY=β1+β2X2+β3X3+ϵที่ตัวแปรX2และX3อาจจะมีความสัมพันธ์ สมมติว่าเนินเขาβ2และβ3มีทั้งทางบวกเพื่อให้เราสามารถพูดได้ว่า (i) Yเพิ่มขึ้นเป็นX2เพิ่มขึ้นถ้าX3เป็นค่าคงที่จัดขึ้นตั้งแต่β2เป็นบวก; (ii) Yเพิ่มขึ้นเมื่อX3เพิ่มขึ้นหากX2นั้นคงที่เนื่องจากβ3เป็นค่าบวก
โปรดทราบว่าการตีความสัมประสิทธิ์การถดถอยหลายตัวเป็นสิ่งสำคัญโดยการพิจารณาว่าเกิดอะไรขึ้นเมื่อตัวแปรอื่น ๆ มีค่าคงที่ ("ceteris paribus") สมมติว่าผมแค่ถดถอยYกับX2กับรูปแบบY=β′1+β′2X2+ϵ′ ' การประมาณค่าสัมประสิทธิ์ความชันของฉันβ′2ซึ่งวัดผลกระทบต่อYของการเพิ่มขึ้นหนึ่งหน่วยในX2 โดยไม่ต้องถือX3คงอาจจะแตกต่างจากการประมาณการของฉันβ2จากการถดถอยพหุคูณ - ที่ยังมีขนาดผลกระทบต่อYจากการเพิ่มขึ้นหนึ่งหน่วยในX2แต่ก็ไม่ถือX3อย่างต่อเนื่อง ปัญหาเกี่ยวกับการประมาณการของฉันβ′2^คือว่ามันมีความลำเอียงจากตัวแปรที่ละเว้นหากX2และX3มีความสัมพันธ์กัน
เพื่อให้เข้าใจว่าเหตุใดจึงจินตนาการว่าX2และX3มีความสัมพันธ์เชิงลบ ตอนนี้เมื่อฉันเพิ่มX2โดยหน่วยหนึ่งฉันรู้ว่าค่าเฉลี่ยของYควรจะเพิ่มขึ้นตั้งแต่β2>0 0 แต่เป็นX2เพิ่มขึ้นถ้าเราไม่ถือX3คงที่แล้วX3มีแนวโน้มที่จะลดลงและตั้งแต่β3>0นี้จะมีแนวโน้มที่จะลดค่าเฉลี่ยของYYดังนั้นผลกระทบโดยรวมของการเพิ่มขึ้นหนึ่งหน่วยในX2จะลดลงถ้าฉันยอมให้X3จะแตกต่างกันยังจึงβ′2<β2 2 สิ่งต่าง ๆ ยิ่งแย่ลงยิ่งรุนแรงยิ่งขึ้นX2และX3มีความสัมพันธ์กันและยิ่งเอฟเฟกต์ของX3ถึงβ3มากขึ้นในกรณีที่รุนแรงมากเราอาจพบβ′2<0แม้ว่าเราจะรู้แล้วก็ตาม Ceteris paribus,X2มีอิทธิพลเชิงบวกต่อY !
หวังว่าตอนนี้คุณสามารถเห็นได้ว่าทำไมการวาดกราฟของYต่อX2จะเป็นวิธีที่ไม่ดีในการมองเห็นความสัมพันธ์ระหว่างYและX2ในแบบจำลองของคุณ ในตัวอย่างของฉันดวงตาของคุณจะถูกวาดให้อยู่ในแนวที่เหมาะสมที่สุดกับความชันβ′2^ที่ไม่สะท้อนβ2^จากแบบจำลองการถดถอยของคุณ ในกรณีที่เลวร้ายที่สุดแบบจำลองของคุณอาจคาดการณ์ว่าYเพิ่มขึ้นเมื่อX2เพิ่มขึ้น (โดยมีตัวแปรอื่น ๆ คงที่) และยังมีจุดบนกราฟที่แนะนำว่าYลดลงเมื่อX2เพิ่มขึ้น
ปัญหาคือในกราฟอย่างง่ายของYเทียบกับX2ตัวแปรอื่น ๆ จะไม่คงที่ นี่เป็นข้อมูลเชิงลึกที่สำคัญเกี่ยวกับประโยชน์ของพล็อตตัวแปรที่เพิ่มเข้ามา (หรือที่เรียกว่าพล็อตการถดถอยบางส่วน) - มันใช้ทฤษฎีบท Frisch-Waugh-Lovell เพื่อ "แยกบางส่วน" ออกผลของการทำนายอื่น ๆ แกนแนวนอนและแนวตั้งบนพล็อตอาจจะเข้าใจได้ง่ายที่สุด * ในขณะที่ " X2หลังจากตัวทำนายอื่น ๆ ได้รับการพิจารณา" และ " Yหลังจากตัวทำนายอื่น ๆ ได้รับการพิจารณา" ตอนนี้คุณสามารถดูความสัมพันธ์ระหว่างY และX2 เมื่อมีการใช้ตัวทำนายอื่นทั้งหมด. ตัวอย่างเช่นความชันที่คุณเห็นในแต่ละตอนนี้สะท้อนถึงสัมประสิทธิ์การถดถอยบางส่วนจากแบบจำลองการถดถอยหลายแบบดั้งเดิมของคุณ
จำนวนมากของพล็อตตัวแปรที่เพิ่มเข้ามาจะอยู่ในขั้นตอนการวินิจฉัยการถดถอยโดยเฉพาะอย่างยิ่งเนื่องจากค่าคงที่ในพล็อตตัวแปรที่เพิ่มนั้นเป็นค่าที่เหลือจากการถดถอยพหุคูณดั้งเดิมอย่างแม่นยำ ซึ่งหมายความว่าค่าผิดปกติและ heteroskedasticity สามารถระบุได้ในลักษณะที่คล้ายกันเมื่อดูที่พล็อตของแบบง่ายมากกว่าแบบจำลองการถดถอยหลายแบบ นอกจากนี้ยังสามารถเห็นคะแนนที่มีอิทธิพลซึ่งเป็นประโยชน์ในการถดถอยหลายครั้งเนื่องจากจุดที่มีอิทธิพลบางอย่างไม่ชัดเจนในข้อมูลดั้งเดิมก่อนที่คุณจะพิจารณาตัวแปรอื่น ๆ ในตัวอย่างของฉันค่าX2มีขนาดใหญ่พอสมควรอาจไม่ได้ดูนอกสถานที่ในตารางของข้อมูล แต่ถ้าค่าX3นั้นมีขนาดใหญ่เช่นกันแม้จะมีX2และX3มีความสัมพันธ์เชิงลบจากนั้นการรวมกันจะหายาก "การบัญชีสำหรับผู้ทำนายอื่น ๆ "ค่าX2นั้นใหญ่ผิดปกติและจะโดดเด่นกว่าในพล็อตตัวแปรที่เพิ่มเข้ามา
∗ทางเทคนิคแล้วพวกมันจะเหลือจากการวิ่งอีกสองถดถอย: ส่วนที่เหลือจากการถดถอยYกับตัวทำนายอื่นที่ไม่ใช่X2จะอยู่ในแกนตั้งในขณะที่ส่วนที่เหลือจากการถดถอยX2กับตัวทำนายอื่น ๆ นี่คือสิ่งที่ตำนานของ "Yมอบให้ผู้อื่น" และ "X2มอบให้ผู้อื่น" กำลังบอกคุณ เนื่องจากค่าเฉลี่ยที่เหลือจากการถดถอยทั้งสองนี้เป็นศูนย์จุดเฉลี่ยของ (X2ให้กับคนอื่นYให้คนอื่น ๆ ) จะเป็น (0, 0) ซึ่งจะอธิบายว่าทำไมเส้นถดถอยในพล็อตตัวแปรที่เพิ่มเข้ามามักจะผ่านจุดกำเนิด แต่บ่อยครั้งที่ฉันพบว่าการพูดถึงแกนเป็นแค่เศษเหลือจากการถดถอยอื่น ๆ ทำให้คนสับสน (อาจจะแปลกใจเพราะตอนนี้เรากำลังพูดถึงการถดถอยสี่แบบที่แตกต่างกัน!) ดังนั้นฉันจึงพยายามไม่อยู่กับเรื่องนี้ เข้าใจพวกเขาในฐานะ " X2มอบให้ผู้อื่น" และ " Yมอบให้ผู้อื่น" และคุณควรจะสบายดี