วิธีที่ดีที่สุดในการคิดเกี่ยวกับสิ่งนี้คือการจินตนาการจุดกระจายด้วยบนแกนตั้งและแทนด้วยแกนนอน ด้วยกรอบการทำงานนี้คุณจะเห็นจุดต่าง ๆ ซึ่งอาจเป็นรูปวงกลมหรืออาจยืดออกเป็นวงรี สิ่งที่คุณพยายามทำในการถดถอยคือค้นหาสิ่งที่อาจเรียกว่า 'เส้นที่เหมาะสมที่สุด' อย่างไรก็ตามในขณะที่สิ่งนี้ดูตรงไปตรงมาเราจำเป็นต้องเข้าใจว่าเราหมายถึงอะไรโดย 'ดีที่สุด' และนั่นหมายความว่าเราจะต้องกำหนดว่ามันจะเป็นอะไรที่ดีหรือสำหรับหนึ่งบรรทัดจะดีกว่าอีก ฯลฯ โดยเฉพาะ เราต้องกำหนดฟังก์ชั่นการสูญเสียxyx. ฟังก์ชั่นการสูญเสียทำให้เรามีวิธีที่จะบอกว่าบางสิ่งที่ 'ไม่ดี' คืออะไรและเมื่อเราย่อให้เล็กสุดนั้นเราจะทำให้สายของเราเป็น 'ดี' ที่สุดเท่าที่จะเป็นไปได้หรือหาบรรทัดที่ดีที่สุด
ตามเนื้อผ้าเมื่อเราดำเนินการวิเคราะห์การถดถอยเราพบประมาณการของความลาดชันและตัดเพื่อลดผลรวมของ squared ข้อผิดพลาด สิ่งเหล่านี้ถูกกำหนดไว้ดังนี้:
SSE=∑i=1N(yi−(β^0+β^1xi))2
ในแง่ของแผนการกระจายของเรานั่นหมายความว่าเราลดระยะทางแนวตั้ง (ผลรวมของกำลังสอง) ให้น้อยที่สุดระหว่างจุดข้อมูลที่สังเกตและเส้น
ในทางกลับกันมันมีเหตุผลอย่างสมบูรณ์แบบที่จะถอยหลังลงบนแต่ในกรณีนี้เราจะวางบนแกนตั้งและอื่น ๆ ถ้าเรารักษาพล็อตของเราตามที่เป็น (โดยบนแกนนอน), ถอยลงบน (อีกครั้งโดยใช้สมการข้างบนที่ดัดแปลงเล็กน้อยด้วยสวิตช์และ ) หมายความว่าเราจะลดผลรวมของระยะทางในแนวนอนy x x x y y x yxyxxxyxyระหว่างจุดข้อมูลที่สังเกตและเส้น ฟังดูคล้ายกันมาก แต่ก็ไม่เหมือนกัน (วิธีการรับรู้นี้จะทำมันทั้งสองวิธีและจากนั้นพีชคณิตแปลงชุดของการประมาณค่าพารามิเตอร์หนึ่งเป็นเงื่อนไขของอื่น ๆ เปรียบเทียบกับรุ่นแรกกับรุ่นที่ปรับปรุงใหม่ของรุ่นที่สองมันกลายเป็นเรื่องง่ายที่จะเห็นว่าพวกเขา ไม่เหมือนกัน.)
โปรดทราบว่าจะไม่มีวิธีใดที่จะสร้างบรรทัดเดียวกันกับเราได้โดยง่ายหากมีคนส่งกระดาษกราฟให้เราโดยมีจุดที่พล็อตอยู่ ในกรณีที่เราจะวาดเส้นตรงผ่านศูนย์ แต่การลดระยะทางแนวตั้งผลตอบแทนถัวเฉลี่ยบรรทัดที่เล็กน้อยอี๋ (คือมีความลาดชันตื้น) ในขณะที่การลดระยะทางแนวนอนผลตอบแทนถัวเฉลี่ยที่เป็นเส้นเล็กน้อยชัน
สหสัมพันธ์นั้นสมมาตร จะเป็นความสัมพันธ์กับเป็นอยู่กับxอย่างไรก็ตามความสัมพันธ์ระหว่างโมเมนต์ของเพียร์สันสามารถเข้าใจได้ในบริบทการถดถอย สัมประสิทธิ์สหสัมพันธ์, , คือความชันของเส้นถดถอยเมื่อตัวแปรทั้งสองได้มาตรฐานก่อน นั่นคือคุณลบค่าเฉลี่ยออกจากการสังเกตแต่ละครั้งก่อนแล้วหารความแตกต่างด้วยค่าเบี่ยงเบนมาตรฐาน คลาวด์ของจุดข้อมูลจะถูกจัดกึ่งกลางที่จุดกำเนิดและความชันจะเหมือนกันไม่ว่าคุณจะถดถอยลงบนหรือบนy y x r y x x yxyyxryxxy
ทีนี้ทำไมเรื่องนี้ถึงมีความหมาย? ใช้ฟังก์ชั่นการสูญเสียแบบดั้งเดิมของเราเรากำลังบอกว่าข้อผิดพลาดทั้งหมดเป็นเพียงหนึ่งในตัวแปร (viz., ) นั่นคือเรากำลังบอกว่าวัดได้โดยไม่มีข้อผิดพลาดและถือเป็นชุดของค่าที่เราสนใจ แต่นั้นมีข้อผิดพลาดในการสุ่มตัวอย่างx yyxy. นี่แตกต่างจากการพูดคุยอย่างมาก นี่เป็นสิ่งสำคัญในตอนประวัติศาสตร์ที่น่าสนใจ: ในช่วงปลายยุค 70 และต้นยุค 80 ในสหรัฐอเมริกาคดีนี้มีการเลือกปฏิบัติต่อสตรีในที่ทำงานและได้รับการสนับสนุนด้วยการวิเคราะห์การถดถอยแสดงให้เห็นว่าผู้หญิงที่มีพื้นฐานเท่าเทียมกัน (เช่น คุณสมบัติประสบการณ์ ฯลฯ ) ได้รับค่าตอบแทนโดยเฉลี่ยน้อยกว่าผู้ชาย นักวิจารณ์ (หรือคนที่มีความละเอียดเป็นพิเศษ) ให้เหตุผลว่าถ้าเรื่องนี้เป็นจริงผู้หญิงที่จ่ายเท่ากันกับผู้ชายจะต้องมีคุณสมบัติสูงกว่า แต่เมื่อตรวจสอบแล้วก็พบว่าถึงแม้ว่าผลลัพธ์จะ 'สำคัญ' เมื่อ ประเมินวิธีการหนึ่งพวกเขาไม่ 'สำคัญ' เมื่อตรวจสอบวิธีอื่นซึ่งทำให้ทุกคนที่เกี่ยวข้องในการ tizzy ดูที่นี่ สำหรับกระดาษที่มีชื่อเสียงที่พยายามจะทำให้ปัญหาชัดเจนขึ้น
(อัปเดตมากในภายหลัง) นี่เป็นอีกวิธีหนึ่งในการคิดเกี่ยวกับสิ่งนี้ที่เข้าใกล้หัวข้อผ่านทางสูตรแทนที่จะมองเห็น:
สูตรสำหรับความชันของเส้นการถดถอยแบบง่าย ๆ เป็นผลมาจากฟังก์ชั่นการสูญเสียที่ถูกนำมาใช้ หากคุณใช้ฟังก์ชั่นการสูญเสียกำลังสองมาตรฐานแบบธรรมดา (ตามที่ระบุไว้ด้านบน) คุณสามารถได้รับสูตรสำหรับความชันที่คุณเห็นในทุกตำราแนะนำ สูตรนี้สามารถนำเสนอในรูปแบบต่าง ๆ ; หนึ่งในนั้นที่ฉันเรียกว่าสูตร 'หยั่งรู้' สำหรับความชัน พิจารณาแบบฟอร์มนี้สำหรับทั้งสถานการณ์ที่คุณกำลังถดถอยบนและที่ที่คุณกำลังถดถอยบน :
yxxy
β^1=Cov(x,y)Var(x)y on x β^1=Cov(y,x)Var(y)x on y
ตอนนี้ผมหวังว่ามันจะเห็นได้ชัดว่าสิ่งเหล่านี้จะไม่เหมือนกันเว้นแต่เท่ากับ(y) หากแปรปรวน
มีความเท่าเทียมกัน (เช่นเพราะคุณมาตรฐานตัวแปรแรก) แล้วเพื่อให้มีค่าเบี่ยงเบนมาตรฐานและทำให้ความแปรปรวนทั้งสองจะยังเท่ากับ(y) ในกรณีนี้จะเท่ากับ Pearson'sซึ่งเป็นวิธีเดียวกันโดยอาศัย
หลักการของ commutativity :
Var(x)Var(y)SD(x)SD(y)β^1rr=Cov(x,y)SD(x)SD(y)correlating x with y r=Cov(y,x)SD(y)SD(x)correlating y with x