ฉันคาดว่าค่าสัมประสิทธิ์สหสัมพันธ์จะเหมือนกับความชันถดถอย (เบต้า) แต่เมื่อเปรียบเทียบกับทั้งสองมันต่างกัน พวกเขาต่างกันอย่างไร - พวกเขาให้ข้อมูลที่แตกต่างกันอย่างไร
ฉันคาดว่าค่าสัมประสิทธิ์สหสัมพันธ์จะเหมือนกับความชันถดถอย (เบต้า) แต่เมื่อเปรียบเทียบกับทั้งสองมันต่างกัน พวกเขาต่างกันอย่างไร - พวกเขาให้ข้อมูลที่แตกต่างกันอย่างไร
คำตอบ:
สมมติว่าคุณกำลังพูดถึงรูปแบบการถดถอยง่ายประมาณโดยสี่เหลี่ยมอย่างน้อยเรารู้จากวิกิพีเดียว่าเบต้า = C o R ( Y ฉัน , X ฉัน ) ⋅ S D ( Y ฉัน )
ทั้งสองในความรู้สึกบางให้ข้อมูลเดียวกัน - พวกเขาแต่ละคนบอกคุณความแข็งแรงของเส้นตรงความสัมพันธ์ระหว่างและYฉัน แต่พวกเขาแต่ละคนจะให้ข้อมูลที่แตกต่าง (ยกเว้นแน่นอนเมื่อพวกเขาเหมือนกันทุกประการ):
ความสัมพันธ์ช่วยให้คุณมีขอบเขตการวัดที่สามารถตีความได้อย่างอิสระจากสเกลของตัวแปรทั้งสอง ใกล้ชิดความสัมพันธ์ประมาณคือการ , ใกล้ชิดทั้งสองจะมีความสัมพันธ์เชิงเส้นที่สมบูรณ์แบบ การแยกความชันแบบแยกส่วนไม่ได้บอกข้อมูลชิ้นนั้นกับคุณ
ความลาดชันการถดถอยให้ปริมาณประโยชน์ตีความได้ว่าการเปลี่ยนแปลงประมาณมูลค่าที่คาดหวังของสำหรับค่ากำหนดของXฉัน โดยเฉพาะ βบอกคุณเปลี่ยนแปลงมูลค่าที่คาดหวังของY ฉันสอดคล้องกับการเพิ่มขึ้น 1 หน่วยในXฉัน ข้อมูลนี้ไม่สามารถอนุมานได้จากค่าสัมประสิทธิ์สหสัมพันธ์เพียงอย่างเดียว
ค่าสัมประสิทธิ์สหสัมพันธ์มาตรการ"ตึง"ของความสัมพันธ์เชิงเส้นตรงระหว่างสองตัวแปรและมีขอบเขตระหว่าง -1 และ 1, รวม ความสัมพันธ์ใกล้กับศูนย์แสดงว่าไม่มีการเชื่อมโยงเชิงเส้นระหว่างตัวแปรในขณะที่ความสัมพันธ์ใกล้เคียงกับ -1 หรือ +1 บ่งบอกถึงความสัมพันธ์เชิงเส้นที่แข็งแกร่ง โดยสัญชาตญาณยิ่งง่ายขึ้นสำหรับคุณที่จะวาดเส้นที่ดีที่สุดผ่านสแกตเตอร์ล็อตยิ่งมีความสัมพันธ์มากขึ้น
ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์และความชันการถดถอยจะต้องมีเครื่องหมายเดียวกัน (+ หรือ -) แต่แทบจะไม่เคยมีค่าเท่ากัน
สำหรับความเรียบง่ายคำตอบนี้ถือว่าการถดถอยเชิงเส้นอย่างง่าย
สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันนั้นมีขนาดและไร้มิติระหว่าง -1 ถึง 1 โดยไม่คำนึงถึงมิติและขนาดของตัวแปรอินพุต
การสาธิตอย่างง่าย (ขอโทษที่ใช้ Python!):
import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]