สัมประสิทธิ์สหสัมพันธ์ต่างจากความชันถดถอยอย่างไร


69

ฉันคาดว่าค่าสัมประสิทธิ์สหสัมพันธ์จะเหมือนกับความชันถดถอย (เบต้า) แต่เมื่อเปรียบเทียบกับทั้งสองมันต่างกัน พวกเขาต่างกันอย่างไร - พวกเขาให้ข้อมูลที่แตกต่างกันอย่างไร


3
หากพวกเขาเป็นปกติพวกเขาจะเหมือนกัน แต่คิดว่าสิ่งที่เกิดขึ้นเมื่อคุณทำการเปลี่ยนแปลงของหน่วย ...
นิโคลัส

ฉันคิดว่าคำตอบที่ให้คะแนนสูงสุดสำหรับคำถามนี้ (และอาจเป็น A ของฉันซึ่งฉันแสดงให้เห็นว่าสัมประสิทธิ์สหสัมพันธ์สามารถมองเห็นได้ว่าเป็นค่าสัมบูรณ์ของค่าเฉลี่ยทางเรขาคณิตของเนินเขาทั้งสองที่เราได้รับถ้าเราถดถอย y บน x และ x y ตามลำดับ) มีความเกี่ยวข้องที่นี่ด้วย
statmerkur

คำตอบ:


82

สมมติว่าคุณกำลังพูดถึงรูปแบบการถดถอยง่ายประมาณโดยสี่เหลี่ยมอย่างน้อยเรารู้จากวิกิพีเดียว่าเบต้า = C o R ( Y ฉัน , X ฉัน ) S D ( Y ฉัน )

Yi=α+βXi+εi
ดังนั้นทั้งสองเท่านั้นตรงเมื่อSD(Yฉัน)=SD(Xฉัน) นั่นคือพวกเขาเกิดขึ้นเฉพาะเมื่อตัวแปรทั้งสองอยู่ในระดับเดียวกันในบางแง่ วิธีที่พบได้บ่อยที่สุดคือการสร้างมาตรฐานตามที่ระบุโดย @gung
β^=cor(Yi,Xi)SD(Yi)SD(Xi)
SD(Yi)=SD(Xi)

ทั้งสองในความรู้สึกบางให้ข้อมูลเดียวกัน - พวกเขาแต่ละคนบอกคุณความแข็งแรงของเส้นตรงความสัมพันธ์ระหว่างและYฉัน แต่พวกเขาแต่ละคนจะให้ข้อมูลที่แตกต่าง (ยกเว้นแน่นอนเมื่อพวกเขาเหมือนกันทุกประการ):XiYi

  • ความสัมพันธ์ช่วยให้คุณมีขอบเขตการวัดที่สามารถตีความได้อย่างอิสระจากสเกลของตัวแปรทั้งสอง ใกล้ชิดความสัมพันธ์ประมาณคือการ , ใกล้ชิดทั้งสองจะมีความสัมพันธ์เชิงเส้นที่สมบูรณ์แบบ การแยกความชันแบบแยกส่วนไม่ได้บอกข้อมูลชิ้นนั้นกับคุณ±1

  • ความลาดชันการถดถอยให้ปริมาณประโยชน์ตีความได้ว่าการเปลี่ยนแปลงประมาณมูลค่าที่คาดหวังของสำหรับค่ากำหนดของXฉัน โดยเฉพาะ βบอกคุณเปลี่ยนแปลงมูลค่าที่คาดหวังของY ฉันสอดคล้องกับการเพิ่มขึ้น 1 หน่วยในXฉัน ข้อมูลนี้ไม่สามารถอนุมานได้จากค่าสัมประสิทธิ์สหสัมพันธ์เพียงอย่างเดียวYiXiβ^YiXi


ในฐานะที่เป็นข้อพิสูจน์ของคำตอบนี้ให้สังเกตว่าการถดถอย x กับ y ไม่ใช่การย้อนกลับของการถอย y ต่อ x
aginensky


14

ค่าสัมประสิทธิ์สหสัมพันธ์มาตรการ"ตึง"ของความสัมพันธ์เชิงเส้นตรงระหว่างสองตัวแปรและมีขอบเขตระหว่าง -1 และ 1, รวม ความสัมพันธ์ใกล้กับศูนย์แสดงว่าไม่มีการเชื่อมโยงเชิงเส้นระหว่างตัวแปรในขณะที่ความสัมพันธ์ใกล้เคียงกับ -1 หรือ +1 บ่งบอกถึงความสัมพันธ์เชิงเส้นที่แข็งแกร่ง โดยสัญชาตญาณยิ่งง่ายขึ้นสำหรับคุณที่จะวาดเส้นที่ดีที่สุดผ่านสแกตเตอร์ล็อตยิ่งมีความสัมพันธ์มากขึ้น

+

ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์และความชันการถดถอยจะต้องมีเครื่องหมายเดียวกัน (+ หรือ -) แต่แทบจะไม่เคยมีค่าเท่ากัน

สำหรับความเรียบง่ายคำตอบนี้ถือว่าการถดถอยเชิงเส้นอย่างง่าย


inf,inf

1

สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันนั้นมีขนาดและไร้มิติระหว่าง -1 ถึง 1 โดยไม่คำนึงถึงมิติและขนาดของตัวแปรอินพุต

rr

การสาธิตอย่างง่าย (ขอโทษที่ใช้ Python!):

import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]

r=0.969363

r

b=r(σyσx)r

rrσy

x,y

  1. y=3xb=3r=1σx=2.89σy=8.66σyσx=3
  2. r=0.2447σx=2.89σy=34.69b=2.94
  3. y=15xb=15r=1σx=0.58σy=8.66
  4. xb=14.70r=0.2447σx=0.58σy=34.69สหสัมพันธ์และการไล่ระดับสี

rbbr

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.