สหสัมพันธ์หรือสัมประสิทธิ์การตัดสินใจเกี่ยวข้องกับเปอร์เซ็นต์ของค่าที่ตกไปตามเส้นการถดถอยหรือไม่?


12

สหสัมพันธ์, , เป็นการวัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ค่าสัมประสิทธิ์ของการตัดสินใจเป็นการวัดความแปรปรวนในตัวแปรหนึ่งที่สามารถอธิบาย "การเปลี่ยนแปลง" ในอีกตัวแปรหนึ่งrr2

ตัวอย่างเช่นถ้าความสัมพันธ์ระหว่างสองตัวแปรแล้ว0.64 ดังนั้น 64% ของความแปรปรวนในหนึ่งสามารถอธิบายได้ด้วยความแตกต่างในอีก ขวา?r 2 = 0.64r=0.8r2=0.64

คำถามของฉันสำหรับตัวอย่างที่ระบุไว้ข้อความใดข้อความหนึ่งต่อไปนี้ถูกต้อง?

  1. 64% ของค่าอยู่ในแนวเส้นถดถอย
  2. 80% ของค่าอยู่ในแนวเส้นถดถอย

คำว่า "ตกลงมา" นั้นไม่ชัดเจน ปรากฏว่าอย่างน้อยคำตอบบางอย่างตีความว่าเป็น "วางตรง" และมีคำตอบไม่ชัดเจน (แม้ว่าความคิดนั้นจะนำไปสู่การวัดที่น่าสนใจของการเชื่อมโยงเชิงเส้นที่อาจเหมาะสมในบางสถานการณ์ - เช่นเมื่อมี เป็นส่วนผสมของไม่มีเสียงรบกวน / ข้อผิดพลาดใด ๆ ของเวลาและข้อผิดพลาดบางครั้งบางครั้งเช่นเดียวกับกระบวนการปนเปื้อน - และจากนั้นคุณจะประมาณสัดส่วนของข้อมูลที่ไม่มีการปนเปื้อน) หากคุณหมายถึงสิ่งอื่นที่ไม่ใช่ "วางตรงทั้งหมด" คุณจะต้องระบุความหมายนั้น
Glen_b -Reinstate Monica

คำตอบ:


8

ส่วนแรกของเรื่องนี้ถูกต้องโดยทั่วไป - แต่มันเป็น 64% ของการเปลี่ยนแปลงที่อธิบายโดยรุ่น ในการถดถอยเชิงเส้นอย่างง่าย: Y ~ X หากคือ. 64 นั่นหมายความว่าการเปลี่ยนแปลงใน Y 64% นั้นถูกกำหนดโดยความสัมพันธ์เชิงเส้นระหว่าง Y และ X เป็นไปได้ที่จะมีความสัมพันธ์ที่แข็งแกร่งกับต่ำมากถ้าความสัมพันธ์นั้นไม่เป็นเชิงเส้นอย่างยิ่งR 2R2R2

เกี่ยวกับคำถามที่มีหมายเลขสองข้อของคุณไม่ถูกต้อง อันที่จริงก็เป็นไปได้ว่าจะไม่มีการจุดอาจอยู่ตรงบนเส้นถดถอย นั่นไม่ใช่สิ่งที่ถูกวัด ค่อนข้างเป็นคำถามที่ว่าจุดเฉลี่ยอยู่ใกล้กับเส้นตรงมากแค่ไหน หากจุดทั้งหมดหรือเกือบทั้งหมดอยู่ใกล้ (แม้ว่าจะไม่มีเส้นใดตรงเลย) ดังนั้นจะสูง หากคะแนนส่วนใหญ่อยู่ไกลจากเส้นจะต่ำ หากคะแนนส่วนใหญ่อยู่ใกล้ แต่ไม่มากนักการถดถอยนั้นไม่ถูกต้อง (ปัญหาค่าผิดปกติ) สิ่งอื่น ๆ อาจผิดพลาดได้เช่นกันR 2R2R2

นอกจากนี้ฉันออกจากความคิดของ "ไกล" ค่อนข้างคลุมเครือ สิ่งนี้จะขึ้นอยู่กับการกระจายของ X ออกไป ทำให้ความคิดเหล่านี้แม่นยำเป็นส่วนหนึ่งของสิ่งที่คุณเรียนรู้ในหลักสูตรการถดถอย ฉันจะไม่เข้าไปที่นี่


ดีที่ล้างขึ้นมากสำหรับฉัน! ขอบคุณ Mimshot และ Peter Flom! ขอบคุณทั้งคุณมาก! :)
Bradex

1
+1, คำตอบที่ดี, คุณจะคิดเพิ่มบางสิ่งเช่น "แน่นอน, [เป็นไปได้ว่า] ไม่มีจุดใดที่อาจโกหก ... " นอกจากนี้มันอาจคุ้มค่าที่จะพูดคุยกันว่าแนวคิดของคะแนนจากบรรทัดนั้นสัมพันธ์กับการกระจายของ X ออกไปมากน้อยเพียงใด
gung - Reinstate Monica

15

คุณถูกต้องกับส่วนแรกของคำสั่งของคุณ วิธีการทั่วไปของการตีความสัมประสิทธิ์การตัดสินใจคือเปอร์เซ็นต์ของการแปรผันของตัวแปรตาม ( ) ที่เราสามารถอธิบายได้ด้วยตัวแปรอธิบาย การตีความและการสืบทอดที่แท้จริงของสัมประสิทธิ์การตัดสินใจสามารถพบได้ที่นี่ y V a r ( y ) R 2R2yVar(y)R2

http://economictheoryblog.com/2014/11/05/the-coefficient-of-determination-latex-r2/

อย่างไรก็ตามการตีความที่รู้จักกันในทางที่น้อยกว่าของค่าสัมประสิทธิ์การตัดสินใจคือการตีความว่ามันเป็นเป็นค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน Squared ระหว่างค่าสังเกตและค่าติดตั้ง{i} หลักฐานที่แสดงว่าค่าสัมประสิทธิ์การตัดสินใจเทียบเท่ากับสัมประสิทธิ์สหสัมพันธ์ Squared Pearson ระหว่างค่าที่สังเกตได้และค่าติดตั้งสามารถพบได้ที่นี่ปีผมYฉัน Y ฉันYฉันR2yiy^iyiy^i

http://economictheoryblog.com/2014/11/05/proof/

ในมุมมองของฉันเหล่านี้เป็นวิธีเดียวที่มีความหมายแปลความหมายของค่าสัมประสิทธิ์การตัดสินใจ{2} มันตามที่สองงบที่คุณทำไม่ได้จะมาจาก{2}R 2R2R2


2
ฉันไม่แน่ใจว่ามีเพียงสองวิธีในการตีความ ( มีแน่นอนมากกว่าสองวิธีในการตีความ ) แต่เหตุผลที่ตามมาว่าทั้งสองข้อความที่ให้มาไม่สามารถได้มาจากนั่นคือ false (สำหรับเหตุผล @PeterFlom อธิบาย) แทนที่จะไม่มีการตีความอื่น ๆ ที่เป็นไปได้ แต่ฉันคิดว่าอย่างอื่นนี่เป็นคำตอบที่ดี r R 2R2rR2
Silverfish

2
ในกรณีที่การเชื่อมโยงที่กำหนดให้ตายในบางจุดในอนาคต (linkrot เป็นปัญหานิรันดร์ - เราต้องการคำตอบในตัวเองถ้าเป็นไปได้ แต่ชัดเจนว่าคำถามนี้ไม่ได้เรียกร้องการพิสูจน์อย่างเต็มรูปแบบดังนั้นการเชื่อมโยงเป็นประโยชน์) การรายงานข่าวของความสัมพันธ์ระหว่างและ , ที่นี่ , ที่นี่ , ที่นี่และอื่น ๆ อีกมากมายเรขาคณิตที่นี่ R 2Corr(y,y^)R2
Silverfish

2

Niether 1 หรือ 2 ถูกต้อง

สมมติว่าคุณกำลังพยายามทำนายชุดของค่าจากชุดของค่าโดยใช้การถดถอยเชิงเส้น แบบจำลองของคุณคือxyyxx

yi=b+mxi+ϵi

โดยที่มีเสียงดัง หมายความว่าสามารถอธิบายความแปรปรวนของได้64% โดยความแปรปรวนในภายใต้โมเดลของคุณ ความแปรปรวนที่เหลือ ( เช่นความแปรปรวนที่ไม่ได้อธิบาย) คือ 0.36 นั่นคือถ้า:R 2 = .64 y xϵiN(0,σ2)R2=.64yx

y^i=b+mxi

แล้วก็

10.64=0.36=var(yyy^y^)var(yy)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.