ทำไมผลิตภัณฑ์ของค่าสัมประสิทธิ์การถดถอยของตัวแปร bivariate ของเส้น -on-และ -on- line เท่ากับกำลังสองของความสัมพันธ์?


11

มีรูปแบบการถดถอยเป็นที่กับและซึ่งมีค่าสัมประสิทธิ์สหสัมพันธ์ของ0.60302Y=a+bXa=1.6b=0.4r=0.60302

ถ้าและจะเปลี่ยนแล้วรอบ ๆ และสมการที่จะกลายเป็นที่และก็ยังมีค่าของ0.60302XYX=c+dYc=0.4545d=0.9091r0.60302

ฉันหวังว่าคนที่สามารถอธิบายได้ว่าทำไมยังเป็น0.60302(d×b)0.50.60302

คำตอบ:


17

b=rSDy/SDxและd=rSDx/SDyดังนั้นb×d=r2 2

ตำราสถิติจำนวนมากจะสัมผัสกับสิ่งนี้; ฉันชอบอิสระ et al.,สถิติ ดูเพิ่มเติมที่นี่และบทความวิกิพีเดียนี้


10

ลองดูที่สิบสามวิธีในการดูค่าสัมประสิทธิ์สหสัมพันธ์ - และโดยเฉพาะอย่างยิ่งวิธีที่ 3, 4, 5 จะเป็นที่สนใจมากที่สุดสำหรับคุณ

  • Rodgers, JL, & Nicewander, WA (1988) สิบสามวิธีในการดูค่าสัมประสิทธิ์สหสัมพันธ์ นักสถิติชาวอเมริกัน, 42, 1 , pp. 59-66

2
นี่น่าจะเป็นความเห็น โปรดทราบว่าลิงก์นั้นตายไปแล้ว ฉันได้อัปเดตลิงก์แล้วและมีการอ้างอิงแบบเต็ม คุณสามารถทำอย่างละเอียดหรือให้ข้อมูลเพิ่มเติมเพื่อให้สิ่งนี้จะยังคงมีค่าแม้ว่าการเชื่อมโยงจะตายอีกครั้ง?
gung - Reinstate Monica

2
Rodgers และ Nicewander บทความสรุปบนเว็บไซต์ของเราที่stats.stackexchange.com/q/70969/22228
whuber

3

จำได้ว่าข้อความเบื้องต้นจำนวนมากกำหนด

Sxy=i=1n(xix¯)(yiy¯)

แล้วตามด้วยการตั้งค่าเป็นเรามีและในทำนองเดียวกัน 2yxSxx=i=1n(xix¯)2Syy=i=1n(yiy¯)2

สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ลาดของ -on-ถดถอย (คุณ ) และความลาดชันของ -on-ถดถอย (คุณ ) มักจะได้รับเป็น:ryb x y dxbxyd

(1)r=SxySxxSyy(2)β^y on x=SxySxx(3)β^x on y=SxySyy

จากนั้นการคูณและให้สแควร์ของอย่างชัดเจน:( 3 ) ( 1 )(2)(3)(1)

β^y on xβ^x on y=Sxy2SxxSyy=r2

อีกวิธีหนึ่งคือตัวเศษและตัวส่วนของเศษส่วนใน ,และมักถูกหารด้วยหรือเพื่อให้สิ่งต่าง ๆ ถูกล้อมกรอบในแง่ของตัวอย่างหรือประมาณค่าความแปรปรวน ตัวอย่างเช่นจากค่าสัมประสิทธิ์สหสัมพันธ์โดยประมาณเป็นเพียงค่าความแปรปรวนร่วมโดยประมาณซึ่งประเมินโดยค่าเบี่ยงเบนมาตรฐานโดยประมาณ:( 2 )(1)(2)(3)n(n1)(1)

(4)r=Corr^(X,Y)=Cov^(X,Y)SD(X)^SD(Y)^(5)β^y on x=Cov^(X,Y)Var(X)^(6)β^x on y=Cov^(X,Y)Var(Y)^

จากนั้นเราจะพบทันทีจากการคูณและว่า(5)(6)

β^y on xβ^x on y=Cov^(X,Y)2Var(X)^Var(Y)^=(Cov^(X,Y)SD(X)^SD(Y)^)2=r2

เราอาจจะจัดเรียงเพื่อเขียนความแปรปรวนร่วมเป็น "ความสัมพันธ์ที่เพิ่มขึ้น":(4)

(7)Cov^(X,Y)=rSD(X)^SD(Y)^

จากนั้นโดยการแทนที่เป็นและเราสามารถเขียนสัมประสิทธิ์การถดถอยเป็นและ(y)} การคูณเหล่านี้เข้าด้วยกันก็จะสร้างและนี่คือวิธีการแก้ปัญหาของ @ Karl การเขียนความลาดชันด้วยวิธีนี้ช่วยอธิบายว่าเราจะเห็นค่าสัมประสิทธิ์สหสัมพันธ์เป็นความชันการถดถอยมาตรฐานได้อย่างไร(7)(5)(6)β^y on x=rSD^(y)SD^(x)β^x on y=rSD^(x)SD^(y)r2


สุดท้ายโปรดทราบว่าในกรณีของคุณแต่นี่เป็นเพราะความสัมพันธ์ของคุณ เป็นบวก หากความสัมพันธ์ของคุณเป็นลบคุณจะต้องลบรากr=bd=β^y on xβ^x on y

จะทำงานออกมาไม่ว่าจะเป็นความสัมพันธ์ของคุณเป็นบวกหรือลบคุณก็ต้องถือว่าเข้าสู่ระบบ (บวกหรือลบ) ค่าสัมประสิทธิ์การถดถอยของคุณ - มันไม่สำคัญว่าคุณมองไปที่ -on-0หรือ -on-เป็นสัญญาณของพวกเขาจะเหมือนกัน ดังนั้นคุณสามารถใช้สูตร:yxxy

r=sgn(β^y on x)β^y on xβ^x on y

โดยที่คือฟังก์ชัน signumคือถ้าความชันเป็นบวกและถ้าความชันเป็นลบsgn+11


1
คุณอาจพบว่าคำตอบของฉันเป็นที่สนใจแม้ว่าจะไม่ได้ตอบคำถามที่ถามอย่างชัดเจน
Dilip Sarwate
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.