ค่าเฉลี่ยความสัมพันธ์


20

สมมุติว่าฉันทดสอบว่าตัวแปรYขึ้นอยู่กับตัวแปรอย่างไรXภายใต้เงื่อนไขการทดลองที่แตกต่างกันและรับกราฟต่อไปนี้:

ป้อนคำอธิบายรูปภาพที่นี่

เส้นประในกราฟด้านบนแสดงการถดถอยเชิงเส้นสำหรับชุดข้อมูลแต่ละชุด (การตั้งค่าการทดลอง) และตัวเลขในตำนานแสดงถึงสหสัมพันธ์ของเพียร์สันของชุดข้อมูลแต่ละชุด

ผมอยากจะคำนวณ "ความสัมพันธ์เฉลี่ย" (หรือ "หมายถึงความสัมพันธ์") ระหว่างและX Yฉันขอเฉลี่ยrค่าได้ไหม สิ่งที่เกี่ยวกับ "การกำหนดเกณฑ์ค่าเฉลี่ย", ? ฉันควรจะคำนวณค่าเฉลี่ยและกว่าจะใช้ตารางของค่าว่าหรือฉันควรคำนวณค่าเฉลี่ยของแต่ละ 's?R 2R2rR2

คำตอบ:


15

วิธีง่ายๆคือการเพิ่มตัวแปรเด็ดขาดเพื่อระบุเงื่อนไขการทดลองที่แตกต่างกันและรวมไว้ในแบบจำลองของคุณพร้อมกับ "การโต้ตอบ" กับx ; นั่นคือY ~ Z + x # Z สิ่งนี้ดำเนินการถดถอยทั้งห้าพร้อมกัน มันคือR 2คือสิ่งที่คุณต้องการZxY~Z+x#ZR2

หากต้องการดูว่าทำไมค่าเฉลี่ยแต่ละค่าอาจไม่ถูกต้องสมมติว่าทิศทางของความลาดชันกลับด้านในเงื่อนไขการทดลองบางอย่าง คุณจะเฉลี่ย 1 และ 1 ออกมาประมาณ 0 ซึ่งจะไม่สะท้อนถึงคุณภาพที่เหมาะสม เพื่อดูว่าทำไมค่าเฉลี่ยR 2 (หรือการแปลงคงที่) ไม่ถูกต้องสมมติว่าในเงื่อนไขการทดลองส่วนใหญ่คุณมีการสังเกตเพียงสองครั้งเพื่อให้R 2ของพวกเขาทั้งหมดเท่ากับ1แต่ในการทดลองหนึ่งครั้งคุณมีการสังเกตร้อยด้วยR 2 = 0 ค่าเฉลี่ยR 2ของเกือบ 1 จะไม่สะท้อนสถานการณ์อย่างถูกต้องRR2R21R2=0R2


1
ให้อภัยความไม่รู้ของฉัน แต่ # เครื่องหมายในคำตอบของคุณหมายถึงอะไร
Boris Gorelik

1
ฉันคิดว่าคำตอบของคุณดีมากสำหรับคำนิยามโดยนัยของความสัมพันธ์ที่ใช้ เกิดอะไรขึ้นถ้าพวกเขาหมายถึงว่ามันเป็นค่าเฉลี่ยความชันมาตรฐาน ในกรณีนี้คุณต้องการให้ฟิล์มเนกาทีฟและผลบวกเป็นลบ คุณตายไปแล้วเกี่ยวกับปัญหาขนาดตัวอย่าง ลองพิจารณาความคิดเห็นของคุณเป็นคำตอบ
จอห์น

คุณต้องการหรือปรับR 2 ? R2R2
russellpierce

@whuber ในความคิดเห็นเริ่มต้นของคุณนั่นหมายความว่าคุณอาจมีความสัมพันธ์เป็น ; R 2ในแต่ละกรณีคือ1 (ฉันรู้ว่านี่เป็นเพียงปัญหาการพิมพ์หรือการแก้ไขมันไม่เปลี่ยนจุดของคุณ แต่มันอาจทำให้เข้าใจผิด)±1R21
Glen_b

R2R21

24

สำหรับค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันเป็นเรื่องที่เหมาะสมในการแปลงค่าrโดยใช้การแปลงFisher z จากนั้นหาค่าเฉลี่ยz -value แล้วแปลงค่าเฉลี่ยกลับเป็นค่าr

ฉันคิดว่าคงเป็นเรื่องดีสำหรับสัมประสิทธิ์ Spearman เช่นกัน

นี่คือกระดาษและวิกิพีเดียรายการ


1
+1; คำตอบนี้ดูเหมือนจะเหมาะสมและทั่วไปมากกว่าคำตอบที่ยอมรับได้ แต่ในกรณีการใช้งานเฉพาะนั้นจะไม่ตกอยู่กับค่า r 1 หรือไม่? อะไรที่เหมือนกับ logit เชิงอารมณ์ที่นี่ตรงนี้ใครจะ "เพิ่ม" ดาต้าพอยน์ที่ขาดความสัมพันธ์กัน? ถ้าเป็นเช่นนั้นจะเพิ่มที่ไหน เราจะต้องดำเนินการ monte carlo ซิมสองตัวแปรสุ่มจากการกระจายแหล่งที่มา? อีกวิธีหนึ่งก็แค่ปรับ r ให้ค่าบางค่าน้อยกว่า 1 เล็กน้อย คนเราควรปรับให้ไกลแค่ไหน?
russellpierce

3

ค่าเฉลี่ยความสัมพันธ์อาจเป็นความหมาย พิจารณาการกระจายตัวของสหสัมพันธ์ (เช่นพล็อตฮิสโตแกรม)

n

ม.


1

สิ่งที่เกี่ยวกับการใช้ eror ที่คาดการณ์กำลังสอง (MSPE) สำหรับประสิทธิภาพของอัลกอริทึม นี่เป็นวิธีการมาตรฐานกับสิ่งที่คุณพยายามทำหากคุณพยายามเปรียบเทียบประสิทธิภาพการทำนายระหว่างชุดอัลกอริทึม


ฉันไม่แน่ใจว่าทำไมการโพสต์stats.stackexchange.com/questions/17129/นี้ถูกรวมเข้ากับสิ่งนี้ พวกเขากำลังถามคำถามสองข้อที่แตกต่างกันในความคิดของฉัน - มีสองเป้าหมายที่แตกต่างกัน
StatsStudent

1
คุณถูกต้อง: พวกเขาเป็นคำถามที่แตกต่างกัน ฉันลงคะแนนให้เปิดโพสต์อื่นอีกครั้ง (แม้ว่าลักษณะพิเศษที่อาจไม่ชัดเจน) ฉันขอโทษที่ไม่เห็นความคิดเห็นของคุณ: หากคุณติดธงแทนโพสต์นั้นจะทำให้เราได้รับความสนใจเป็นเวลาหลายปีเร็วกว่านี้!
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.