มีความแตกต่างระหว่าง


22

ค่าสัมประสิทธิ์สหสัมพันธ์มักเขียนด้วยทุนแต่บางครั้งก็ไม่ ฉันสงสัยว่ามีความแตกต่างระหว่างr 2และR 2หรือไม่? Can Rหมายถึงสิ่งอื่นมากกว่าค่าสัมประสิทธิ์สหสัมพันธ์หรือไม่?Rr2R2r


8
ฉันประหลาดใจที่คำถามนี้ถูกลดระดับลง - มีความชัดเจนและระบุชัดเจนและครอบคลุมถึงปัญหาที่คำศัพท์ใช้ในรูปแบบที่ไม่สอดคล้องกัน ที่แย่กว่านั้นเพราะมันเป็นกรณี ๆ ไปมันเป็นเรื่องยากที่จะค้นหาคำอธิบาย! นอกเหนือจากความจริงที่ว่าสามารถใช้สำหรับสองสิ่งที่แตกต่างกันค่อนข้างสถานการณ์จะยิ่งเลวร้ายลงเมื่อเราพิจารณารูปแบบโดยไม่ต้องตัดข้อตกลงเมื่อR 2 , ค่าสัมประสิทธิ์การตัดสินใจที่ไม่ได้เช่นเดียวกับตารางของR มันไม่แปลกใจที่คนหมวกสามารถค้นหาสัญกรณ์ที่สับสน rR2R
Silverfish

คำตอบ:


18

สัญกรณ์ในเรื่องนี้ดูเหมือนจะแตกต่างกันเล็กน้อย

ถูกใช้ในบริบทของความสัมพันธ์หลายอย่างและเรียกว่า "สัมประสิทธิ์สหสัมพันธ์" มันเป็นความสัมพันธ์ระหว่างการตอบสนองสังเกต Yและ Yติดตั้งโดยรูปแบบ Yเป็นที่คาดการณ์โดยทั่วไปจากตัวแปรหลาย X ฉันเช่น Y = β 0 + β 1 X 1 + β 2 X 2ที่ตัดและลาดค่าสัมประสิทธิ์เบต้าฉันได้รับการประเมินจากข้อมูล โปรดทราบว่า 0RYY^Y^XiY^=β^0+β^1X1+β^2X2β^i 10R1

สัญลักษณ์คือ "สัมประสิทธิ์สหสัมพันธ์ตัวอย่าง" ที่ใช้ในกรณี bivariate - นั่นคือมีสองตัวแปรXและY - และมันมักจะหมายถึงความสัมพันธ์ระหว่างXและYในตัวอย่างของคุณ คุณสามารถรักษานี้เป็นประมาณการของความสัมพันธ์ที่ρระหว่างสองตัวแปรในประชากรที่กว้างขึ้น ในการเชื่อมโยงตัวแปรสองตัวไม่จำเป็นต้องระบุว่าตัวใดเป็นตัวทำนาย แน่นอนถ้าคุณพบความสัมพันธ์ระหว่างYและXมันจะเหมือนกับความสัมพันธ์ระหว่างXและYเพราะความสัมพันธ์นั้นเป็นสมมาตรrXYXYρYXXY. โปรดทราบว่าเมื่อใช้สัญลักษณ์rด้วยวิธีนี้โดยที่r < 0 (ค่าสหสัมพันธ์เชิงลบ) หากตัวแปรทั้งสองมีความสัมพันธ์เชิงเส้นลดลงเชิงเส้นตรง (เมื่อคนหนึ่งขึ้นไปอีกคนหนึ่งมักจะลงไป)1r1rr<0

ที่สัญกรณ์กลายเป็นไม่สอดคล้องกันคือเมื่อมีสองตัวแปรและYและดำเนินการถดถอยเชิงเส้นอย่างง่าย ที่นี้หมายถึงการระบุหนึ่งตัวแปรYเป็นตัวแปรตอบสนองและอื่น ๆ , Xเป็นตัวแปรทำนายและกระชับรูปแบบY = β 0 + β 1 X บางคนยังใช้สัญลักษณ์Rเพื่อแสดงให้เห็นความสัมพันธ์ระหว่างYและYในขณะที่คนอื่น ๆ (สำหรับความสอดคล้องกับการถดถอยหลาย) เขียนRXYYXY^=β^0+β^1XrYY^R. โปรดทราบว่าความสัมพันธ์ระหว่างการตอบสนองแบบสังเกตและแบบติดตั้งจำเป็นต้องมากกว่าหรือเท่ากับศูนย์ นี่คือเหตุผลหนึ่งที่ผมไม่ชอบการใช้สัญลักษณ์ในกรณีนี้ความสัมพันธ์ระหว่างXและYอาจจะลบในขณะที่ความสัมพันธ์ระหว่างYและYเป็นบวก (ในความเป็นจริงมันก็จะเป็นโมดูลัสของ ความสัมพันธ์ระหว่างXและY ) ทั้งยังอาจจะมีการเขียนด้วยสัญลักษณ์R ฉันได้เห็นตำราบางเล่มและบทความใน Wikipedia ให้เปลี่ยนสลับกันระหว่างความหมายสองประการของrและพบว่ามันทำให้เกิดความสับสนโดยไม่จำเป็น ฉันชอบใช้สัญลักษณ์RrXYYY^XYrrRสำหรับความสัมพันธ์ระหว่างและYทั้งในการถดถอยเดียวและหลายYY^

ในทั้งง่ายและ regresion ต่างๆจากนั้นตราบใดที่มีเป็นระยะตัดติดตั้งในรูปแบบที่ระหว่างYและYเป็นเพียงรากที่สองของค่าสัมประสิทธิ์การตัดสินใจR 2RYY^R2 (มักเรียกว่า "สัดส่วนของความแปรปรวนอธิบาย" หรือ ที่คล้ายกัน) ในกรณีของการถดถอยเชิงเส้นอย่างง่ายโดยเฉพาะแล้วR2=r2ที่ฉันเขียนสำหรับสหสัมพันธ์ระหว่างXและYและR 2สามารถแทนค่าสัมประสิทธิ์การตัดสินใจของการถดถอยหรือกำลังสองของความสัมพันธ์ระหว่างrXYR2และY ตั้งแต่ - 1 r 1และ 0 R 1นี่หมายความว่า R = | r | . ดังนั้นสำหรับตัวอย่างเช่นถ้าคุณได้รับความสัมพันธ์ระหว่าง Xและ Yของ R = - 0.7แล้วความสัมพันธ์ระหว่าง Yและติดตั้ง Yจากง่ายเชิงเส้นถดถอย Y = β 0 + β 1 XYY^1r10R1R=|r|XYr=0.7YY^Y=β^0+β^1Xจะเป็นและค่าสัมประสิทธิ์การตัดสินใจจะเป็นR 2 = 0.49นั่นคือเกือบครึ่งหนึ่งของการเปลี่ยนแปลงในการตอบสนองจะอธิบายโดยแบบจำลองของคุณR=0.7R2=0.49

หากไม่มีการรวมคำดักจับในโมเดลดังนั้นสัญลักษณ์จะคลุมเครือ โดยปกติจะใช้เป็นค่าสัมประสิทธิ์การตัดสินใจ แต่โดยทั่วไปจะคำนวณในแบบที่ต่างออกไปตามปกติดังนั้นโปรดระมัดระวังเมื่ออ่านผลลัพธ์จากซอฟต์แวร์ทางสถิติของคุณ จากนั้นมันจะไม่เหมือนกับสี่เหลี่ยมจัตุรัสของสหสัมพันธ์rและในกรณี bivariate จะเท่ากับr 2 !R2Rr2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.