ค่าสัมประสิทธิ์สหสัมพันธ์มักเขียนด้วยทุนแต่บางครั้งก็ไม่ ฉันสงสัยว่ามีความแตกต่างระหว่างr 2และR 2หรือไม่? Can Rหมายถึงสิ่งอื่นมากกว่าค่าสัมประสิทธิ์สหสัมพันธ์หรือไม่?
ค่าสัมประสิทธิ์สหสัมพันธ์มักเขียนด้วยทุนแต่บางครั้งก็ไม่ ฉันสงสัยว่ามีความแตกต่างระหว่างr 2และR 2หรือไม่? Can Rหมายถึงสิ่งอื่นมากกว่าค่าสัมประสิทธิ์สหสัมพันธ์หรือไม่?
คำตอบ:
สัญกรณ์ในเรื่องนี้ดูเหมือนจะแตกต่างกันเล็กน้อย
ถูกใช้ในบริบทของความสัมพันธ์หลายอย่างและเรียกว่า "สัมประสิทธิ์สหสัมพันธ์" มันเป็นความสัมพันธ์ระหว่างการตอบสนองสังเกต Yและ Yติดตั้งโดยรูปแบบ Yเป็นที่คาดการณ์โดยทั่วไปจากตัวแปรหลาย X ฉันเช่น Y = β 0 + β 1 X 1 + β 2 X 2ที่ตัดและลาดค่าสัมประสิทธิ์เบต้าฉันได้รับการประเมินจากข้อมูล โปรดทราบว่า 0 1
สัญลักษณ์คือ "สัมประสิทธิ์สหสัมพันธ์ตัวอย่าง" ที่ใช้ในกรณี bivariate - นั่นคือมีสองตัวแปรXและY - และมันมักจะหมายถึงความสัมพันธ์ระหว่างXและYในตัวอย่างของคุณ คุณสามารถรักษานี้เป็นประมาณการของความสัมพันธ์ที่ρระหว่างสองตัวแปรในประชากรที่กว้างขึ้น ในการเชื่อมโยงตัวแปรสองตัวไม่จำเป็นต้องระบุว่าตัวใดเป็นตัวทำนาย แน่นอนถ้าคุณพบความสัมพันธ์ระหว่างYและXมันจะเหมือนกับความสัมพันธ์ระหว่างXและYเพราะความสัมพันธ์นั้นเป็นสมมาตร. โปรดทราบว่าเมื่อใช้สัญลักษณ์rด้วยวิธีนี้โดยที่r < 0 (ค่าสหสัมพันธ์เชิงลบ) หากตัวแปรทั้งสองมีความสัมพันธ์เชิงเส้นลดลงเชิงเส้นตรง (เมื่อคนหนึ่งขึ้นไปอีกคนหนึ่งมักจะลงไป)
ที่สัญกรณ์กลายเป็นไม่สอดคล้องกันคือเมื่อมีสองตัวแปรและYและดำเนินการถดถอยเชิงเส้นอย่างง่าย ที่นี้หมายถึงการระบุหนึ่งตัวแปรYเป็นตัวแปรตอบสนองและอื่น ๆ , Xเป็นตัวแปรทำนายและกระชับรูปแบบY = β 0 + β 1 X บางคนยังใช้สัญลักษณ์Rเพื่อแสดงให้เห็นความสัมพันธ์ระหว่างYและYในขณะที่คนอื่น ๆ (สำหรับความสอดคล้องกับการถดถอยหลาย) เขียนR. โปรดทราบว่าความสัมพันธ์ระหว่างการตอบสนองแบบสังเกตและแบบติดตั้งจำเป็นต้องมากกว่าหรือเท่ากับศูนย์ นี่คือเหตุผลหนึ่งที่ผมไม่ชอบการใช้สัญลักษณ์ในกรณีนี้ความสัมพันธ์ระหว่างXและYอาจจะลบในขณะที่ความสัมพันธ์ระหว่างYและYเป็นบวก (ในความเป็นจริงมันก็จะเป็นโมดูลัสของ ความสัมพันธ์ระหว่างXและY ) ทั้งยังอาจจะมีการเขียนด้วยสัญลักษณ์R ฉันได้เห็นตำราบางเล่มและบทความใน Wikipedia ให้เปลี่ยนสลับกันระหว่างความหมายสองประการของrและพบว่ามันทำให้เกิดความสับสนโดยไม่จำเป็น ฉันชอบใช้สัญลักษณ์Rสำหรับความสัมพันธ์ระหว่างและYทั้งในการถดถอยเดียวและหลาย
ในทั้งง่ายและ regresion ต่างๆจากนั้นตราบใดที่มีเป็นระยะตัดติดตั้งในรูปแบบที่ระหว่างYและYเป็นเพียงรากที่สองของค่าสัมประสิทธิ์การตัดสินใจR 2 (มักเรียกว่า "สัดส่วนของความแปรปรวนอธิบาย" หรือ ที่คล้ายกัน) ในกรณีของการถดถอยเชิงเส้นอย่างง่ายโดยเฉพาะแล้วที่ฉันเขียนสำหรับสหสัมพันธ์ระหว่างXและYและR 2สามารถแทนค่าสัมประสิทธิ์การตัดสินใจของการถดถอยหรือกำลังสองของความสัมพันธ์ระหว่างและY ตั้งแต่ - 1 ≤ r ≤ 1และ 0 ≤ R ≤ 1นี่หมายความว่า R = | r | . ดังนั้นสำหรับตัวอย่างเช่นถ้าคุณได้รับความสัมพันธ์ระหว่าง Xและ Yของ R = - 0.7แล้วความสัมพันธ์ระหว่าง Yและติดตั้ง Yจากง่ายเชิงเส้นถดถอย Y = β 0 + β 1 Xจะเป็นและค่าสัมประสิทธิ์การตัดสินใจจะเป็นR 2 = 0.49นั่นคือเกือบครึ่งหนึ่งของการเปลี่ยนแปลงในการตอบสนองจะอธิบายโดยแบบจำลองของคุณ
หากไม่มีการรวมคำดักจับในโมเดลดังนั้นสัญลักษณ์จะคลุมเครือ โดยปกติจะใช้เป็นค่าสัมประสิทธิ์การตัดสินใจ แต่โดยทั่วไปจะคำนวณในแบบที่ต่างออกไปตามปกติดังนั้นโปรดระมัดระวังเมื่ออ่านผลลัพธ์จากซอฟต์แวร์ทางสถิติของคุณ จากนั้นมันจะไม่เหมือนกับสี่เหลี่ยมจัตุรัสของสหสัมพันธ์rและในกรณี bivariate จะเท่ากับr 2 !