มันบ่งบอกอะไรเมื่อความสัมพันธ์ของสเปียร์แมนมีจำนวนที่แน่นอนน้อยกว่าเพียร์สัน?


12

ฉันมีชุดข้อมูลที่เกี่ยวข้องมากมาย ความสัมพันธ์ของแพร์สันระหว่างคู่ของพวกเขามักจะมีขนาดใหญ่กว่าความสัมพันธ์ของสเปียร์แมนแน่นอน นั่นแสดงให้เห็นว่าความสัมพันธ์ใด ๆ นั้นเป็นเส้นตรง แต่ใคร ๆ ก็คาดหวังว่าแม้ว่าจะมีลูกแพร์สันและสเปียร์แมนเหมือนกันก็ตาม มันหมายความว่าอย่างไรเมื่อมีช่องว่างที่ชัดเจนระหว่างเพียร์สันและสหพันธ์สเปียร์แมนกับแพร์สันนั้นใหญ่กว่า? นี่ดูเหมือนจะเป็นคุณสมบัติที่สอดคล้องกันในชุดข้อมูลของฉัน


คำถามที่คล้ายกันมากกับคำตอบที่ดีที่นี่
Colin T Bowers

คำตอบ:


14

ความสัมพันธ์ของสเปียร์แมนเป็นเพียงความสัมพันธ์ของเพียร์สันโดยใช้อันดับ (สถิติการสั่งซื้อ) แทนค่าตัวเลขจริง คำตอบสำหรับคำถามของคุณคือพวกเขาไม่ได้วัดในสิ่งเดียวกัน เพียร์สัน: แนวโน้มเชิงเส้น, สเปียร์แมน: แนวโน้มแบบโมโนโทนิก ความสัมพันธ์ของเพียร์สันนั้นสูงขึ้นเพียงหมายความว่าความสัมพันธ์เชิงเส้นนั้นมีค่ามากกว่าความสัมพันธ์อันดับ นี่อาจเป็นเพราะการสังเกตที่มีอิทธิพลในการกระจายที่มีอิทธิพลมากเมื่อเทียบกับค่าอันดับของพวกเขา การทดสอบการเชื่อมโยงโดยใช้สหสัมพันธ์เพียร์สันนั้นมีพลังงานสูงกว่าเมื่อเส้นตรงมีอยู่ในข้อมูล


1
ฉันรู้ว่าหอกเป็นเพียงลูกแพร์ติดอันดับ ฉันต้องดูว่าสามารถมีเส้นทางอื่นที่อาจทำให้เกิดสิ่งนี้ได้หรือไม่ แต่การสังเกตหางที่มีอิทธิพลซึ่งมีความสัมพันธ์เชิงเส้นมากกว่าข้อมูลจำนวนมาก แต่การสูญเสียอิทธิพลของพวกเขาเมื่อแทนที่ด้วยอันดับของพวกเขาจะทำให้ฉัน เห็น
John Robertson

0

เพียร์สันสหสัมพันธ์สันนิษฐานว่าสมมติฐานมีความถูกต้องหลายประการ: 1) โดยปกติแล้วตัวแปรแต่ละตัวจะถูกแจกแจง; 2) Homoscedasticity ความแปรปรวนของตัวแปรแต่ละตัวยังคงที่ และ 3) ลิเนียริตี้ (Linearity) หมายถึงพล็อตการกระจายที่แสดงความสัมพันธ์แสดงจุดข้อมูลที่จัดกลุ่มแบบสมมาตรรอบเส้นการถดถอย

ความสัมพันธ์ของสเปียร์แมนเป็นทางเลือกที่ไม่ใช่พารามิเตอร์ของเพียร์สันโดยพิจารณาจากการสังเกตการณ์ Spearman Correlation ช่วยให้คุณผ่อนคลายสมมติฐานทั้งสามเกี่ยวกับชุดข้อมูลของคุณและได้รับความสัมพันธ์ที่ยังคงมีความถูกต้องอย่างสมเหตุสมผล

ข้อมูลของคุณบ่งบอกถึงว่ามันอาจจะแบ่งสมมติฐานที่กล่าวไว้อย่างน้อยหนึ่งข้ออย่างมีนัยสำคัญเพื่อให้ความสัมพันธ์ทั้งสองแตกต่างกัน

เนื่องจากคุณมีช่องว่างขนาดใหญ่ระหว่างสองสหสัมพันธ์คุณควรตรวจสอบว่าตัวแปรของชุดข้อมูลของคุณมีการกระจายตามปกติ homoscedastic และ linear ภายในโครงเรื่องกระจาย

การสอบสวนข้างต้นจะช่วยให้คุณตัดสินใจได้ว่าค่าสัมประสิทธิ์สหสัมพันธ์ Spearman หรือ Pearson นั้นเป็นตัวแทนที่ดีกว่าหรือไม่


2
คุณอาจคิดถึงการทดสอบการอนุมานที่เกี่ยวข้องโดยใช้ -distribution ไม่ใช่การวัดเชิงพรรณนา อย่างไรก็ตามการทดสอบนี้มักจะอธิบายว่ามีข้อสมมติฐานที่แตกต่างจากที่คุณระบุไว้ เช่นค่าเฉลี่ยของตัวแปรแบบ bivariate ข้อสันนิษฐานที่แข็งแกร่งกว่าการแจกแจงแบบปกติเป็นรายบุคคล โปรดให้การอ้างอิงสำหรับงบของคุณ เสื้อ
caracal

4
ไม่ถูกต้อง การอนุมานความสัมพันธ์ของเพียร์สันไม่จำเป็นต้องมีข้อสันนิษฐานใด ๆ หนึ่งอาจมีความสัมพันธ์โค้งกับ heteroscedastic ข้อมูลที่ไม่ปกติและการทดสอบความสัมพันธ์ของเพียร์สัน (ซึ่งเทียบเท่ากับการอนุมานในแบบจำลองการถดถอยเชิงเส้น) ถูกขับเคลื่อนเพื่อตรวจสอบแนวโน้มการสั่งซื้อครั้งแรก การตีความสหสัมพันธ์ของเพียร์สันยังคงเป็นจุดแข็งของแนวโน้มอันดับหนึ่ง มีบางสถานการณ์ที่แนวโน้มอันดับแรกที่วัดโดยสหสัมพันธ์เพียร์สันนั้นไม่เพียงพอสำหรับการวิเคราะห์
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.