ความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและหมวดหมู่ (ระบุ)


40

ฉันต้องการหาความสัมพันธ์ระหว่างตัวแปรแบบต่อเนื่อง (ตัวแปรตาม) และหมวดหมู่ (ชื่อ: เพศตัวแปรอิสระ) ข้อมูลต่อเนื่องจะไม่กระจายตามปกติ ก่อนหน้านี้ผมได้คำนวณโดยใช้สเปียร์แมนρอย่างไรก็ตามฉันได้รับแจ้งว่าไม่ถูกต้องρ

ในขณะที่ค้นหาบนอินเทอร์เน็ตฉันพบว่ากล่องควบคุมสามารถให้แนวคิดเกี่ยวกับจำนวนที่เกี่ยวข้อง แต่ผมกำลังมองหาค่าเชิงปริมาณเช่นค่าสัมประสิทธิ์เพียร์สันหรือสเปียร์แมนρคุณช่วยฉันเกี่ยวกับวิธีการทำสิ่งนี้ได้ไหม หรือแจ้งวิธีการใดที่เหมาะสมρ

Point Biserial Coefficient เป็นตัวเลือกที่ถูกต้องหรือไม่?


ตามปกติแล้วเราไม่สามารถให้คำแนะนำได้บนพื้นฐานของรูปแบบของข้อมูลเท่านั้น! ข้อมูลแสดงถึงอะไรและคุณต้องการบรรลุผลการวิเคราะห์อย่างไร
kjetil b halvorsen

1
ขอบคุณ kjetil ฉันต้องการเปรียบเทียบความสัมพันธ์ระหว่างเพศและตัวแปรต่อเนื่องอื่น ๆ เพียงแค่รู้ว่าตัวแปรต่อเนื่องใดที่มีความสัมพันธ์ปานกลาง / รุนแรงและตัวแปรใดที่ไม่ใช่
Md. Ferdous Wahid

1
ดูเหมือนซ้ำซ้อนของ stats.stackexchange.com/questions/25229/… คุณช่วยบอกเราได้ไหมว่าคำตอบของคำตอบนั้นช่วยคุณได้ไหม?
kjetil b halvorsen

ใช่คำถามของฉันคล้ายกับที่ แต่ผมมีข้อเสนอแนะที่วิจารณ์ชี้ให้เห็นว่าสเปียร์แมนไม่เหมาะสม ขนาดตัวอย่างของฉันคือ 31 ตามคำตอบ (ลิงก์ที่ให้ไว้) ไม่ใช่แบบปกติจะไม่มีปัญหาและวิธีการสหสัมพันธ์ใด ๆ สามารถใช้ (Spearman / Pearson / Point-Biserial) สำหรับชุดข้อมูลขนาดใหญ่ มันจะเป็นจริงสำหรับชุดข้อมูลขนาดเล็กด้วยหรือไม่ โดยวิธีการที่เพศไม่ได้สร้างระดับที่แตกต่างกันเล็กน้อย ลิงก์ด้านบนควรใช้ค่าสัมประสิทธิ์สหสัมพันธ์ biserial ρ
Md. Ferdous Wahid

3
ความสัมพันธ์ระหว่างการระบุและช่วงเวลาหรือสถิติ
ttnphns

คำตอบ:


25

ρ(Zi,Ii)ZIρZ,IIρจะเป็นพื้นบางรุ่น rescaled ของอันดับเฉลี่ยระหว่างสองกลุ่ม มันจะง่ายกว่า (ตีความได้มากกว่า) เพื่อเปรียบเทียบค่าเฉลี่ย! อีกวิธีคือ

X1,,XnY1,,YmXYP(X>Y)

θ=P(X>Y)
XYθ(Xi,Yj)Xi>YjMXi<YjWθ
MM+W

5
ความสัมพันธ์อันดับของ Spearman เป็นเพียงความสัมพันธ์ของ Pearson นำไปใช้กับการจัดอันดับของตัวแปรตัวเลขและค่าของตัวแปรไบนารีดั้งเดิม (การจัดอันดับไม่มีผลที่นี่) ดังนั้น Rho's Spearman จึงเป็นอันดับอะนาล็อกของความสัมพันธ์แบบ Point-biserial ฉันไม่เห็นปัญหาใด ๆ ในการใช้ Rho ของ Spearman ในสถานการณ์เช่นนี้
Michael M

Michael Mayer: ใช่มันอาจใช้งานได้ แต่อาจมีประเด็นใดบ้างในเรื่องนี้ มันไม่ได้ให้ข้อมูลที่ไม่มีอยู่ในความแตกต่างของวิธีการบางอย่าง! และนั่นแปลได้โดยตรงมากกว่า
kjetil b halvorsen

1
ความแตกต่างในการจัดอันดับง่ายกว่ามากที่จะ interprete เป็น Rho ของ Spearman หรือไม่? แม้ว่าเป็นเช่นนั้นคุณจะเรียก Rho ของ Spearman ผิดหรือเปล่า? น่าเศร้าที่เราไม่เห็นผู้ให้เหตุผลวิจารณ์
Michael M

1
สิ่งที่คุณแนะนำนั้นดี ดูเหมือนว่าจะเกี่ยวข้องกับสถิติการทดสอบของการทดสอบสองตัวอย่างของ Wilcoxon ซึ่งมีความคล้ายคลึงกับความสัมพันธ์อันดับของ Kendall ระหว่างผลลัพธ์ที่เป็นตัวเลขและตัวแปรกลุ่มไบนารี
Michael M

1
θθ^1θ

8

ฉันมีปัญหาเดียวกันตอนนี้ ฉันยังไม่เห็นใครอ้างอิงถึงเรื่องนี้ แต่ฉันกำลังค้นคว้าความสัมพันธ์แบบจุดต่อจุดซึ่งสร้างจากสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน มันมีความหมายสำหรับตัวแปรต่อเนื่องและตัวแปรสองขั้ว

อ่านอย่างรวดเร็ว: https://statistics.laerd.com/spss-tutorials/point-biserial-correlation-using-spss-statistics.php

ฉันใช้ R แต่ฉันพบว่า SPSS มีเอกสารที่ยอดเยี่ยม


1
การอ้างอิงที่ดีสำหรับการค้นหาความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและตัวแปร dichotomous! อย่างไรก็ตามสมมติฐานที่ระบุไว้มีความแข็งแกร่งเล็กน้อย
SUNDONG

1

ดูเหมือนว่าการเปรียบเทียบที่เหมาะสมที่สุดคือการเปรียบเทียบค่ามัธยฐาน (ซึ่งไม่ปกติ) และการแจกแจงระหว่างหมวดหมู่ไบนารี ฉันขอแนะนำให้ใช้การทดสอบแบบไม่มีพารามิเตอร์ของ Mann-Whitney ...


6
ในขณะที่แมนน์ - วิทนีย์จะเป็นวิธีในการระบุการเปลี่ยนตำแหน่งในตัวแปร (หรือรูปแบบทั่วไปของการปกครองแบบสุ่ม) ข้ามตัวแปรหมวดหมู่แบบไบนารี แต่แมนน์ - วิตนีย์ไม่ได้เปรียบเทียบค่ามัธยฐานอย่างน้อยก็ไม่มีสมมติฐานเพิ่มเติม
Glen_b

0

สำหรับปัญหาที่ระบุการวัดพื้นที่ใต้เส้นโค้งของตัวดำเนินการรับลักษณะโค้งอาจช่วยได้

ฉันไม่ใช่ผู้เชี่ยวชาญในเรื่องนี้ดังนั้นฉันจึงพยายามทำให้มันง่าย โปรดแสดงความคิดเห็นในข้อผิดพลาดหรือการตีความที่ผิดเพื่อให้ฉันสามารถเปลี่ยนแปลงได้

xyxxx

xx

xx

ข้อความข้างต้นถูกคำนวณด้วยพื้นที่ภายใต้เส้นโค้ง

ตัวอย่างของความสัมพันธ์ที่ดี (ขวา) และการต่อต้านความสัมพันธ์อย่างยุติธรรม (ซ้าย) ตัวอย่างของความสัมพันธ์ที่ดี (ขวา) และการต่อต้านความสัมพันธ์อย่างยุติธรรม (ซ้าย)


1
ยินดีต้อนรับสู่ CV! คำตอบของคุณเป็นบิตสั้นเกินไปและมันดูเหมือนจะไม่ช่วยในการค้นหา: "ความสัมพันธ์ระหว่างต่อเนื่อง (ตัวแปรตาม) และเด็ดขาด (ตามที่ระบุเพศตัวแปรอิสระ) ตัวแปร" คุณสามารถแก้ไขคำตอบเพื่อรวมว่า AUROC ควรทำอย่างไรเพื่อให้บรรลุเป้าหมายนี้
Frans Rodenburg

-3

คุณควรใช้ทางเลือกแนวโน้มเชิงเส้นเพื่อความเป็นอิสระ หากคุณไม่ทราบวิธีนี้คุณสามารถศึกษาข้อมูลเบื้องต้นเกี่ยวกับการวิเคราะห์ข้อมูลเด็ดขาดหน้า 41


4
มีคำตอบที่ยอมรับแล้ว และยังไม่ชัดเจนว่าคำตอบของคุณก่อให้เกิดอะไร คุณช่วยอธิบายเพิ่มเติมได้ไหม ฉันคิดว่าคุณอ้างอิงถึงบทนำของ Agresti เกี่ยวกับการวิเคราะห์ข้อมูลเชิงหมวดหมู่ โปรดระบุการอ้างอิงแบบเต็ม
TEG - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.