Kendall Tau หรือ Rho's Spearman?


69

ในกรณีใดที่หนึ่งควรชอบหนึ่งมากกว่าอีก?

ฉันพบคนที่อ้างว่าเป็นประโยชน์สำหรับเคนดัลล์ด้วยเหตุผลด้านการสอนมีเหตุผลอื่นอีกไหม?


ดูเพิ่มเติมคำถามที่เกี่ยวข้องstats.stackexchange.com/q/18112/3277
ttnphns

1
น่าเสียดายที่ลิงก์ในคำถามของคุณเสียชีวิต ผมถือว่าคุณหมายถึงNoether (2007, การเรียนการสอนสถิติ ) คุณต้องการแก้ไขหรือไม่
เตฟาน Kolassa

คำตอบ:


40

ฉันพบว่าความสัมพันธ์ของสเปียร์แมนส่วนใหญ่ใช้แทนที่ความสัมพันธ์เชิงเส้นปกติเมื่อทำงานกับคะแนนจำนวนเต็มในระดับการวัดเมื่อมันมีคะแนนที่เป็นไปได้ในระดับปานกลางหรือเมื่อเราไม่ต้องการพึ่งพาสมมติฐานเกี่ยวกับความสัมพันธ์แบบสองตัวแปร . เมื่อเทียบกับค่าสัมประสิทธิ์ของเพียร์สันการตีความเอกภาพของเคนดัลล์ดูเหมือนว่าฉันโดยตรงน้อยกว่าของ Rho ของสเปียร์แมนในแง่ที่ว่าปริมาณของความแตกต่างระหว่าง% ของคู่ที่ไม่ลงรอยกันและไม่ลงรอยกัน ในความเข้าใจของฉันเอกภาพเคนดอลอย่างใกล้ชิดคล้ายกับสามี-Kruskal แกมมา

ฉันเพิ่งอ่านบทความจาก Larry Winner ใน J. Statistics Educ (2006) ซึ่งกล่าวถึงการใช้มาตรการทั้งสองนาสคาร์วินสตันถ้วยสำหรับผลการแข่งขัน 1975-2003

ฉันยังพบ@onestopคำตอบเกี่ยวกับความสัมพันธ์ของ Pearson หรือ Spearman กับข้อมูลที่ไม่ปกติที่น่าสนใจในส่วนนี้

โน้ตเอกภาพเคนดอล (คนรุ่น) มีการเชื่อมต่อกับซอมเมอร์ D (และ Harrell ของ C) ใช้สำหรับการสร้างแบบจำลองการคาดการณ์ (ดูเช่นการตีความของซอมเมอร์ D ภายใต้สี่รุ่นที่เรียบง่ายโดย RB Newson และอ้างอิง6นั้นและบทความโดย Newson เผยแพร่ใน Stata Journal 2006) ภาพรวมของการทดสอบผลรวมอันดับมีให้ในการคำนวณที่มีประสิทธิภาพของช่วงความเชื่อมั่นของ Jackknife สำหรับสถิติอันดับที่เผยแพร่ใน JSS (2006)


ขอบคุณ chl สำหรับคำตอบฉันยอมรับมันสำหรับขอบเขตที่แท้จริงของมัน ยอดเยี่ยม Tal
Tal Galili

Spearman ใช้ตัวแปรจำนวนเต็มสองตัวในการคำนวณความสัมพันธ์เป็นประจำซึ่งดูเหมือนว่าจะจัดการได้ดีขึ้นโดยเอกภาพของ Kendall
vinnief

29

ฉันอ้างถึงสุภาพบุรุษผู้มีเกียรติกับคำตอบก่อนหน้าของฉัน : "... ช่วงความมั่นใจสำหรับ Spearman's r Sนั้นมีความน่าเชื่อถือน้อยกว่าและสามารถตีความได้น้อยกว่าช่วงความมั่นใจสำหรับพารามิเตอร์τของ Kendall" ตาม Kendall & Gibbons (1990)


1
ฉันคิดว่าขอบคุณเนื่องจาก Roger Newson ในขณะที่ฉันเพิ่งอ้างอิงจากบทความของเขา
onestop

22

คำตอบปรัชญาค่อนข้างอีกครั้ง; ความแตกต่างพื้นฐานคือว่า Spearman's Rho เป็นความพยายามที่จะขยายความคิด R ^ 2 (= "อธิบายความแปรปรวน") เกี่ยวกับการปฏิสัมพันธ์แบบไม่เชิงเส้นในขณะที่ Kendall's Tau นั้นค่อนข้างจะเป็นสถิติสำหรับการทดสอบความสัมพันธ์แบบไม่เชิงเส้น ดังนั้นควรใช้ Tau เพื่อทดสอบความสัมพันธ์แบบไม่เชิงเส้น Rho เป็นส่วนขยาย R (หรือสำหรับคนที่คุ้นเคยกับ R ^ 2 - การอธิบาย Tau ให้ผู้ชมที่ไม่สงสัยในเวลา จำกัด นั้นเจ็บปวด)


6
คุณช่วยอธิบายหน่อยได้ไหมว่า The Spearman Rho นั้นสะท้อนถึงการวัดค่าสัมประสิทธิ์ความถูกต้องในแง่ของ psychometry ฉันไม่ทราบเกี่ยวกับธรรมชาติของเอกภาพ
Subhash C. Davar

ฉันไม่เข้าใจสิ่งที่ความคิดเห็นของคุณ psychometry
LéoLéopold Hertz 준영

1
"การสื่อสารที่ไม่ใช่เชิงเส้น" เพราะสิ่งที่สำคัญคือการสั่งซื้อไม่ใช่ความสัมพันธ์เชิงเส้น ตัวอย่างเช่นและมีความสัมพันธ์แบบเพียร์สันเป็น 0 ขณะที่เอกภาพของเคนดอลหรือโรของสเปียร์แมนจะได้คะแนน 1xx2
โยฮันโอบาเดีย

1
นั่นเป็นจริงเฉพาะเมื่อ x ไม่เป็นลบ
aocall

17

นี่เป็นคำพูดจากแอนดรูกิลพิน (1993) เกื้อหนุนเคนดอลτกว่าสเปียร์แมนρด้วยเหตุผลทางทฤษฎี:

"[Kendall's ] เข้าใกล้การแจกแจงแบบปกติเร็วกว่า , เป็น , ขนาดตัวอย่าง, การเพิ่ม; และยังสามารถใช้ในทางคณิตศาสตร์ได้ง่ายขึ้น, โดยเฉพาะอย่างยิ่งเมื่อมีสายสัมพันธ์" τρNτ

การอ้างอิง

Gilpin, AR (1993) ตารางสำหรับการแปลง Tend ของ Kendall เป็น Spearman's Rho ภายในมาตรการบริบทของขนาดของผลกระทบสำหรับการวิเคราะห์อภิมาน การวัดทางการศึกษาและจิตวิทยา, 53 (1), 87-92


3

FWIW คำพูดจาก Myers & Well (การออกแบบการวิจัยและการวิเคราะห์ทางสถิติ, รุ่นที่สอง, 2003, p. 510) หากคุณยังสนใจเกี่ยวกับค่า p

Seigel และ Castellan (1988 สถิติที่ไม่ใช่พารามิเตอร์สำหรับพฤติกรรมศาสตร์) ชี้ให้เห็นว่าแม้ว่าและ Spearmanจะมีค่าที่แตกต่างกันเมื่อคำนวณสำหรับชุดข้อมูลเดียวกันเมื่อการทดสอบนัยสำคัญสำหรับและ Spearmanนั้นขึ้นอยู่กับ การแจกแจงตัวอย่างของพวกเขาพวกเขาจะให้ค่าp-เท่ากันτρτρ


คุณรู้หรือไม่ว่าพวกเขาให้การสนับสนุนการเรียกร้องนี้หรือไม่? ฉันไม่เห็นว่าจริง ๆ แล้วมันสามารถเป็นจริงโดยทั่วไป (พวกเขาอาจจะค่อนข้างคล้ายกัน แต่ฉันไม่เห็นว่าการยืนยันว่าพวกเขาจะเหมือนกันสามารถถือขึ้น) [ฉันสงสัยว่า Siegel และ Castellan พูดอย่างนั้นจริง ๆ หรือมีอะไรที่แตกต่างออกไปเล็กน้อย]
Glen_b

ฉันได้ตรวจสอบ Siegel & Castellan (2ed p253) พวกเขาพูดอะไรบางอย่างที่แตกต่างออกไปเล็กน้อย ... แต่จริงๆแล้วมันเลวร้ายยิ่งกว่าการถอดความข้างต้นเล็กน้อยแม้จะมีการเพิ่ม "ประมาณ" (แย่กว่าเนื่องจากพวกเขา จำกัด ให้เป็นกรณีภายใต้ null แต่เนื่องจากพวกเขากำลังปรับข้อมูล ที่ไม่ได้ช่วยอย่างไรก็ตามสำหรับลำดับที่คงที่ของคำสั่งอันดับที่เป็นไปได้ทั้งหมดของนั้นมีโอกาสเท่ากันภายใต้ H0) ข้อเท็จจริงที่ว่าพวกเขาคิดว่าการปรับเงื่อนไขเป็นโมฆะหลังจากการปรับเงื่อนไขข้อมูลเป็นเรื่องที่กังวล ฉันสงสัยว่าพวกเขาตั้งใจพูดอย่างอื่นหรือไม่หรือเข้าใจผิดจริงๆxy
Glen_b

ในฐานะที่เป็นตัวอย่าง, ใช้ n = 7 และค่า p ที่แน่นอน ให้ x = 1,2,3,4,5,6,7 และให้ y = 2,1,4,3,7,6,5 ... spearman ให้ p = 0.048, Kendall ให้ 0.136 ... ซึ่งคือ ไม่เหมือนกันเลย การจัดเรียงที่แตกต่างกันให้ค่าเท่ากันสำหรับเคนดัลล์ แต่สเปียร์แมนมี p = 0.302 มีตัวอย่างมากมายและขนาดตัวอย่างหลากหลาย
Glen_b

3
นี่คือเนื้อเรื่องสำหรับคดี n = 8 ในขณะที่คุณดูมีจำนวนมากของการเปลี่ยนแปลงระหว่าง P-ค่าสำหรับสองมาตรการของความสัมพันธ์: i.stack.imgur.com/5JMbj.png ... ผมอาจจะเขียนขึ้น Q & A เกี่ยวกับเรื่องนี้
Glen_b

1
ต่อไปนี้เป็นตัวอย่างชุดข้อมูลสองชุด (หลังจากการจัดอันดับ) ที่แสดงสองกรณี (คราวนี้มี n = 9) โดยที่ค่า p-value สหพันธ์
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.