การทดสอบความสำคัญกับความแตกต่างของสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน


13

(ขอบคุณมากสำหรับคำตอบที่รวดเร็วฉันทำงานได้ไม่ดีในการถามคำถามดังนั้นให้ฉันลองอีกครั้ง)

ฉันไม่รู้ว่าจะทราบได้อย่างไรว่าความแตกต่างระหว่างสองสเปียร์แมนมีความสัมพันธ์ทางสถิติหรือไม่ ฉันต้องการทราบวิธีค้นหามัน

เหตุผลที่ฉันอยากรู้คือในบทความต่อไปนี้: การตีความความหมายตามวิกิพีเดียสำหรับการประมวลผลภาษาธรรมชาติโดย Gabrilovich และ Markovitch ( วารสารวิจัยปัญญาประดิษฐ์ 34 (2009) 443-498)

ในตารางที่ 2 (หน้า 457) ผู้เขียนกำลังแสดงให้เห็นว่าวิธีการของพวกเขา (ESA-Wikipedia) ได้รับความสัมพันธ์ของสเปียร์แมนสูงกว่าและมีนัยสำคัญทางสถิติมากกว่าวิธีอื่น ๆ และฉันต้องการทำแบบเดียวกันเพื่อแสดงให้เห็นว่า วิธีการสำหรับปัญหาบางอย่าง

ฉันไม่รู้ว่าพวกเขาคำนวณนัยสำคัญทางสถิติอย่างไรและฉันต้องการทราบ ผู้เขียนบทความได้ระบุว่าความสัมพันธ์อันดับของ Spearman นั้นถือว่าเป็นความสัมพันธ์ของ Pearson ฉันไม่แน่ใจว่าเป็นวิธีที่ถูกต้องหรือไม่ ฉันมีความสัมพันธ์ของสเปียร์แมนสองตัวและฉันต้องการทราบว่าความแตกต่างระหว่างพวกเขานั้นมีนัยสำคัญทางสถิติหรือไม่

ฉันทราบว่าเว็บไซต์เช่นhttp://faculty.vassar.edu/lowry/rdiff.htmlให้เครื่องคิดเลขออนไลน์เพื่อรับความแตกต่างระหว่างความสัมพันธ์ของทั้งสองเพียร์สัน ฉันไม่สามารถค้นหาเครื่องคิดเลขออนไลน์ที่คล้ายกันสำหรับความแตกต่างระหว่างความสัมพันธ์ของ Spearman สองอัน

ทางออกจากลิงค์ของ Peter Flom

หมายเหตุ: กระบวนการสนับสนุนความสัมพันธ์ของ Spearman ที่ต่ำกว่า 0.6 เท่านั้น

  1. ให้ = ฟิชเชอร์เปลี่ยนของความสัมพันธ์ที่สังเกตของชุด, = ฟิชเชอร์เปลี่ยนของความสัมพันธ์ที่สังเกตของชุดBzAAzBB

  2. สำหรับ , ให้โดยที่คือการแปลง Fisher ของชุดของหนึ่ง - ซ้าย - out correlation ที่ได้จากการลบ , จัดอันดับใหม่และคำนวณความสัมพันธ์ใหม่อีกครั้ง (แต่ละ จะขึ้นอยู่กับคู่แต่ละลบจะเป็นแบบชั่วคราวที่ฉันเท่านั้นไม่ถาวร.) ทำซ้ำสำหรับชุดBi=1,,nyAi=nzA(n1)zAizAiA(xi,yi)zAin1B

  3. y¯A=yAi/nคือการแปลงแบบ jackknifed Fisher ทำซ้ำสำหรับชุดBB

  4. vy¯A=(yAiy¯A)2/(n(n1))คือความแปรปรวนของy_A ทำซ้ำสำหรับชุดBy¯AB

  5. ใช้ heteroscedastic (Welch-Satterthwaite) -test เพื่อเปรียบเทียบการประมาณการแบบแจ็คสองครั้ง:t

t=y¯Ay¯Bvy¯A+vy¯B,df=(vy¯A+vy¯B)2vy¯A2nA1+vy¯B2nB1
ที่และคือจำนวนตัวอย่างของชุดและตามลำดับnAnBAB

ก่อนแก้ไขครั้งแรก

ฉันได้รับการจัดอันดับโดยมนุษย์ (อันดับมนุษย์) อันดับของการจัดอันดับที่สร้างขึ้นโดยวิธีที่นิยมใช้ในปัจจุบัน (การจัดอันดับปัจจุบัน) และสุดท้ายชุดการจัดอันดับที่สร้างขึ้นโดยวิธีการของฉัน (MY-RANKING) .

ฉันคำนวณความสัมพันธ์ของ Spearman ระหว่างการจัดอันดับของมนุษย์กับการจัดอันดับปัจจุบัน ให้ฉันเรียกสิ่งนี้ว่า: มนุษย์ - ปัจจุบัน - SPEARMAN

จากนั้นฉันก็ค้นพบความสัมพันธ์ของ Spearman ระหว่างการจัดอันดับของมนุษย์กับการจัดอันดับของฉัน ให้ฉันเรียกสิ่งนี้ว่า: มนุษย์ - มนุษย์ -Spearman

ฉันจะทราบได้อย่างไรว่าความแตกต่างระหว่างมนุษย์กับมนุษย์และมนุษย์ปัจจุบันมีความสำคัญทางสถิติหรือไม่


2
ยินดีต้อนรับแพทริค ฉันกำลังดิ้นรนกับปัญหาเดียวกัน แต่กับ Pearson r หากคุณตรวจสอบผลงานของฉันคุณจะรู้สึกว่าคุณสามารถทำอะไรได้บ้าง
Adhesh Josh

แม้ว่าคุณอาจมีปัญหาเกี่ยวกับการตั้งคำถามนี้ในแง่สถิติ - มันจะมีประโยชน์ถ้าเรารู้ว่าสิ่งที่คุณสนใจคุณสนใจในความสัมพันธ์ที่ใกล้ชิดกัน (คะแนนใกล้เคียงกันมากน้อยแค่ไหน) มากกว่าโอกาส เนื่องจากคุณดูเหมือนจะมีข้อมูลอันดับซ้ำ ๆ ในเวลามันอาจจะมีประโยชน์ในการอ่านค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างระดับ ฉันหวังว่าฉันมีสิทธิ์เช่นนั้นคำถามยังไม่ชัดเจน
rosser

ขอบคุณ Adhesh และ rosser ฉันขอโทษสำหรับคำอธิบายที่ไม่ดีของคำถาม ฉันเขียนมันใหม่แล้ว หวังว่ามันจะกลายเป็นคำถามที่เข้าใจได้
Patrick Chan

Hi! ฉันกำลังดิ้นรนกับปัญหาเดียวกัน คุณมีรหัสพร้อมที่จะนำข้อเสนอแนะของคุณไปใช้หรือไม่? นอกจากนี้เหตุใดจึงใช้งานได้เฉพาะกับค่าสหสัมพันธ์ต่ำกว่า 0.6 เท่านั้น
fsociety

คำตอบ:


1

กระดาษที่คุณอ้างอิงอธิบายวิธีการดังต่อไปนี้:

[... ] เราแสดงนัยสำคัญทางสถิติของความแตกต่างระหว่างประสิทธิภาพของ ESA-Wikipedia (26 มีนาคม 2549) เวอร์ชั่น) และอัลกอริธึมอื่น ๆ โดยใช้การแปลง z ของ Fisher (กด, Teukolsky, Vetterling, & Flannery, Numerical สูตรใน C: ศิลปะการคำนวณทางวิทยาศาสตร์สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 1997, ส่วนที่ 14.5)

ฉันขอแนะนำให้คุณทำตามการอ้างอิงนั้นหรือดูที่หน้า Wikipedia บนค่าสัมประสิทธิ์ Spearmanสำหรับรายละเอียด


1
ขอบคุณ Guillermo ฉันสงสัยว่าพวกเขารักษาระดับความสัมพันธ์ของสเปียร์แมนเป็นความสัมพันธ์ของเพียร์สันและคำนวณความแตกต่างของความสัมพันธ์ของเพียร์สันสองแห่ง อย่างไรก็ตามดูเหมือนว่าสำหรับฉันมันไม่ใช่วิธีที่ถูกต้องที่จะทำดังนั้นฉันจึงโพสต์ที่นี่
Patrick Chan

คุณอาจรู้จักการใช้งาน (โดยเฉพาะอย่างยิ่งออนไลน์) เพราะนี่คือสิ่งที่ OP ดำเนินการหรือไม่
chl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.