การแสดงข้อมูลลำดับ - หมายถึงค่ามัธยฐานและค่าเฉลี่ยอันดับ


11

ฉันมีข้อมูลลำดับที่ไม่ได้กระจายตามปกติดังนั้นฉันตัดสินใจทำการทดสอบแบบไม่อิงพารามิเตอร์โดยใช้ Mann-Whitney U Test ฉันกำลังดูความแตกต่างระหว่างกลุ่มสำหรับเจ็ดคะแนน - คะแนนเหล่านี้เป็น 0, 1, 2 หรือ 3 สำหรับแต่ละวิชา ฉันมีช่วงเวลาที่ยากลำบากในการหาวิธีแสดงข้อมูลของฉัน!

ถ้าฉันนำเสนอข้อมูลโดยใช้ค่ามัธยฐาน (และค่า IQR ของค่ามัธยฐาน) ก็ไม่ชัดเจนเลยว่าความแตกต่างนั้นเป็นเพราะส่วนใหญ่ค่าเฉลี่ยของสื่อกลางอยู่ที่ 0 หรือ 1 ดังนั้นแม้จะทดสอบ Mann-Whitney U แสดงความแตกต่างอย่างมีนัยสำคัญ ตารางดูไม่น่าสนใจ

ฉันยังสามารถนำเสนอข้อมูลโดยใช้วิธีการ มีเอกสารทางวิทยาศาสตร์บางฉบับที่บอกว่าคุณสามารถใช้วิธีการที่มีข้อมูลลำดับ แต่คุณไม่สามารถตั้งสมมติฐานประเภทเดียวกันเกี่ยวกับความแตกต่างระหว่างคะแนน (เช่นความแตกต่างระหว่าง 0 และ 1 ไม่เหมือนกับระหว่าง 1 และ 2) การใช้หมายถึงจะเป็นการโต้เถียงเล็กน้อยแม้ว่าตัวเลขในตารางจะบอกเล่าเรื่องราวได้ดีเมื่อฉันใช้

ตัวเลือกที่สามคือการใช้อันดับเฉลี่ยที่ SPSS มอบให้ฉันในผลลัพธ์ของ Mann-Whitney อันดับเฉลี่ยคือสิ่งที่มีการเปรียบเทียบระหว่างกลุ่มดังนั้นบางทีฉันควรใช้เหล่านั้น ปัญหาเดียวที่ฉันมีคือค่าเฉลี่ยไม่ได้หมายถึงอะไรจริง ๆ ที่เกี่ยวกับข้อมูลจริง (เช่นฉันไม่เห็นว่าวิชาอยู่ใกล้กับ 3 ในขณะที่การควบคุมอยู่ใกล้กับ 1 โดยใช้อันดับเฉลี่ย)

และตัวเลือกสุดท้ายทำการวิเคราะห์ไคสแควร์เปรียบเทียบตัวแบบและตัวควบคุมหลังจากแยกคะแนนออกเป็นสองกลุ่ม (0 และ 1 สำหรับต่ำและ 2 และ 3 สำหรับสูง) อย่างไรก็ตามเมื่อฉันทำสิ่งนี้ความแตกต่างไม่เด่นชัด (อาจด้วยเหตุผลหลายประการ)


คุณกำลังถามเกี่ยวกับวิธีการนำเสนอข้อมูลของคุณในรูปแบบข้อความในตารางหรือในรูปที่ดีที่สุด?
gung - Reinstate Monica

ทั้งข้อความและตาราง ในข้อความฉันจะบอกว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างกลุ่มในหลายองค์ประกอบของแบบสำรวจการนอนหลับของฉัน ความแตกต่างเหล่านั้นผ่านการทดสอบ Mann-Whitney ดังนั้นพวกเขาจึงเปรียบเทียบระดับเฉลี่ย สิ่งที่ฉันไม่รู้ก็คือฉันควรนำเสนอความแตกต่างเหล่านี้ในตารางอย่างไร การใช้สื่อกลางไม่ทำงานเพราะมันไกลเกินไปและคุณไม่สามารถเห็นความแตกต่างได้ หมายถึงทำงานได้ดีขึ้น แต่ดูเหมือนว่าแปลกที่จะใช้มาตรการแบบพาราเมตริกในตารางซึ่งควรจะเกี่ยวกับค่ามัธยฐานแบบไม่อิงพารามิเตอร์ และค่าเฉลี่ยของอันดับจะใช้ได้ แต่พวกมันไม่ได้แสดงถึงค่าที่แท้จริง
Eric

1
ฉันสงสัยว่าคำตอบบางส่วนจากกราฟสำหรับความสัมพันธ์ระหว่างตัวแปรอันดับสองสามารถปรับให้เหมาะกับวัตถุประสงค์ของคุณได้หรือไม่? กราฟตัวอย่างแสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแต่ละตัวมีห้าระดับ แต่ถ้าคุณเปรียบเทียบกลุ่มสองกลุ่มและคุณมีสี่ระดับที่เป็นไปได้คุณสามารถจินตนาการการสร้างภาพข้อมูลบางส่วนเป็นแบบ 4 ต่อ 2 แทนที่จะเป็น 5 ต่อ - 5 อาจจะ
Silverfish

อาจเป็นประโยชน์หากคุณสามารถโพสต์ข้อมูลตัวอย่าง (อาจเป็นการหลอกลวงทั้งหมด) เพื่อให้ผู้ที่ต้องการแสดงให้เห็นถึงเทคนิคที่เป็นไปได้มีบางสิ่งบางอย่างที่จะทำงานด้วย
Silverfish

1
เอริคตามคำนิยามของการทดสอบแบบไม่พารามิเตอร์พารามิเตอร์ Mann-Whitney โดยเฉพาะการเปรียบเทียบ (สำหรับการปกครอง) การแจกแจงสองแบบโดยทั่วไปจะไม่เปรียบเทียบค่าพารามิเตอร์เฉพาะของการแจกแจงเช่นค่าเฉลี่ยหรือค่ามัธยฐาน ไม่มีหมายเลขเดียวซึ่งเป็นลักษณะของการแจกแจงและในเวลาเดียวกันคือสิ่งที่ถูกเปรียบเทียบในกรณีนี้ คุณอาจใช้เครื่องมือประมาณค่าตัวอย่าง Hodges-Lehmann 2 แต่เป็นคุณลักษณะของความแตกต่างระหว่างการแจกแจงสองแบบและไม่ใช่การแจกแจงสองแบบ
ttnphns

คำตอบ:


8

นี่เป็นคำถามที่ยอดเยี่ยม ตามที่คุณค้นพบปริมาณจะไม่ทำงานเมื่อมีความสัมพันธ์ในข้อมูลจำนวนมากเพราะมันไม่ต่อเนื่องเหมือนตัวประมาณ ฉันมักจะพบว่าวิธีที่ดีที่สุดหากคุณสามารถสันนิษฐานได้ว่าระยะห่างระหว่างหมวดหมู่นั้นอย่างน้อย "มีความหมายครึ่งทาง" ความน่าจะเป็นที่เกินจะถูกต้องเสมอ ในกรณีของคุณเหล่านี้จะได้รับการประเมินจากสัดส่วนของการสังเกต 3 การจัดอันดับเฉลี่ยมีประโยชน์เมื่อเปรียบเทียบกลุ่ม แต่ฉันไม่เห็นการใช้งานตัวแปรเดี่ยวมากนัก1,2,=3

ความถูกต้องของการใช้ค่าเฉลี่ยในการสรุปตัวแปรลำดับมักไม่ค่อยมาจากข้อมูลของตัวเอง มันเป็นเรื่องส่วนตัว

แทนที่จะใช้การจัดอันดับเฉลี่ยฉันจะใช้การวัดความสัมพันธ์ของอันดับที่เหมาะสมหรือความน่าจะเป็นที่สอดคล้องกัน (การแปลเชิงเส้นอย่างง่ายของสถิติ Wilcoxon-Mann-Whitney มันเป็นค่าเฉลี่ยของการสังเกตในหนึ่งในสองกลุ่มหารด้วยค่าคงที่) ระหว่าง ตัวแปรสองตัว (เช่นการจัดกลุ่มแบบไบนารีและสเกลลำดับ) ทางเลือกสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ ได้แก่ ซอมเมอร์ (ซึ่งมีความสอดคล้องกับความน่าจะเป็นและสอดคล้อง penalizes สำหรับความสัมพันธ์ในตัวแปรลำดับ) และกู๊ดแมน-Kruskalซึ่งไม่ลงโทษสำหรับความสัมพันธ์ทั้งหรือy ที่ γ x yDxyγxy


1
สวัสดีแฟรงค์ขอบคุณสำหรับการตอบกลับอย่างรอบคอบ หากคุณไม่รังเกียจฉันมีคำถามติดตามสองสามข้อ เกี่ยวกับวิธีการ - ฉันเชื่อว่าหมวดหมู่มีความหมายอย่างน้อยครึ่งหนึ่งเนื่องจากพวกเขาอ้างถึง "ไม่อ่อนโยนปานกลางและรุนแรง" ตามลำดับ มีการอ้างอิงใด ๆ ที่คุณรู้หรือไม่ว่าฉันอาจใช้เป็นแบบอย่างสำหรับสิ่งนี้ได้ ฉันยังลังเลที่จะใช้วิธีการในตารางเดียวและคนอื่น ๆ ใน Medians เพื่อความมั่นคง และสำหรับอันดับเฉลี่ย - ฉันเชื่อว่าฉันกำลังเปรียบเทียบกลุ่ม - วิชาเทียบกับส่วนควบคุม 7 คะแนน การเปรียบเทียบหมายถึงอันดับที่ยอมรับ / มีประโยชน์หรือไม่
Eric

สำหรับข้อมูลลำดับตัวเลขที่มีระดับน้อยเช่นจำนวนและบางทีตัวอย่างการด้อยค่าของคุณหมายถึงมีประโยชน์และค่ามัธยฐานไม่ได้ (เนื่องจากมีความสัมพันธ์มากเกินไป) มีหลายครั้งที่ฉันเคยใช้หมายถึงข้อมูลอันดับและมัธยฐานสำหรับค่าเบ้อย่างต่อเนื่องในตารางเดียวกัน
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.