สามารถใช้การทดสอบ Mann-Whitney สำหรับการเปรียบเทียบหลังเหตุการณ์หลังจาก Kruskal-Wallis ได้หรือไม่?


9

ฉันมีแบบจำลองที่สัตว์ถูกวางไว้ในสภาพแวดล้อมที่เป็นมิตรและหมดเวลาเพื่อดูว่ามันสามารถอยู่รอดได้นานแค่ไหนโดยใช้วิธีการบางอย่างเพื่อความอยู่รอด มีสามวิธีที่สามารถใช้เพื่อความอยู่รอด ฉันวิ่งสัตว์จำลอง 300 ตัวโดยใช้วิธีการเอาชีวิตรอดในแต่ละครั้ง การจำลองทั้งหมดเกิดขึ้นในสภาพแวดล้อมเดียวกัน แต่มีการสุ่มดังนั้นจึงแตกต่างกันในแต่ละครั้ง ฉันใช้เวลากี่วินาทีที่สัตว์มีชีวิตรอดในการจำลองแต่ละครั้ง ชีวิตที่ยืนยาวนั้นดีกว่า ข้อมูลของฉันมีลักษณะเช่นนี้:

Approach 1, Approach 2, Approach 2
45,79,38
48,32,24
85,108,44
... 300 rows of these

ฉันไม่แน่ใจในทุกสิ่งที่ฉันทำหลังจากจุดนี้ดังนั้นให้ฉันรู้ว่าฉันกำลังทำอะไรที่โง่และผิด ฉันพยายามที่จะหาว่ามีความแตกต่างทางสถิติเกี่ยวกับอายุขัยโดยใช้วิธีการเฉพาะ

ฉันรันการทดสอบ Shapiro ของแต่ละตัวอย่างและพวกเขากลับมาพร้อมค่า p เล็ก ๆ ดังนั้นฉันจึงเชื่อว่าข้อมูลไม่ได้เป็นมาตรฐาน

ข้อมูลในแถวไม่มีความสัมพันธ์ซึ่งกันและกัน การสุ่มเมล็ดที่ใช้ในการจำลองแต่ละครั้งนั้นแตกต่างกัน ด้วยเหตุนี้ฉันจึงเชื่อว่าไม่มีการจับคู่ข้อมูล

เนื่องจากข้อมูลไม่ได้ถูกทำให้เป็นมาตรฐาน, ไม่ได้จับคู่และมีตัวอย่างมากกว่าสองตัวอย่างฉันจึงทำการทดสอบ Kruskal Wallis ซึ่งกลับมาด้วยค่า p เท่ากับ 0.048 จากนั้นฉันย้ายไปที่โพสต์เฉพาะกิจโดยเลือก Mann Whitney ในไม่แน่ใจว่า Mann Whitney ควรใช้ที่นี่หรือไม่

ฉันเปรียบเทียบวิธีการเอาชีวิตรอดแต่ละวิธีด้วยการทดสอบ Mann Whitney เช่น {(วิธีที่ 1, วิธีที่ 2), (วิธีที่ 1, วิธีที่ 3), (วิธีที่ 2, วิธีที่ 3)} ไม่มีการค้นพบความสำคัญทางสถิติระหว่างคู่ (วิธีที่ 2, วิธีที่ 3) โดยใช้การทดสอบสองแบบ แต่มีความแตกต่างอย่างมีนัยสำคัญที่พบโดยใช้การทดสอบแบบหางเดียว

ปัญหา:

  1. ฉันไม่รู้ว่าใช้ Mann Whitney แบบนี้สมเหตุสมผลหรือไม่
  2. ฉันไม่รู้ว่าควรใช้ Mann Whitney หนึ่งหรือสองหาง

คุณมีสมมุติฐานเบื้องต้นเกี่ยวกับความแข็งแรงสัมพัทธ์ของวิธีการต่าง ๆ (เช่น approach1> approach2> approach3) หรือไม่ นี่เป็นสิ่งสำคัญในการตอบคำถามของคุณ
อะมีบา

ฉันมีค่าเฉลี่ยมัธยฐานและค่าเบี่ยงเบนมาตรฐานและปรากฏว่าวิธีที่ 3 ดีกว่าเพราะมันมีค่ามัธยฐานและค่าเฉลี่ยสูงกว่า แต่ก็มีค่าเบี่ยงเบนมาตรฐานที่สูงกว่ามากฉันไม่แน่ใจ แต่ฉันไม่เคยรู้เรื่องนี้มาก่อน
ฟล็อกซ์ไมดาส

หรือเรียกอีกอย่างว่าการแก้ไข Bonferroni?
ฟล็อกซ์ไมดาส

ฟล็อกซ์: ถ้ามี "วิธีการรู้นี้ก่อนที่มือไม่" คุณควรอย่างยิ่งที่ไม่ได้ใช้การทดสอบหนึ่งนกเพียงสองด้าน (ตาม @Alexis กล่าวถึงในคำตอบของเขาเช่นกัน)
อะมีบา

6
@amoeba "her";)
Alexis

คำตอบ:


15

ไม่คุณไม่ควรใช้ Mann-Whitney ยู ทดสอบในกรณีนี้

นี่คือเหตุผล: การทดสอบของดันน์เป็นที่เหมาะสมโพสต์เฉพาะกิจการทดสอบ*ต่อไปนี้การปฏิเสธของการทดสอบ Kruskal-Wallis หากรายได้โดยการย้ายจากการปฏิเสธของ Kruskal-Wallis เป็นการดำเนินการรวมผลการจัดอันดับคู่สามัญ (เช่น Wilcoxon หรือ Mann-Whitney) การทดสอบแล้วทั้งสองปัญหาได้รับ: (1) การจัดอันดับที่ใช้สำหรับการทดสอบผลรวมอันดับคู่ที่ชาญฉลาดคือ ไม่ใช่อันดับที่ใช้โดยการทดสอบ Kruskal-Wallis และ (2) การทดสอบผลรวมอันดับไม่ได้ใช้ค่าความแปรปรวนพูโดยนัยโดยสมมติฐานว่างของ Kruskal-Wallis การทดสอบของ Dunn ไม่มีปัญหาเหล่านี้

โพสต์การทดสอบเฉพาะกิจหลังจากการปฏิเสธการทดสอบ Kruskal-Wallis ซึ่งได้รับการปรับเพื่อการเปรียบเทียบหลายครั้งอาจล้มเหลวในการปฏิเสธการทดสอบแบบคู่ตามลำดับทั้งหมดสำหรับอัตราข้อผิดพลาดที่เหมาะสำหรับครอบครัวหรือได้รับอัตราการค้นพบที่ผิดαสำหรับการทดสอบรถโดยสารเช่นเดียวกับสถานการณ์จำลองการทดสอบรถโดยสาร / หลังการเปรียบเทียบหลายแบบ

หากคุณไม่มีเหตุผลที่จะเชื่อว่าเวลาการอยู่รอดของกลุ่มหนึ่งนั้นยาวหรือสั้นกว่าช่วงเวลาอื่นของกลุ่มคุณควรใช้การทดสอบสองด้าน

การทดสอบของ Dunn สามารถดำเนินการใน Stata โดยใช้dunntest (ชนิดnet describe dunntest, from(https://www.alexisdinno.com/stata)) และใน R โดยใช้แพ็คเกจdunn.test

นอกจากนี้ฉันสงสัยว่าคุณอาจใช้วิธีการวิเคราะห์การอยู่รอดเพื่อประเมินว่าสัตว์ตายหรือไม่ขึ้นอยู่กับเงื่อนไขที่แตกต่างกันหรือไม่?


*การทดสอบโพสต์ hoc แบบคู่ที่ชาญฉลาดน้อยกว่าที่รู้จักเพื่อติดตาม Kruskal-Wallis ที่ถูกปฏิเสธรวมถึง Conover-Iman (เช่น Dunn แต่ขึ้นอยู่กับการแจกแจงแบบtแทนที่จะใช้การแจกแจงzนำมาใช้กับ Stata ในแพ็คเกจconovertestและสำหรับ R ในแพ็คเกจconover.test ) และการทดสอบ Dwass-Steel-Citchlow-Fligner


ขอบคุณสำหรับคำตอบ. การทดสอบ Dunn หรือที่เรียกว่าการทดสอบ Nemenyi-Damico-Wolfe-Dunn หรือเป็นการทดสอบแยกต่างหาก
ฟล็อกซ์ไมดาส

ฉันถามเพราะฉันไม่พบการใช้งานการทดสอบ Dunn ใด ๆ
ฟลอกส Midas

@PhloxMidas ผมไม่ทราบว่าเกี่ยวกับ "การทดสอบ Nemenyi-Damico-วูล์ฟดันน์" แต่วิกิพีเดียหมายถึงมันเป็นที่เหมาะสมโพสต์เฉพาะกิจทดสอบต่อไปนี้การปฏิเสธของการทดสอบรถโดยสารในวัดซ้ำออกแบบเช่นต่อไปนี้การทดสอบฟรีดแมน นอกจากนี้ดูความคิดเห็นของฉันเกี่ยวกับ Stata
Alexis

7

การรวมแบบทั่วไปของ Kruskal-Wallis / Wilcoxon เป็นตัวแบบอัตราต่อรองแบบสัดส่วนซึ่งยอมรับความแตกต่างทั่วไปที่มีช่วงความเชื่อมั่นแบบจุดเดียวหรือพร้อมกันสำหรับอัตราส่วนอัตราต่อรอง สิ่งนี้ถูกนำไปใช้ในrmsแพ็คเกจR ormและcontrast.rmsฟังก์ชั่นของฉัน


1

คุณยังสามารถใช้ความแตกต่างที่สำคัญหลังจาก Conover หรือความแตกต่างที่สำคัญหลังจาก Schaich และ Hamerle อดีตนั้นมีความเสรีมากกว่าในขณะที่ส่วนหลังนั้นแน่นอน แต่ขาดอำนาจเล็กน้อย ทั้งสองวิธีแสดงไว้ในเว็บไซต์ของฉัน brightstat.com และเว็บแอพของ brightstat ช่วยให้คุณสามารถคำนวณความแตกต่างที่สำคัญเหล่านี้และทำการทดสอบหลังทำรายการได้ทันที Kruskal-Wallis บน brightstat.com


-1

หากคุณใช้ SPSS ให้แก้ไข Mann-Whitney ด้วยการแก้ไข Bonferroni (ค่า p หารด้วยจำนวนกลุ่ม)


Mann-Whitney ได้รับความทุกข์ทรมานจากปัญหาทั้งสองที่ฉันระบุในคำตอบของฉันและเป็นการทดสอบหลังการใช้งานที่ไม่เหมาะสมสำหรับ Kruskal-Wallis
Alexis
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.