Mann-Whitney ไม่อ่อนไหวต่อการเปลี่ยนแปลงของความแปรปรวนที่มีค่าเฉลี่ยเท่ากัน แต่สามารถ - ตามที่คุณเห็นด้วยรูปแบบตรวจจับความแตกต่างที่นำไปสู่เบี่ยงเบนจาก (เช่น โดยที่ค่าเฉลี่ยและความแปรปรวนเพิ่มขึ้นด้วยกัน) ค่อนข้างชัดเจนหากคุณมีสองบรรทัดฐานที่มีค่าเฉลี่ยเท่ากันความแตกต่างของพวกเขาจะสมมาตรประมาณศูนย์ ดังนั้นซึ่งเป็นสถานการณ์ว่างP(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(X−Y>0)=12
ตัวอย่างเช่นหากคุณมีการแจกแจงของมีเลขชี้กำลังด้วยค่าเฉลี่ยในขณะที่มีการแจกแจงแบบเอ็กซ์โพเนนเชียลที่มีค่าเฉลี่ย (การเปลี่ยนสเกล) Mann-Whitney นั้นอ่อนไหวกับมัน การเปลี่ยนตำแหน่งและ Mann-Whitney ไม่ได้รับผลกระทบจากการเปลี่ยนแปลงแบบโมโนโทนิก)Y1Xk
-
หากคุณสนใจในการทดสอบที่มีแนวคิดคล้ายกันมากกับ Mann-Whitney ที่ไวต่อความแตกต่างในการแพร่กระจายภายใต้ความเท่าเทียมกันของค่ามัธยฐานมีการทดสอบหลายอย่าง
มีเป็นซีเกล-Tukeyการทดสอบและการทดสอบซารีแบรดลีย์, ตัวอย่างทั้งที่เกี่ยวข้องอย่างใกล้ชิดกับ Mann-Whitney-Wilcoxon ทดสอบสองตัวอย่าง
พวกเขาทั้งสองขึ้นอยู่กับแนวคิดพื้นฐานของการจัดอันดับในจากปลาย
หากคุณใช้ R การทดสอบ Ansari-Bradley จะถูกสร้างขึ้นใน ... ?ansari.test
Siegel-Tukey นั้นใช้การทดสอบ Mann-Whitney-Wilcoxon ในการคำนวณอันดับจากตัวอย่างที่แตกต่างกัน หากคุณจัดอันดับข้อมูลด้วยตัวเองคุณไม่จำเป็นต้องใช้ฟังก์ชันแยกต่างหากสำหรับค่า p อย่างไรก็ตามคุณสามารถหาบางอย่างที่นี่:
http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/
-
(เกี่ยวกับความคิดเห็นของ ttnphns ภายใต้คำตอบเดิมของฉัน)
คุณจะตีความการตอบสนองของฉันมากเกินไปเพื่ออ่านว่าไม่เห็นด้วยกับ @GregSnow ในแง่ที่สำคัญอย่างยิ่ง มีความแตกต่างในการเน้นและในระดับหนึ่งในสิ่งที่เรากำลังพูดถึง แต่ฉันจะแปลกใจมากถ้ามีความขัดแย้งที่แท้จริงมากหลัง
Let 's อ้างแมนน์และวิทนีย์ "สถิติขึ้นอยู่กับการจัดอันดับญาติของ 'และ ' s เสนอสำหรับการทดสอบสมมติฐาน . " นั่นคือชัดเจน; สนับสนุนตำแหน่ง @ GregSnow อย่างเต็มที่Uxyf=g
ตอนนี้เรามาดูวิธีสถิติที่สร้าง: " Letนับจำนวนครั้งที่แจ๋ว .Uyx " ตอนนี้ถ้า null ของพวกเขาเป็นความจริงน่าจะเป็นของเหตุการณ์ที่เป็น ... แต่ มีวิธีอื่นในการรับความน่าจะเป็นที่ 0.5 และในแง่หนึ่งเราอาจตีความว่าการทดสอบนั้นสามารถทำงานได้ในสถานการณ์อื่น เท่าที่พวกเขาประมาณความน่าจะเป็น (ปรับขนาด) ที่ >มันสนับสนุนสิ่งที่ฉันพูด12YX
อย่างไรก็ตามเพื่อให้ระดับความสำคัญที่จะรับประกันว่าถูกต้องแน่นอนคุณต้องมีการกระจายของเพื่อให้ตรงกับการแจกแจงแบบโมฆะ นั่นมาจากการสันนิษฐานว่าการเรียงสับเปลี่ยนทั้งหมดของฉลากและในการสังเกตรวมกันภายใต้ null นั้นมีแนวโน้มเท่ากัน นี้แน่นอนกรณีภายใต้กรัม ตรงตามที่ @GregSnow พูดUXYf=g
คำถามคือขอบเขตที่เป็นกรณีนี้ (นั่นคือการกระจายตัวของสถิติการทดสอบตรงกับที่ได้มาภายใต้สมมติฐานที่หรือประมาณนั้น) สำหรับการแสดงที่ว่างมากขึ้นโดยทั่วไปf=g
ฉันเชื่อว่าในหลาย ๆ สถานการณ์ โดยเฉพาะอย่างยิ่งสำหรับสถานการณ์รวมถึง แต่โดยทั่วไปมากกว่าที่คุณอธิบาย (ประชากรสองคนที่มีค่าเฉลี่ยเท่ากัน แต่ความแปรปรวนที่ไม่เท่ากันอย่างมากสามารถวางนัยทั่วไปได้เล็กน้อยโดยไม่แก้ไขการกระจายที่เกิดขึ้นตามลำดับ) ฉันเชื่อว่า กลายเป็นว่ามีการแจกแจงแบบเดียวกันภายใต้ที่ได้รับมาดังนั้นจึงควรมีผลบังคับใช้ที่นั่น ฉันทำแบบจำลองบางอย่างที่ดูเหมือนจะสนับสนุนสิ่งนี้ อย่างไรก็ตามมันจะไม่เป็นการทดสอบที่มีประโยชน์มาก (อาจมีพลังงานต่ำ)
ฉันเสนอหลักฐานว่ากรณีนี้ไม่มี ฉันใช้การโต้เถียงปรีชา / มือคลื่นและทำแบบจำลองพื้นฐานบางอย่างที่แนะนำว่ามันเป็นความจริง - Mann-Whitney ทำงานได้ (ในที่นี้มีการกระจายที่ 'ถูกต้อง' ภายใต้ค่า null) กว้างกว่าเมื่อ .f=g
ทำสิ่งที่คุณต้องการ แต่ฉันไม่ได้ตีความว่านี่เป็นความขัดแย้งที่สำคัญกับ @GregSnow
ข้อมูลอ้างอิง - เอกสารต้นฉบับของ Mann & Whitney