Mann-Whitney สมมติฐานว่างภายใต้ความแปรปรวนไม่เท่ากัน


9

ฉันแค่อยากรู้เกี่ยวกับสมมติฐานว่างของการทดสอบ Mann-Whitney U ฉันมักจะเห็นว่ามันระบุว่าสมมติฐานว่างคือว่าประชากรสองคนมีการแจกแจงเท่ากัน แต่ฉันกำลังคิดว่า - ถ้าฉันมีประชากรปกติสองคนที่มีค่าเฉลี่ยเท่ากัน แต่มีความแปรปรวนไม่เท่ากันการทดสอบ Mann-Whitney คงไม่สามารถตรวจจับความแตกต่างนี้ได้

ฉันได้เห็นด้วยเช่นกันว่าด้วยสมมติฐานว่างของการทดสอบแมนน์ - วิทนีย์คือหรือความน่าจะเป็นที่จะสังเกตจากประชากรหนึ่ง ( X ) เกินกว่าการสังเกตจากประชากรที่สอง ( Y ) การยกเว้นความสัมพันธ์) เท่ากับ 0.5 สิ่งนี้ดูเหมือนจะสมเหตุสมผลมากกว่า แต่ก็ไม่เทียบเท่ากับสมมติฐานว่างแรกที่ฉันกล่าวไว้Pr(X>Y)=0.5XY

ฉันหวังว่าจะได้รับความช่วยเหลือเล็กน้อยจากการแก้ปัญหานี้ ขอบคุณ!

คำตอบ:


5

การทดสอบ Mann-Whitney เป็นกรณีพิเศษของการทดสอบการเปลี่ยนรูป (การแจกแจงภายใต้ค่า Null นั้นได้มาจากการดูการเรียงสับเปลี่ยนของข้อมูลที่เป็นไปได้ทั้งหมด) และการทดสอบการเปลี่ยนรูปจะมีค่า Null เหมือนกับการแจกแจงแบบเดียวกัน

วิธีคิดวิธีหนึ่งของสถิติการทดสอบแมนน์ - วิทนีย์เป็นการวัดจำนวนครั้งที่สุ่มเลือกค่าจากกลุ่มหนึ่งเกินกว่าค่าที่เลือกแบบสุ่มจากกลุ่มอื่น ดังนั้น P (X> Y) = 0.5 ก็สมเหตุสมผลแล้วและนี่คือคุณสมบัติทางเทคนิคของการแจกแจงที่เท่ากันเป็นโมฆะ หากการแจกแจง 2 เหมือนกันดังนั้นความน่าจะเป็นของ X ที่มากกว่า Y เท่ากับ 0.5 เนื่องจากทั้งคู่ต่างจากการแจกแจงแบบเดียวกัน

กรณีที่ระบุไว้ของ 2 ดิสทริบิวชันที่มีค่าเฉลี่ยเท่ากัน แต่มีความแปรปรวนต่างกันตรงกับสมมติฐานว่างที่ 2 แต่ไม่ใช่ 1 ของการแจกแจงที่เหมือนกัน เราสามารถทำการจำลองเพื่อดูว่าเกิดอะไรขึ้นกับค่า p ในกรณีนี้ (ในทางทฤษฎีพวกมันควรจะกระจายอย่างสม่ำเสมอ):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

ชัดเจนว่านี่คือการปฏิเสธบ่อยกว่าที่ควรและสมมติฐานว่างเป็นเท็จ (ตรงกับความเท่าเทียมกันของการแจกแจง แต่ไม่ใช่ prob = 0.5)

คิดในแง่ของความน่าจะเป็นของ X> Y ยังวิ่งเข้าไปในปัญหาที่น่าสนใจบางอย่างถ้าคุณเคยเปรียบเทียบประชากรที่อยู่บนพื้นฐานEfron ของลูกเต๋า


สวัสดีเกร็กขอบคุณสำหรับคำตอบ ดูเหมือนว่าสิ่งที่คุณพูดคือฉันพบว่าเป็นกรณีพิเศษที่การทดสอบไม่ทำงานอย่างถูกต้องภายใต้การแจกแจงที่เท่ากันเป็นโมฆะ และนอกจากนี้สมมติฐานว่างที่ฉันกล่าวไว้ไม่เท่ากัน ถูกต้องไหม
Jimj

4

Mann-Whitney ไม่อ่อนไหวต่อการเปลี่ยนแปลงของความแปรปรวนที่มีค่าเฉลี่ยเท่ากัน แต่สามารถ - ตามที่คุณเห็นด้วยรูปแบบตรวจจับความแตกต่างที่นำไปสู่เบี่ยงเบนจาก (เช่น โดยที่ค่าเฉลี่ยและความแปรปรวนเพิ่มขึ้นด้วยกัน) ค่อนข้างชัดเจนหากคุณมีสองบรรทัดฐานที่มีค่าเฉลี่ยเท่ากันความแตกต่างของพวกเขาจะสมมาตรประมาณศูนย์ ดังนั้นซึ่งเป็นสถานการณ์ว่างP(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

ตัวอย่างเช่นหากคุณมีการแจกแจงของมีเลขชี้กำลังด้วยค่าเฉลี่ยในขณะที่มีการแจกแจงแบบเอ็กซ์โพเนนเชียลที่มีค่าเฉลี่ย (การเปลี่ยนสเกล) Mann-Whitney นั้นอ่อนไหวกับมัน การเปลี่ยนตำแหน่งและ Mann-Whitney ไม่ได้รับผลกระทบจากการเปลี่ยนแปลงแบบโมโนโทนิก)Y1Xk

-

หากคุณสนใจในการทดสอบที่มีแนวคิดคล้ายกันมากกับ Mann-Whitney ที่ไวต่อความแตกต่างในการแพร่กระจายภายใต้ความเท่าเทียมกันของค่ามัธยฐานมีการทดสอบหลายอย่าง

มีเป็นซีเกล-Tukeyการทดสอบและการทดสอบซารีแบรดลีย์, ตัวอย่างทั้งที่เกี่ยวข้องอย่างใกล้ชิดกับ Mann-Whitney-Wilcoxon ทดสอบสองตัวอย่าง

พวกเขาทั้งสองขึ้นอยู่กับแนวคิดพื้นฐานของการจัดอันดับในจากปลาย

หากคุณใช้ R การทดสอบ Ansari-Bradley จะถูกสร้างขึ้นใน ... ?ansari.test

Siegel-Tukey นั้นใช้การทดสอบ Mann-Whitney-Wilcoxon ในการคำนวณอันดับจากตัวอย่างที่แตกต่างกัน หากคุณจัดอันดับข้อมูลด้วยตัวเองคุณไม่จำเป็นต้องใช้ฟังก์ชันแยกต่างหากสำหรับค่า p อย่างไรก็ตามคุณสามารถหาบางอย่างที่นี่:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(เกี่ยวกับความคิดเห็นของ ttnphns ภายใต้คำตอบเดิมของฉัน)

คุณจะตีความการตอบสนองของฉันมากเกินไปเพื่ออ่านว่าไม่เห็นด้วยกับ @GregSnow ในแง่ที่สำคัญอย่างยิ่ง มีความแตกต่างในการเน้นและในระดับหนึ่งในสิ่งที่เรากำลังพูดถึง แต่ฉันจะแปลกใจมากถ้ามีความขัดแย้งที่แท้จริงมากหลัง

Let 's อ้างแมนน์และวิทนีย์ "สถิติขึ้นอยู่กับการจัดอันดับญาติของ 'และ ' s เสนอสำหรับการทดสอบสมมติฐาน . " นั่นคือชัดเจน; สนับสนุนตำแหน่ง @ GregSnow อย่างเต็มที่Uxyf=g

ตอนนี้เรามาดูวิธีสถิติที่สร้าง: " Letนับจำนวนครั้งที่แจ๋ว .Uyx " ตอนนี้ถ้า null ของพวกเขาเป็นความจริงน่าจะเป็นของเหตุการณ์ที่เป็น ... แต่ มีวิธีอื่นในการรับความน่าจะเป็นที่ 0.5 และในแง่หนึ่งเราอาจตีความว่าการทดสอบนั้นสามารถทำงานได้ในสถานการณ์อื่น เท่าที่พวกเขาประมาณความน่าจะเป็น (ปรับขนาด) ที่ >มันสนับสนุนสิ่งที่ฉันพูด12YX

อย่างไรก็ตามเพื่อให้ระดับความสำคัญที่จะรับประกันว่าถูกต้องแน่นอนคุณต้องมีการกระจายของเพื่อให้ตรงกับการแจกแจงแบบโมฆะ นั่นมาจากการสันนิษฐานว่าการเรียงสับเปลี่ยนทั้งหมดของฉลากและในการสังเกตรวมกันภายใต้ null นั้นมีแนวโน้มเท่ากัน นี้แน่นอนกรณีภายใต้กรัม ตรงตามที่ @GregSnow พูดUXYf=g

คำถามคือขอบเขตที่เป็นกรณีนี้ (นั่นคือการกระจายตัวของสถิติการทดสอบตรงกับที่ได้มาภายใต้สมมติฐานที่หรือประมาณนั้น) สำหรับการแสดงที่ว่างมากขึ้นโดยทั่วไปf=g

ฉันเชื่อว่าในหลาย ๆ สถานการณ์ โดยเฉพาะอย่างยิ่งสำหรับสถานการณ์รวมถึง แต่โดยทั่วไปมากกว่าที่คุณอธิบาย (ประชากรสองคนที่มีค่าเฉลี่ยเท่ากัน แต่ความแปรปรวนที่ไม่เท่ากันอย่างมากสามารถวางนัยทั่วไปได้เล็กน้อยโดยไม่แก้ไขการกระจายที่เกิดขึ้นตามลำดับ) ฉันเชื่อว่า กลายเป็นว่ามีการแจกแจงแบบเดียวกันภายใต้ที่ได้รับมาดังนั้นจึงควรมีผลบังคับใช้ที่นั่น ฉันทำแบบจำลองบางอย่างที่ดูเหมือนจะสนับสนุนสิ่งนี้ อย่างไรก็ตามมันจะไม่เป็นการทดสอบที่มีประโยชน์มาก (อาจมีพลังงานต่ำ)

ฉันเสนอหลักฐานว่ากรณีนี้ไม่มี ฉันใช้การโต้เถียงปรีชา / มือคลื่นและทำแบบจำลองพื้นฐานบางอย่างที่แนะนำว่ามันเป็นความจริง - Mann-Whitney ทำงานได้ (ในที่นี้มีการกระจายที่ 'ถูกต้อง' ภายใต้ค่า null) กว้างกว่าเมื่อ .f=g

ทำสิ่งที่คุณต้องการ แต่ฉันไม่ได้ตีความว่านี่เป็นความขัดแย้งที่สำคัญกับ @GregSnow

ข้อมูลอ้างอิง - เอกสารต้นฉบับของ Mann & Whitney


ฉันไม่ได้รับสิทธิที่คุณเห็นด้วยกับคำพูดนี้จากหน้าพูดคุยวิกิพีเดีย the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observationMann-Whitney: คุณไม่เห็นด้วยกับคำตอบของ @ Greg ใช่ไหม
ttnphns

ฉันได้เพิ่มการสนทนาบางส่วนในการแก้ไข
Glen_b -Reinstate Monica

นอกจากนี้ที่ดีมาก ฉันจะศึกษามัน (ฉันมักจะรู้สึกราวกับว่ามีความแตกต่างในการทดสอบ MW ที่ยังคงหลบหลีกฉัน) ในขณะเดียวกันคุณจะเห็นด้วยหรือไม่ถ้าฉันจะพูดว่า: "เนื่องจากสถิติการทดสอบ MW สะท้อนให้เห็นถึงความเท่าเทียมกันของค่าเฉลี่ย (ใน) จึงอาจมีสถานการณ์เมื่อ f ~ = g [ฉันเข้าใจ f, g เป็นการกระจายแบบดั้งเดิม การทดสอบไม่มีความเกี่ยวข้องอย่างเต็มที่เนื่องจากมันยังคงจัดการกับ H0 เดียวกันภายใต้ f = g ตัวอย่างของสถานการณ์เช่นนี้คือการแจกแจงแบบสมมาตรเหมือนกันอย่างสมบูรณ์ยกเว้นพารามิเตอร์การแพร่กระจาย (ความแปรปรวน) "
ttnphns

ในสัญกรณ์ (แมนน์และวิทนีย์โดยวิธีการ),และมีความหนาแน่นของและYฉันยอมรับว่าในกรณีที่ฉันได้รับการตรวจสอบ / ทำความเข้าใจกับสถานการณ์งบของคุณดูเหมือนจะเป็นกรณี ฉันสงสัยว่ามันยังมีมากมายเกี่ยวกับ Mann-Whitney ที่หลบเลี่ยงฉันด้วย fgXY
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.