ความแตกต่างระหว่างการทดสอบ ANOVA และ Kruskal-Wallis


20

ฉันกำลังเรียน R และได้ทำการทดลองกับการวิเคราะห์ความแปรปรวน ฉันวิ่งมาทั้งคู่แล้ว

kruskal.test(depVar ~ indepVar, data=df)

และ

anova(lm(depVar ~ indepVar, data=dF))

มีความแตกต่างในทางปฏิบัติระหว่างการทดสอบทั้งสองนี้หรือไม่? ความเข้าใจของฉันคือพวกเขาทั้งสองประเมินสมมติฐานว่างว่าประชากรมีค่าเฉลี่ยเท่ากัน

คำตอบ:


28

มีความแตกต่างในสมมติฐานและสมมติฐานที่ทดสอบ

ANOVA (และ t-test) เป็นการทดสอบความเท่าเทียมของค่านิยมอย่างชัดเจน Kruskal-Wallis (และ Mann-Whitney) สามารถมองเห็นได้ในทางเทคนิคการเปรียบเทียบของค่าเฉลี่ยการจัดอันดับ

ดังนั้นในแง่ของค่าเดิมที่ Kruskal-Wallis มากขึ้นทั่วไปกว่าเปรียบเทียบหมายถึง: การทดสอบว่าน่าจะเป็นที่สังเกตสุ่มจากแต่ละกลุ่มเป็นอย่างเท่าเทียมกันมีแนวโน้มที่จะสูงหรือต่ำกว่าการสังเกตการสุ่มจากกลุ่มอื่น ปริมาณข้อมูลจริงที่อ้างอิงว่าการเปรียบเทียบไม่ใช่ความแตกต่างในค่าเฉลี่ยและความแตกต่างของค่ามัธยฐาน (ในกรณีตัวอย่างทั้งสอง) จริง ๆ แล้วค่ามัธยฐานของความแตกต่างแบบคู่ทั้งหมด - ความแตกต่างระหว่าง Hodges-Lehmann ระหว่างตัวอย่าง

อย่างไรก็ตามหากคุณเลือกที่จะตั้งสมมติฐานที่ จำกัด คุณสามารถมองเห็น Kruskal-Wallis เป็นการทดสอบความเท่าเทียมกันของค่าเฉลี่ยของประชากรรวมถึงปริมาณ (เช่นค่ามัธยฐาน) และมาตรการอื่น ๆ อีกมากมาย นั่นคือถ้าคุณคิดว่ากลุ่มกระจายอยู่ภายใต้สมมติฐานที่เหมือนกันและว่าภายใต้ทางเลือกการเปลี่ยนแปลงเพียงอย่างเดียวคือการกระจายกะ (ที่เรียกว่า " ทางเลือกที่ตั้งกะ ") แล้วก็ยังมีการทดสอบ ของความเท่าเทียมกันของค่าเฉลี่ยประชากร (และในเวลาเดียวกัน, ค่ามัธยฐาน, ควอไทล์ที่ต่ำลง, ฯลฯ )

[หากคุณใช้สมมติฐานนั้นคุณสามารถได้รับการประมาณการและช่วงเวลาสำหรับการเลื่อนแบบสัมพัทธ์เช่นเดียวกับที่คุณทำกับ ANOVA มันเป็นไปได้ที่จะได้รับช่วงเวลาโดยไม่มีข้อสันนิษฐานนั้น แต่มันยากที่จะตีความ]

หากคุณดูคำตอบที่นี่โดยเฉพาะอย่างยิ่งในตอนท้ายมันจะกล่าวถึงการเปรียบเทียบระหว่าง t-test กับ Wilcoxon-Mann-Whitney ซึ่ง (เมื่อทำการทดสอบสองแบบเป็นอย่างน้อย) จะเทียบเท่า ANOVA และ Kruskal-Wallis นำไปใช้กับการเปรียบเทียบเพียงสองตัวอย่าง; มันให้รายละเอียดเล็ก ๆ น้อย ๆ และการอภิปรายส่วนใหญ่นำไปสู่ ​​Kruskal-Wallis vs ANOVA

ยังไม่ชัดเจนว่าคุณหมายถึงอะไรโดยความแตกต่างในทางปฏิบัติ คุณใช้พวกเขาในวิธีที่คล้ายกันโดยทั่วไป เมื่อมีการใช้สมมติฐานทั้งสองชุดพวกเขามักจะให้ผลลัพธ์ที่คล้ายคลึงกัน แต่พวกเขาสามารถให้ค่า p ที่แตกต่างกันอย่างเป็นธรรมในบางสถานการณ์

แก้ไข: นี่คือตัวอย่างของความคล้ายคลึงกันของการอนุมานแม้ในกลุ่มตัวอย่างขนาดเล็ก - นี่คือขอบเขตการยอมรับร่วมกันสำหรับการเลื่อนตำแหน่งระหว่างสามกลุ่ม (กลุ่มที่สองและกลุ่มที่สามเปรียบเทียบกับกลุ่มแรก) ตัวอย่างจากการแจกแจงแบบปกติ สำหรับชุดข้อมูลเฉพาะที่ระดับ 5%:

ภูมิภาคที่ยอมรับสำหรับความแตกต่างของตำแหน่งใน Kruskal-Wallis และ Anova

คุณสมบัติที่น่าสนใจมากมายสามารถมองเห็นได้ - ขอบเขตการยอมรับที่ใหญ่ขึ้นเล็กน้อยสำหรับ KW ในกรณีนี้โดยมีขอบเขตประกอบด้วยส่วนของเส้นตรงแนวตั้งแนวนอนและแนวทแยง (มันไม่ยากที่จะคิดว่าทำไม) ภูมิภาคทั้งสองบอกเราถึงสิ่งที่คล้ายกันมากเกี่ยวกับพารามิเตอร์ที่น่าสนใจที่นี่


2
+1 ฉันกล้าแก้ไขมันเล็กน้อยเพื่อเพิ่มจุดเน้นที่ฉันคิดว่าจำเป็น โปรดดูตอนนี้ไม่ว่าคุณจะเห็นด้วยหรือไม่
ttnphns

@ttnphns ขอบคุณสำหรับการแก้ไข มีเหตุผลบางอย่างที่ทำให้บางสิ่งที่คุณเปลี่ยนแปลงอยู่ในนั้นดังนั้นฉันอาจแก้ไขต้นฉบับบางส่วนกลับมาได้อย่างไรก็ตามบางทีฉันควรทำให้ชัดเจนขึ้นว่าทำไมฉันจึงเขียนเหมือนที่ฉันเคยมี แต่ก่อนอื่นฉันต้องคิดอย่างรอบคอบว่าจะเก็บการเปลี่ยนแปลงของคุณให้ดีที่สุดเท่าที่จะทำได้
Glen_b -Reinstate Monica

4

ใช่แล้ว The anovaเป็นวิธีการแบบพารามิเตอร์ขณะที่kruskal.testไม่ใช่แบบแบบพารามิเตอร์ ดังนั้น kruskal.testไม่จำเป็นต้องมีข้อสันนิษฐานการกระจาย
จากมุมมองที่ใช้งานได้จริงเมื่อข้อมูลของคุณเบ้ก็anovaไม่ใช่วิธีการที่ดีที่จะใช้ มีลักษณะที่คำถามนี้เช่น


4
ฉันจะบอกว่า Kruskal-Wallis ANOVA ทำให้สมมติฐานเกี่ยวกับการผ่อนคลายกระจายเมื่อเทียบกับพารา ANOVA: การสังเกตในแต่ละกลุ่มมาจากประชากรที่มีรูปร่างคล้ายกัน Heteroskedasticity หรือการแจกแจงแบบเบ้สูงยังคงเป็นปัญหาเหมือนกับการทดสอบแบบดั้งเดิม
chl

2
@chl เป็นอย่างไร อันดับจะไม่เปลี่ยนแปลงตามความเบ้และ KW เป็นอันดับตาม ฉันพลาดอะไรไป
Peter Flom - Reinstate Monica

6
3/π

H0

1
@ StéphaneLaurentหากรูปร่างไม่เหมือนกันอาจนำไปสู่การอนุมานที่ไม่ดี ดูตัวอย่างของฉันที่นี่
ขวด

3

Δป้อนคำอธิบายรูปภาพที่นี่

()H0:{Δ=0}H1:{Δ0}()H0H0)()H0:{the distributions are equal}

()Δ>0Δ

xyn=1000H0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

ป้อนคำอธิบายรูปภาพที่นี่

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

ตามที่ฉันอ้างในตอนแรกฉันไม่แน่ใจเกี่ยวกับการสร้าง KW ที่แม่นยำ บางทีคำตอบของฉันอาจจะถูกต้องมากขึ้นสำหรับการทดสอบแบบไม่มีพารามิเตอร์อื่น (Mann-Whitney? .. ) แต่วิธีการนั้นควรจะคล้ายกัน


1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionดังที่ได้กล่าวไว้ในคำตอบของเกลนความคิดเห็นและสถานที่อื่น ๆ ในเว็บไซต์นี้มันเป็นเรื่องจริง แต่เป็นการอ่านที่แคบลงในสิ่งที่การทดสอบทำ same shape/dispersionจริง ๆ แล้วไม่ใช่ Intrinsic แต่เป็นข้อสันนิษฐานเพิ่มเติมที่ใช้ในบางสถานการณ์และไม่ใช้ในสถานการณ์อื่น
ttnphns

ป.ล. ตัวอย่างที่ 2 ของคุณไม่ขัดแย้งหรือหักล้างการทดสอบ KW การทดสอบ H0 นั้นไม่ distributions are equalได้เป็นความคิดที่ผิด H0 เป็นเพียงแค่ว่าจุดสองจุดของ "การรวมตัวของความโน้มถ่วง" ไม่เบี่ยงเบนจากกันและกัน
ttnphns

H0

1
krusal.test()H0

1
ใช่. the equality of the location parameters of the distributionเป็นสูตรที่ถูกต้อง (แม้ว่า "สถานที่" ไม่ควรคิดว่าเป็นเพียงค่าเฉลี่ยหรือค่ามัธยฐานในกรณีทั่วไป) ถ้าคุณถือว่ารูปร่างเดียวกันดังนั้น H0 เดียวกันนี้จะกลายเป็น "การแจกแจงที่เหมือนกัน"
ttnphns

0

Kruskal-Wallis จัดอันดับตามแทนที่จะเป็นฐานมูลค่า สิ่งนี้สามารถสร้างความแตกต่างอย่างมากหากมีการแจกแจงแบบเบ้หรือกรณีที่รุนแรง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.