สมมติว่าสถานการณ์ต่อไปนี้:
เรามีจำนวนมาก (เช่น 20) กับกลุ่มขนาดเล็ก (เช่น n = 3) ฉันสังเกตเห็นว่าถ้าฉันสร้างค่าจากการกระจายแบบสม่ำเสมอส่วนที่เหลือจะดูปกติประมาณแม้ว่าการกระจายข้อผิดพลาดจะเหมือนกัน รหัส R ต่อไปนี้แสดงให้เห็นถึงพฤติกรรมนี้:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
ถ้าฉันดูตัวอย่างที่เหลือในกลุ่มที่สามเหตุผลของพฤติกรรมชัดเจน:
เนื่องจากเป็นผลรวมของตัวแปรสุ่มที่มีค่าเบี่ยงเบนมาตรฐานไม่ต่างกันประมาณการแจกแจงการแจกแจงจึงค่อนข้างใกล้เคียงกับการแจกแจงปกติมากกว่าคำศัพท์แต่ละคำ
ตอนนี้สมมติว่าฉันมีสถานการณ์เดียวกันกับข้อมูลจริงแทนที่จะเป็นข้อมูลจำลอง ฉันต้องการประเมินว่าสมมติฐานของ ANOVA เกี่ยวกับความเป็นมาตรฐานอยู่หรือไม่ ขั้นตอนที่แนะนำส่วนใหญ่แนะนำให้ตรวจสอบภาพตกค้าง (เช่น QQ-Plot) หรือการทดสอบความเป็นปกติของสิ่งตกค้าง ตามตัวอย่างของฉันด้านบนนี้ไม่เหมาะสำหรับขนาดกลุ่มเล็ก
มีทางเลือกที่ดีกว่านี้หรือไม่เมื่อฉันมีขนาดเล็กหลายกลุ่ม?