นี่เป็นคำถามติดตามผลถึงสิ่งที่ Frank Harrell เขียนไว้ที่นี่ :
จากประสบการณ์ของฉันขนาดตัวอย่างที่ต้องการสำหรับการแจกแจงแบบ t นั้นแม่นยำมักจะใหญ่กว่าขนาดตัวอย่างในมือ การทดสอบ Wilcoxon ที่ได้รับการจัดอันดับนั้นมีประสิทธิภาพอย่างที่คุณพูดและมีความแข็งแกร่งดังนั้นฉันจึงมักจะชอบมากกว่าการทดสอบ t
ถ้าฉันเข้าใจถูกต้อง - เมื่อเปรียบเทียบตำแหน่งของตัวอย่างที่ไม่ตรงกันสองตัวอย่างเราต้องการใช้การทดสอบยศวิลคอกซันเหนือการทดสอบทีไม่มีคู่ถ้าขนาดตัวอย่างของเรามีขนาดเล็ก
มีสถานการณ์ทางทฤษฎีที่เราต้องการทดสอบ Wilcoxon rank-sum มากกว่าการทดสอบ t-unpaired แม้ว่าขนาดตัวอย่างของทั้งสองกลุ่มของเรานั้นค่อนข้างใหญ่หรือไม่?
แรงจูงใจของฉันสำหรับคำถามนี้เกิดจากการสังเกตว่าสำหรับการทดสอบตัวอย่าง t-test เพียงอย่างเดียวการใช้มันสำหรับการแจกแจงแบบเบ้เล็กน้อยที่ไม่ดังขนาดนั้นจะทำให้เกิดข้อผิดพลาดประเภท I ที่ผิด:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error