ใน R ฉันมีตัวอย่างของการวัด 348 รายการและต้องการทราบว่าฉันสามารถสันนิษฐานได้ว่าการกระจายนั้นปกติสำหรับการทดสอบในอนาคต
โดยพื้นฐานแล้วทำตามคำตอบสแต็คอื่นฉันกำลังดูพล็อตความหนาแน่นและพล็อต QQ ด้วย:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
ฉันไม่มีประสบการณ์ที่ดีในด้านสถิติ แต่พวกเขาดูเหมือนตัวอย่างของการแจกแจงแบบปกติที่ฉันเคยเห็น
จากนั้นฉันก็ทำการทดสอบ Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
ถ้าฉันตีความอย่างถูกต้องมันจะบอกฉันว่ามันปลอดภัยที่จะปฏิเสธสมมติฐานว่างซึ่งก็คือการแจกแจงเป็นเรื่องปกติ
อย่างไรก็ตามฉันได้พบกับโพสต์สแต็คสองโพสต์ ( ที่นี่และที่นี่ ) ซึ่งบ่อนทำลายประโยชน์ของการทดสอบนี้อย่างมาก ดูเหมือนว่าถ้ากลุ่มตัวอย่างมีขนาดใหญ่ (มีการพิจารณาว่าใหญ่เป็น 348 หรือไม่) มันจะพูดเสมอว่าการแจกแจงไม่ปกติ
ฉันจะตีความทั้งหมดนั้นได้อย่างไร ฉันควรติดกับพล็อต QQ และถือว่าการกระจายของฉันเป็นเรื่องปกติหรือไม่?