นิยามมาตรฐานของค่าผิดปกติสำหรับพล็อต Box และ Whisker คือจุดที่อยู่นอกช่วงโดยที่และเป็นควอไทล์ตัวแรกและคือควอไทล์ที่สามของข้อมูล
พื้นฐานสำหรับคำจำกัดความนี้คืออะไร ด้วยคะแนนจำนวนมากแม้การแจกแจงแบบปกติที่สมบูรณ์แบบก็จะส่งกลับค่าผิดปกติ
ตัวอย่างเช่นสมมติว่าคุณเริ่มต้นด้วยลำดับ:
xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025)
ลำดับนี้สร้างการจัดอันดับเปอร์เซ็นต์ของข้อมูล 4,000 จุด
การทดสอบภาวะปกติสำหรับqnorm
ผลลัพธ์ในซีรี่ส์นี้:
shapiro.test(qnorm(xseq))
Shapiro-Wilk normality test
data: qnorm(xseq)
W = 0.99999, p-value = 1
ad.test(qnorm(xseq))
Anderson-Darling normality test
data: qnorm(xseq)
A = 0.00044273, p-value = 1
ผลลัพธ์เป็นไปตามที่คาดไว้: ปกติของการแจกแจงแบบปกติเป็นเรื่องปกติ การสร้างการสร้างข้อมูลแบบตรงqqnorm(qnorm(xseq))
(ตามที่คาดไว้):
หาก boxplot ของข้อมูลเดียวกันถูกสร้างขึ้นboxplot(qnorm(xseq))
ให้สร้างผลลัพธ์:
Boxplot แตกต่างshapiro.test
, ad.test
หรือ qqnorm
ระบุหลายจุดที่เป็นค่าผิดปกติเมื่อขนาดของกลุ่มตัวอย่างที่มีขนาดใหญ่พอสมควร (เช่นในตัวอย่างนี้)