โปรดทราบว่า Shapiro-Wilk เป็นการทดสอบที่มีประสิทธิภาพของบรรทัดฐาน
วิธีที่ดีที่สุดคือการมีความคิดที่ดีว่ากระบวนการใด ๆ ที่คุณต้องการใช้นั้นมีความอ่อนไหวต่อการไม่ปฏิบัติตามประเภทต่าง ๆ อย่างไร สามารถยอมรับ)
แนวทางแบบไม่เป็นทางการสำหรับการดูแปลงคือการสร้างชุดข้อมูลจำนวนหนึ่งซึ่งเป็นเรื่องปกติที่มีขนาดตัวอย่างเดียวกับขนาดที่คุณมี - (ตัวอย่างเช่นพูด 24 ชุด) พล็อตข้อมูลจริงของคุณท่ามกลางตารางของแปลงดังกล่าว (5x5 ในกรณีของ 24 ชุดสุ่ม) หากไม่ใช่รูปลักษณ์ที่ผิดปกติโดยเฉพาะ (รูปที่แย่ที่สุดพูด) มันก็สมเหตุสมผลกับความเป็นปกติ
ในสายตาของฉันชุดข้อมูล "Z" ที่อยู่ตรงกลางดูคร่าวๆด้วย "o" และ "v" และอาจเป็น "h" ในขณะที่ "d" และ "f" ดูแย่ลงเล็กน้อย "Z" เป็นข้อมูลจริง แม้ว่าฉันจะไม่เชื่อสักครู่ว่ามันเป็นเรื่องปกติ แต่ก็ไม่ได้ดูแปลกอะไรเมื่อเปรียบเทียบกับข้อมูลปกติ
[แก้ไข: ฉันเพิ่งทำแบบสำรวจความคิดเห็นแบบสุ่ม - ดีฉันถามลูกสาวของฉัน แต่ในเวลาที่ค่อนข้างสุ่ม - และการเลือกของเธออย่างน้อยเหมือนเส้นตรงคือ "d" ดังนั้น 100% ของผู้ตอบแบบสำรวจที่คิดว่า "d" นั้นแปลกประหลาดที่สุด]
วิธีการที่เป็นทางการมากกว่านั้นคือการทำแบบทดสอบชาปิโร - ฟรานเซีย (ซึ่งมีพื้นฐานจากความสัมพันธ์ใน QQ- พล็อต) แต่ (ก) มันไม่ได้มีประสิทธิภาพเท่ากับการทดสอบชาปิโรวิลค์และ (ข) การทดสอบอย่างเป็นทางการ คำถาม (บางครั้ง) ที่คุณควรรู้คำตอบอยู่แล้ว (การกระจายข้อมูลของคุณมาจากไม่ตรงตามปกติ) แทนที่จะเป็นคำถามที่คุณต้องการคำตอบ
ตามที่ขอรหัสสำหรับการแสดงด้านบน ไม่มีอะไรเกี่ยวข้องกับแฟนซี:
z = lm(dist~speed,cars)$residual
n = length(z)
xz = cbind(matrix(rnorm(12*n),nr=n),z,matrix(rnorm(12*n),nr=n))
colnames(xz) = c(letters[1:12],"Z",letters[13:24])
opar = par()
par(mfrow=c(5,5));
par(mar=c(0.5,0.5,0.5,0.5))
par(oma=c(1,1,1,1));
ytpos = (apply(xz,2,min)+3*apply(xz,2,max))/4
cn = colnames(xz)
for(i in 1:25) {
qqnorm(xz[,i],axes=FALSE,ylab= colnames(xz)[i],xlab="",main="")
qqline(xz[,i],col=2,lty=2)
box("figure", col="darkgreen")
text(-1.5,ytpos[i],cn[i])
}
par(opar)
โปรดทราบว่านี่เป็นเพียงเพื่อวัตถุประสงค์ในการภาพประกอบ ฉันต้องการชุดข้อมูลขนาดเล็กที่ดูไม่ธรรมดาซึ่งเป็นสาเหตุที่ฉันใช้ส่วนที่เหลือจากการถดถอยเชิงเส้นของข้อมูลรถยนต์ (โมเดลไม่เหมาะสมมาก) อย่างไรก็ตามถ้าฉันสร้างจอแสดงผลสำหรับชุดของการตกต่ำสำหรับการถดถอยฉันจะถอยหลังชุดข้อมูลทั้ง 25ชุดในเดียวกันในรุ่นและแสดง QQ แปลงของส่วนที่เหลือเนื่องจากส่วนที่เหลือมี โครงสร้างไม่แสดงในตัวเลขสุ่มปกติx
(ฉันได้จัดทำแผนเช่นนี้มาตั้งแต่ช่วงกลางยุค 80 อย่างน้อยคุณจะตีความพล็อตได้อย่างไรถ้าคุณไม่คุ้นเคยกับพฤติกรรมที่พวกเขาทำเมื่อมีการตั้งสมมติฐาน - และเมื่อพวกเขาไม่ทำ?)
ดูเพิ่มเติม:
Buja, A. , Cook, D. Hofmann, H. , Lawrence, M. Lee, E.-K. , Swayne, DF และ Wickham, H. (2009) การอนุมานทางสถิติสำหรับการวิเคราะห์ข้อมูลเชิงสำรวจและการวินิจฉัยแบบจำลอง Phil. ทรานส์ ร. A 2009 367, 4361-4383 ดอย: 10.1098 / rsta.2009.0120