การตีความการทดสอบ Shapiro-Wilk


29

ฉันค่อนข้างใหม่กับสถิติและฉันต้องการความช่วยเหลือจากคุณ
ฉันมีตัวอย่างเล็ก ๆ ดังนี้:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

ฉันรันการทดสอบ Shapiro-Wilk โดยใช้ R:

shapiro.test(precisionH4U$H4U)

และฉันได้ผลลัพธ์ดังนี้

 W = 0.9502, p-value = 0.6921

ทีนี้ถ้าฉันสมมติว่าระดับนัยสำคัญที่ 0.05 กว่าค่า p มีค่ามากกว่า alpha (0.6921> 0.05) และฉันไม่สามารถปฏิเสธสมมติฐานว่างเกี่ยวกับการแจกแจงแบบปกติได้ แต่มันบอกว่าตัวอย่างมีการแจกแจงแบบปกติ ?

ขอบคุณ!

คำตอบ:


28

ไม่ - คุณไม่สามารถพูดว่า "ตัวอย่างมีการแจกแจงแบบปกติ" หรือ "ตัวอย่างมาจากประชากรที่มีการแจกแจงแบบปกติ" แต่มีเพียง "คุณไม่สามารถปฏิเสธสมมติฐานที่ว่ากลุ่มตัวอย่างมาจากประชากรที่มีการแจกแจงแบบปกติ"

ในความเป็นจริงตัวอย่างไม่ได้มีการแจกแจงแบบปกติ (ดูqqplotด้านล่าง) แต่คุณจะไม่คาดหวังให้มันเป็นเพียงตัวอย่าง คำถามเกี่ยวกับการกระจายตัวของประชากรพื้นฐานยังคงเปิดอยู่

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplot ดูเหมือนสวยปกติฉันคิดว่า ... คุณสามารถลองได้qqnorm(rnorm(9))หลายครั้ง ...
อยากรู้อยากเห็น

2
@ โทมัส: อาจจะดีกว่าที่จะพูดว่า "qqplot ดูเหมือนว่ามันอาจมาจากประชากรปกติ" มันอาจมาจากการกระจายที่มีหางที่หนักกว่าแทน
Henry

ใช่qqnorm(runif(9))สามารถให้ผลลัพธ์ที่คล้ายกัน ดังนั้นเราจึงไม่สามารถพูดอะไรจริง ...
อยากรู้อยากเห็น

ความแตกต่างระหว่าง "ตัวอย่างมีการแจกแจงแบบปกติ" และ "ตัวอย่างมาจากประชากรที่มีการแจกแจงแบบปกติ"?
auraham

1
การแจกแจงแบบปกติคือการกระจายอย่างต่อเนื่องตลอดทั้งเรี ตัวอย่าง (จำนวน จำกัด หรือไม่มีที่สิ้นสุดนับไม่ได้) ไม่สามารถมีการแจกแจงแบบนี้ได้แม้ว่าจะถูกดึงมาจากประชากรที่มีการกระจายตัวนี้
เฮนรี่

17

ล้มเหลวในการปฏิเสธสมมติฐานเป็นข้อบ่งชี้ว่ากลุ่มตัวอย่างที่คุณต้องมีขนาดเล็กเกินไปที่จะรับสิ่งที่เบี่ยงเบนไปจากปกติคุณมี - แต่ตัวอย่างของคุณคือเพื่อให้ขนาดเล็กที่เบี่ยงเบนแม้ค่อนข้างมากจากภาวะปกติอาจจะไม่ถูกตรวจพบ

อย่างไรก็ตามการทดสอบสมมุติฐานนั้นค่อนข้างดีกว่ากรณีส่วนใหญ่ที่ผู้คนใช้การทดสอบปกติ - คุณรู้คำตอบของคำถามที่คุณกำลังทดสอบ - การกระจายตัวของประชากรจากข้อมูลของคุณจะไม่เป็นไปตามปกติ . (บางครั้งมันอาจใกล้เคียงกัน แต่จริง ๆ แล้วเป็นเรื่องปกติใช่ไหม)

คำถามที่คุณควรใส่ใจไม่ใช่ 'คือการกระจายที่พวกเขาดึงมาจากปกติ' (ไม่เป็น) คำถามที่คุณควรให้ความสนใจนั้นเป็นเหมือน 'การเบี่ยงเบนจากภาวะปกติที่ฉันจะส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ของฉันหรือไม่' หากนั่นอาจเป็นปัญหาคุณอาจพิจารณาการวิเคราะห์ที่มีโอกาสน้อยกว่าที่จะมีปัญหานั้น


10

เมื่อพิจารณาว่าคุณค่อนข้างใหม่กับสถิติฉันสงสัยว่าคุณกำลังคิดเกี่ยวกับสิ่งนี้เพราะสิ่งเหล่านี้เป็นค่าประมาณค่าเฉลี่ยและคุณต้องการที่จะรู้ว่าสมมติฐานของความเป็นมาตรฐานใช้ได้กับการประมาณการความเชื่อมั่นโดยใช้การแจกแจงแบบt

t test ค่อนข้างแข็งแกร่งต่อการละเมิดสมมติฐานนี้ข้อมูลดูคลุมเครือในแผนการของ qq ของ Henry และการทดสอบ Shapiro ไม่ได้ระบุว่าข้อมูลมาจากประชากรที่มีการกระจายที่ไม่ปกติดังนั้นฉันจะบอกว่า -test มีความเหมาะสมt

ฉันคาดเดาเพิ่มเติมว่าคุณกำลังดูสัดส่วนซึ่งในกรณีนี้คุณสามารถใช้การแจกแจงทวินามถ้าคุณกังวลเกี่ยวกับการละเมิดสมมติฐาน

หากเป็นข้อกังวลอื่น ๆ ที่ให้คุณเข้ารับการทดสอบชาปิโรส์คุณสามารถเพิกเฉยต่อทุกสิ่งที่ฉันเพิ่งพูดไป


คุณเข้าใจถูกต้องฉันต้องการทราบว่าฉันสามารถใช้การทดสอบ t สำหรับตัวอย่างของฉัน ขอบคุณ!
จาคุบ

4

อย่างที่เฮนรี่พูดแล้วคุณไม่สามารถพูดได้ว่าเป็นเรื่องปกติ ลองใช้คำสั่งต่อไปนี้ใน R หลาย ๆ ครั้ง:

shapiro.test(runif(9)) 

จะทดสอบตัวอย่างตัวเลข 9 ตัวจากการกระจายตัวแบบสม่ำเสมอ หลายครั้งที่ค่า p จะมีค่ามากกว่า 0.05 ซึ่งหมายความว่าคุณไม่สามารถสรุปได้ว่าการแจกแจงเป็นปกติ


4

ฉันยังมองหาวิธีการตีความค่าWอย่างถูกต้องในการทดสอบ Shapiro-Wilk และจากบทความของEmil OW Kirkegaard " ค่า W จากการทดสอบ Shapiro-Wilk ที่มองเห็นด้วยชุดข้อมูลที่แตกต่างกัน " มันยากมากที่จะพูดอะไรเกี่ยวกับ การกระจายดูที่ค่าWเพียงอย่างเดียว

ในขณะที่เขากล่าวสรุป:

โดยทั่วไปเราจะเห็นว่าได้รับตัวอย่างจำนวนมาก SW มีความอ่อนไหวต่อการออกจากที่ไม่เป็นปกติ อย่างไรก็ตามการออกเดินทางมีน้อยมากมันไม่สำคัญ

เรายังเห็นว่าเป็นการยากที่จะลดค่า W แม้ว่าจะพยายามอย่างใดอย่างหนึ่งก็ตาม เราจำเป็นต้องทดสอบการกระจายที่ไม่ปกติอย่างมากเพื่อให้มันลดลงอย่างมีนัยสำคัญต่ำกว่า 0.99

ดูบทความต้นฉบับสำหรับข้อมูลเพิ่มเติม


1

หนึ่งในประเด็นสำคัญที่ไม่ได้กล่าวถึงโดยคำตอบก่อนหน้าคือข้อ จำกัด การทดสอบ:

การทดสอบมีข้อ จำกัด ที่สำคัญที่สุดที่ทดสอบมีอคติตามขนาดตัวอย่าง ยิ่งตัวอย่างมีขนาดใหญ่เท่าใดคุณก็จะยิ่งได้ผลลัพธ์ที่มีนัยสำคัญทางสถิติมากเท่านั้น

หากต้องการตอบคำถามเดิม (ขนาดตัวอย่างน้อยมาก): ดูบทความต่อไปนี้เกี่ยวกับทางเลือกที่ดีกว่าเช่นพล็อต QQ และฮิสโตแกรมสำหรับกรณีเฉพาะนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.