การแจกจ่ายของฉันเป็นเรื่องปกติ การทดสอบ Kolmogorov-Smirnov ไม่เห็นด้วย


15

ฉันมีปัญหากับค่าปกติของข้อมูลบางอย่างที่ฉันมี: ฉันได้ทำการทดสอบ Kolmogorov ซึ่งบอกว่ามันไม่ปกติกับ p = .0000 ฉันไม่เข้าใจ: ความเบ้ของการกระจายของฉัน = -. 497 และ kurtosis = -0,024

นี่คือพล็อตเรื่องการกระจายตัวของฉันซึ่งดูธรรมดามาก ...

(ฉันมีสามคะแนนและแต่ละคะแนนนี้ไม่ปกติกับค่า p ที่สำคัญสำหรับการทดสอบ Kolmogorov ... ฉันไม่เข้าใจจริงๆ)

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่


11
คุณรู้ได้อย่างไรว่าเป็นเรื่องปกติ มันดูไม่ปกติสำหรับฉัน ดูเหมือนจะเอียงไปทางซ้าย
mark999

1
ทำไมคุณต้องทดสอบความเป็นปกติ?
Jack Aidley

คำตอบ:


39
  1. คุณไม่มีหลักฐานยืนยันว่าข้อมูลของคุณเป็นเรื่องปกติ แม้ว่าโด่งเบ้และส่วนเกินของคุณทั้งสองได้ว่า 0 ที่ไม่ได้บ่งบอกถึงข้อมูลของคุณเป็นเรื่องปกติ ในขณะที่ความเบ้และความรุนแรงอยู่ห่างไกลจากค่าที่คาดหวังแสดงให้เห็นว่าไม่ใช่เรื่องปกติ แต่การสนทนาไม่ได้ถือ มีการแจกแจงที่ไม่ปกติที่มีความเบ้และความหนาเหมือนปกติ ตัวอย่างมีการกล่าวถึงที่นี่ความหนาแน่นของการทำซ้ำด้านล่าง:
    dgam 2.3

    อย่างที่คุณเห็นมันเป็น bimodal อย่างชัดเจน ในกรณีนี้การแจกแจงแบบสมมาตรตราบเท่าที่มีเวลาเพียงพอการวัดความเบ้ทั่วไปจะเป็น 0 (จริง ๆ แล้วทุกมาตรการปกติจะเป็น) สำหรับ kurtosis การมีส่วนร่วมในช่วงเวลาที่ 4 จากภูมิภาคใกล้เคียงกับค่าเฉลี่ยจะทำให้ kurtosis มีขนาดเล็กลง แต่หางค่อนข้างหนักซึ่งมีแนวโน้มที่จะทำให้มันใหญ่ขึ้น หากคุณเลือกที่ถูกต้อง Kurtosis จะออกมาเหมือนกันตามปกติ

  2. ความเบ้ตัวอย่างของคุณอยู่ที่ประมาณ -0.5 ซึ่งเป็นการชี้นำของความเบ้ซ้ายเล็กน้อย ฮิสโตแกรมและพล็อต QQ ทั้งคู่บ่งบอกถึงสิ่งเดียวกัน - การกระจายแบบเบ้ซ้ายเบา ๆ (ความเบ้เล็กน้อยเช่นนี้ไม่น่าจะเป็นปัญหาสำหรับกระบวนการทางทฤษฎีทั่วไปทั่วไป)

  3. คุณกำลังมองหาที่ตัวชี้วัดที่แตกต่างกันของการไม่ปกติที่คุณไม่ควรคาดหวังว่าจะเห็นด้วยเบื้องต้นเนื่องจากพวกเขาพิจารณาประเด็นที่แตกต่างกันของการกระจาย; ด้วยตัวอย่างที่ไม่ธรรมดาขนาดเล็กอย่างอ่อนโยนพวกเขามักจะไม่เห็นด้วย


ทีนี้คำถามใหญ่: * ทำไมคุณต้องทดสอบความเป็นปกติ? *

[แก้ไขโดยตอบกลับจากความคิดเห็น:]

ฉันไม่แน่ใจจริงๆ แต่ฉันควรทำ ANOVA ก่อน

มีหลายจุดที่ต้องทำที่นี่

ผม. เรื่องธรรมดาสามัญคือข้อสันนิษฐานของ ANOVA ถ้าคุณใช้มันเพื่ออนุมาน (เช่นการทดสอบสมมติฐาน) แต่มันไม่ไวต่อการมองในกลุ่มตัวอย่างขนาดใหญ่โดยเฉพาะอย่างยิ่งไม่ไวต่อความรู้สึกที่ไม่ธรรมดาเป็นเรื่องเล็กน้อยและเมื่อขนาดตัวอย่างเพิ่มขึ้น ไม่ปกติมากขึ้นและการทดสอบอาจได้รับผลกระทบเพียงเล็กน้อยเท่านั้น

ii ดูเหมือนว่าคุณกำลังทดสอบความเป็นปกติของการตอบสนอง (DV) การกระจาย (ไม่มีเงื่อนไข) ของ DV นั้นไม่ถือว่าเป็นเรื่องปกติใน ANOVA คุณตรวจสอบส่วนที่เหลือเพื่อประเมินความสมเหตุสมผลของข้อสมมติฐานเกี่ยวกับการแจกแจงแบบมีเงื่อนไข (นั่นคือคำผิดพลาดในแบบจำลองที่ถือว่าเป็นเรื่องปกติ) - นั่นคือคุณดูเหมือนจะไม่ได้มองสิ่งที่ถูกต้อง แน่นอนเนื่องจากการตรวจสอบจะทำในส่วนที่เหลือคุณทำมันหลังจากการติดตั้งแบบจำลองมากกว่าก่อน

สาม. การทดสอบที่เป็นทางการอาจไม่ได้ผล คำถามที่น่าสนใจที่นี่คือ 'ระดับของความไม่ปกติที่ส่งผลต่อการอนุมานของฉันแย่แค่ไหน' ซึ่งการทดสอบสมมติฐานไม่ตอบสนองจริงๆ เมื่อขนาดของกลุ่มตัวอย่างใหญ่ขึ้นการทดสอบมีความสามารถในการตรวจจับความแตกต่างเล็กน้อยจากภาวะปกติในขณะที่ผลกระทบต่อระดับความสำคัญใน ANOVA จะเล็กลงและเล็กลง นั่นคือถ้าขนาดตัวอย่างของคุณมีขนาดใหญ่พอสมควรการทดสอบความเป็นมาตรฐานมักบอกคุณว่าคุณมีตัวอย่างขนาดใหญ่ซึ่งหมายความว่าคุณอาจไม่ต้องกังวลมากนัก อย่างน้อยกับพล็อต QQ คุณต้องประเมินภาพว่ามันไม่ปกติอย่างไร

iv ในขนาดตัวอย่างที่เหมาะสมสมมติฐานอื่น ๆ - เช่นความเท่าเทียมกันของความแปรปรวนและความเป็นอิสระ - โดยทั่วไปมีความสำคัญมากกว่าที่ไม่ได้มาตรฐาน กังวลเกี่ยวกับสมมติฐานอื่น ๆ ก่อน ... แต่อีกครั้งการทดสอบที่เป็นทางการไม่ตอบคำถามที่ถูกต้อง

v. การเลือกว่าคุณทำการทดสอบ ANOVA หรือการทดสอบอื่น ๆ ตามผลลัพธ์ของการทดสอบสมมติฐานมีแนวโน้มที่จะมีคุณสมบัติที่แย่กว่าการตัดสินใจว่าจะทำราวกับว่าข้อสันนิษฐานนั้นไม่มี (มีวิธีการที่หลากหลายที่เหมาะสำหรับการวิเคราะห์ ANOVA แบบทางเดียวกับข้อมูลที่ไม่ถือว่าเป็นเรื่องปกติที่คุณสามารถใช้เมื่อใดก็ตามที่คุณไม่คิดว่าคุณมีเหตุผลที่จะถือว่าเป็นเรื่องปกติบางคนมีพลังที่ดีมาก ตามปกติและด้วยซอฟต์แวร์ที่ดีไม่มีเหตุผลที่จะหลีกเลี่ยง)

[ฉันเชื่อว่าฉันมีข้อมูลอ้างอิงสำหรับจุดสุดท้ายนี้ แต่ฉันไม่สามารถหาได้ในตอนนี้ ถ้าฉันพบมันฉันจะพยายามกลับมาใส่ใน]


ฉันอ่านฮิสโตแกรมของคุณในขณะที่แสดงโหมดขั้นต่ำ 12 12 48 สูงสุด 60 ดังนั้นขั้นต่ำเป็น 36 โหมดถึงสูงสุด 12 เราไม่ควรอ่านรายละเอียดมากเกินไป แต่มันสอดคล้องกับความเบ้ซ้ายทั้งหมด
นิคค็อกซ์

10

การทดสอบ Kolmogorov-Smirnov มีกำลังงานพอสมควรเมื่อขนาดตัวอย่างมีขนาดใหญ่ดังนั้นจึงง่ายที่จะปฏิเสธสมมติฐานว่างที่ว่าข้อมูลของคุณไม่แตกต่างจากปกติ กล่าวอีกนัยหนึ่งการทดสอบจะแนะนำว่าการแจกแจงไม่ปกติในกลุ่มตัวอย่างขนาดใหญ่แม้ว่าจะเป็นเรื่องปกติสำหรับความตั้งใจส่วนใหญ่

คิดว่ามันเหมือนการทดสอบ t หากคุณมีประชากรสองคนที่มีความสูงต่างกันเพียงหนึ่งในพันมิลลิเมตรตัวอย่างที่มีขนาดใหญ่อย่างไม่น่าเชื่อจะช่วยให้สถิติเหล่านี้แตกต่างกันแม้ว่าความแตกต่างจะไม่มีความหมายก็ตาม

บางทีคุณสามารถพึ่งพาวิธีอื่น ๆ เพื่อกำหนดค่าปกติของข้อมูลของคุณ พล็อตที่คุณใช้เป็นสองตัวอย่างที่ดีเช่นเดียวกับค่าความเบ้ / kurtosis

หัวข้ออื่น ๆ นี้ดูเหมือนจะเกี่ยวข้องโดยเฉพาะอย่างยิ่ง: การทดสอบความปกติเป็นสิ่งที่ไร้ประโยชน์หรือไม่?


โอ้ตกลงมันถูกต้องขนาดตัวอย่างของฉันค่อนข้างใหญ่ (n = 660) มีการทดสอบอื่นอีกหรือไม่ซึ่งมีอคติน้อยกว่าด้วยขนาดตัวอย่างขนาดใหญ่หรือไม่
Boo

ค้นหาในเว็บไซต์นี้และคุณสามารถค้นหาคำตอบที่เกี่ยวข้อง stats.stackexchange.com/questions/12261/testing-normalit stats.stackexchange.com/questions/2492/…
Behacad

13
การทดสอบไม่ได้ลำเอียงจากกลุ่มตัวอย่างขนาดใหญ่
Peter Flom - Reinstate Monica

10

การทดสอบ Kolmogorov – Smirnov นั้นไม่มีการกระจายเมื่อมีการระบุสมมติฐานว่างอย่างสมบูรณ์ - หากค่าเฉลี่ย & ค่าความแปรปรวนถูกประเมินจากข้อมูลให้แน่ใจว่าใช้ตัวแปร Lilliefors เมื่อทำการทดสอบภาวะปกติ (ถ้าคุณต้องการ) นั่นไม่ใช่คำตอบอื่น ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.