ฉันมีข้อมูลบางอย่างซึ่งดูจากการพล็อตกราฟของส่วนที่เหลือเทียบกับเวลาเกือบปกติ แต่ฉันต้องการให้แน่ใจ ฉันจะทดสอบความเป็นปกติของข้อผิดพลาดที่เหลือได้อย่างไร?
ฉันมีข้อมูลบางอย่างซึ่งดูจากการพล็อตกราฟของส่วนที่เหลือเทียบกับเวลาเกือบปกติ แต่ฉันต้องการให้แน่ใจ ฉันจะทดสอบความเป็นปกติของข้อผิดพลาดที่เหลือได้อย่างไร?
คำตอบ:
ไม่มีการทดสอบใดที่จะบอกคุณได้ว่ามีการแจกแจงปกติ ในความเป็นจริงคุณสามารถเดิมพันเชื่อถือได้ว่าพวกเขาจะไม่ได้
การทดสอบสมมติฐานโดยทั่วไปไม่ได้เป็นความคิดที่ดีในการตรวจสอบสมมติฐานของคุณ ผลของการที่ไม่ปกติในการอนุมานของคุณไม่ได้โดยทั่วไปฟังก์ชั่นขนาดตัวอย่าง * แต่ผลของการทดสอบอย่างมีนัยสำคัญคือ ค่าเบี่ยงเบนเล็กน้อยจากค่าปกติจะเห็นได้ชัดในกลุ่มตัวอย่างขนาดใหญ่ถึงแม้ว่าคำตอบของคำถามที่น่าสนใจจริง ๆ ('สิ่งนี้ส่งผลกระทบต่อการอนุมานของฉันในระดับใด?) อาจเป็น' แทบจะทุกคน ' ตามลําดับค่าเบี่ยงเบนขนาดใหญ่จากค่าปกติที่ขนาดตัวอย่างขนาดเล็กอาจไม่เข้าใกล้ความหมาย
* (เพิ่มในการแก้ไข) - จริง ๆ แล้วมันเป็นคำสั่งที่อ่อนแอเกินไป ผลกระทบของ non-normality จะลดลงจริงด้วยขนาดตัวอย่างค่อนข้างทุกเวลาที่ทฤษฎีบท CLT และ Slutsky กำลังจะเกิดขึ้นในขณะที่ความสามารถในการปฏิเสธภาวะปกติ (และหลีกเลี่ยงขั้นตอนทฤษฎีทั่วไป) จะเพิ่มขึ้นตามขนาดของกลุ่มตัวอย่าง ... ดังนั้นเมื่อ คุณสามารถระบุได้ว่าไม่ใช่เรื่องธรรมดาเป็นไปได้มากที่สุดเมื่อมันไม่เป็นไรต่อไป ... และการทดสอบก็ไม่ช่วยอะไรเลยเมื่อมันมีความสำคัญในตัวอย่างเล็ก ๆ
ดีอย่างน้อยก็ระดับความสำคัญไป พลังงานยังคงเป็นปัญหาแม้ว่าเรากำลังพิจารณาตัวอย่างขนาดใหญ่เช่นที่นี่นั่นอาจเป็นปัญหาน้อยเช่นกัน
สิ่งที่ใกล้เคียงกับขนาดของเอฟเฟกต์การวัดก็คือการวินิจฉัย (เช่นจอแสดงผลหรือสถิติ) ที่วัดระดับของความไม่ปกติในบางวิธี พล็อต QQ เป็นจอแสดงผลที่ชัดเจนและพล็อต QQ จากประชากรเดียวกันที่ขนาดตัวอย่างหนึ่งและที่ขนาดตัวอย่างที่แตกต่างกันอย่างน้อยทั้งการประมาณเส้นโค้งที่มีเสียงดังของเส้นโค้งเดียวกัน - แสดงให้เห็นว่า อย่างน้อยมันควรจะเกี่ยวข้องอย่างน่าเบื่อกับคำตอบที่ต้องการสำหรับคำถามที่น่าสนใจ
หากคุณต้องใช้การทดสอบชาปิโร่วิลก์อาจจะดีพอ ๆ กับสิ่งอื่น ๆ (โดยทั่วไปแล้วการทดสอบของเฉิน - ชาปิโรอาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ที่สนใจทั่วไป แต่ยากที่จะหาการใช้งาน) - แต่เป็นการตอบคำถามของคุณ รู้คำตอบแล้ว; ทุกครั้งที่คุณปฏิเสธที่จะปฏิเสธมันให้คำตอบที่คุณมั่นใจได้ว่าผิด
การทดสอบชาปิโร - วิลค์เป็นไปได้อย่างหนึ่ง
การทดสอบนี้มีการใช้งานในเกือบทุกแพ็คเกจซอฟต์แวร์เชิงสถิติ สมมุติฐานว่างเป็นค่าตกค้างกระจายตามปกติดังนั้นค่า p เล็ก ๆ บ่งบอกว่าคุณควรปฏิเสธค่าว่างและสรุปว่าค่าเศษตกค้างไม่ได้กระจายตามปกติ
โปรดทราบว่าหากขนาดตัวอย่างของคุณมีขนาดใหญ่คุณจะปฏิเสธได้เกือบทุกครั้งดังนั้นการสร้างภาพข้อมูลที่เหลือจึงมีความสำคัญมากกว่า
จากวิกิพีเดีย:
การทดสอบความเป็นไปตามปกติของ univariate นั้นรวมถึงการทดสอบ K-squared ของ D'Agostino, การทดสอบ Jarque – Bera, การทดสอบ Anderson – Darling, การทดสอบCramér – von Mises, การทดสอบ Lilliefors สำหรับความเป็นมาตรฐาน การทดสอบชาปิโร่ - วิลค์การทดสอบไค - สแควร์ของเพียร์สันและการทดสอบชาปิโร - ฝรั่งเศส กระดาษ 2011 จากวารสารการสร้างแบบจำลองทางสถิติและการวิเคราะห์ [1] สรุปว่า Shapiro-Wilk มีอำนาจที่ดีที่สุดสำหรับความสำคัญที่กำหนดตามด้วยอย่างใกล้ชิดโดย Anderson-Darling เมื่อเปรียบเทียบ Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors และ Anderson- การทดสอบที่รัก