ฉันจะใช้การทดสอบอะไรเพื่อยืนยันว่ามีการกระจายสารตกค้างตามปกติ


20

ฉันมีข้อมูลบางอย่างซึ่งดูจากการพล็อตกราฟของส่วนที่เหลือเทียบกับเวลาเกือบปกติ แต่ฉันต้องการให้แน่ใจ ฉันจะทดสอบความเป็นปกติของข้อผิดพลาดที่เหลือได้อย่างไร?


3
ที่เกี่ยวข้องอย่างใกล้ชิดที่เหมาะสม-ปกติ-ทดสอบสำหรับ-ตัวอย่างขนาดเล็ก ต่อไปนี้เป็นคำถามสองสามข้อที่น่าสนใจคือ : - การทดสอบแบบปกติ - ไร้ประโยชน์ - เป็นหลัก , สำหรับการอภิปรายเกี่ยวกับคุณค่าของการทดสอบปกติ, และสิ่งที่หากเหลืออยู่ - ปกติ - กระจาย - แต่ - y-is- ไม่สำหรับการสนทนา / การชี้แจงความรู้สึกซึ่งความเป็นปกติเป็นข้อสันนิษฐานของตัวแบบเชิงเส้น
gung - Reinstate Monica

จะเห็นได้ว่ามีข้อผิดพลาดทั่วไปเกี่ยวกับส่วนสำคัญของการทดสอบของ Shapiro Wilk! ความหมายที่ถูกต้องในความโปรดปรานของ H0 คือ H0 ไม่สามารถปฏิเสธได้ แต่ระวัง! ไม่ได้หมายความว่า "ข้อมูลปกติจะถูกกระจายโดยอัตโนมัติ" !!! ผลลัพธ์ทางเลือกคือ "ข้อมูลไม่ได้ถูกกระจายตามปกติ"
Joe Hallenbeck

คำตอบ:


28
  1. ไม่มีการทดสอบใดที่จะบอกคุณได้ว่ามีการแจกแจงปกติ ในความเป็นจริงคุณสามารถเดิมพันเชื่อถือได้ว่าพวกเขาจะไม่ได้

  2. การทดสอบสมมติฐานโดยทั่วไปไม่ได้เป็นความคิดที่ดีในการตรวจสอบสมมติฐานของคุณ ผลของการที่ไม่ปกติในการอนุมานของคุณไม่ได้โดยทั่วไปฟังก์ชั่นขนาดตัวอย่าง * แต่ผลของการทดสอบอย่างมีนัยสำคัญคือ ค่าเบี่ยงเบนเล็กน้อยจากค่าปกติจะเห็นได้ชัดในกลุ่มตัวอย่างขนาดใหญ่ถึงแม้ว่าคำตอบของคำถามที่น่าสนใจจริง ๆ ('สิ่งนี้ส่งผลกระทบต่อการอนุมานของฉันในระดับใด?) อาจเป็น' แทบจะทุกคน ' ตามลําดับค่าเบี่ยงเบนขนาดใหญ่จากค่าปกติที่ขนาดตัวอย่างขนาดเล็กอาจไม่เข้าใกล้ความหมาย

    * (เพิ่มในการแก้ไข) - จริง ๆ แล้วมันเป็นคำสั่งที่อ่อนแอเกินไป ผลกระทบของ non-normality จะลดลงจริงด้วยขนาดตัวอย่างค่อนข้างทุกเวลาที่ทฤษฎีบท CLT และ Slutsky กำลังจะเกิดขึ้นในขณะที่ความสามารถในการปฏิเสธภาวะปกติ (และหลีกเลี่ยงขั้นตอนทฤษฎีทั่วไป) จะเพิ่มขึ้นตามขนาดของกลุ่มตัวอย่าง ... ดังนั้นเมื่อ คุณสามารถระบุได้ว่าไม่ใช่เรื่องธรรมดาเป็นไปได้มากที่สุดเมื่อมันไม่เป็นไรต่อไป ... และการทดสอบก็ไม่ช่วยอะไรเลยเมื่อมันมีความสำคัญในตัวอย่างเล็ก ๆ

    ดีอย่างน้อยก็ระดับความสำคัญไป พลังงานยังคงเป็นปัญหาแม้ว่าเรากำลังพิจารณาตัวอย่างขนาดใหญ่เช่นที่นี่นั่นอาจเป็นปัญหาน้อยเช่นกัน

  3. สิ่งที่ใกล้เคียงกับขนาดของเอฟเฟกต์การวัดก็คือการวินิจฉัย (เช่นจอแสดงผลหรือสถิติ) ที่วัดระดับของความไม่ปกติในบางวิธี พล็อต QQ เป็นจอแสดงผลที่ชัดเจนและพล็อต QQ จากประชากรเดียวกันที่ขนาดตัวอย่างหนึ่งและที่ขนาดตัวอย่างที่แตกต่างกันอย่างน้อยทั้งการประมาณเส้นโค้งที่มีเสียงดังของเส้นโค้งเดียวกัน - แสดงให้เห็นว่า อย่างน้อยมันควรจะเกี่ยวข้องอย่างน่าเบื่อกับคำตอบที่ต้องการสำหรับคำถามที่น่าสนใจ

หากคุณต้องใช้การทดสอบชาปิโร่วิลก์อาจจะดีพอ ๆ กับสิ่งอื่น ๆ (โดยทั่วไปแล้วการทดสอบของเฉิน - ชาปิโรอาจเป็นทางเลือกที่ดีกว่าสำหรับผู้ที่สนใจทั่วไป แต่ยากที่จะหาการใช้งาน) - แต่เป็นการตอบคำถามของคุณ รู้คำตอบแล้ว; ทุกครั้งที่คุณปฏิเสธที่จะปฏิเสธมันให้คำตอบที่คุณมั่นใจได้ว่าผิด


4
+1 Glen_b เพราะคุณทำคะแนนได้ดีหลายอย่าง อย่างไรก็ตามฉันจะไม่ลบดังนั้นเกี่ยวกับการใช้ความดีของการทดสอบแบบเต็ม เมื่อขนาดตัวอย่างมีขนาดเล็กหรือปานกลางการทดสอบจะไม่มีกำลังเพียงพอที่จะตรวจจับการเบี่ยงเบนเล็กน้อยจากการกระจายปกติ ความแตกต่างที่มีขนาดใหญ่มากอาจส่งผลให้ค่า p น้อยมาก (เช่น 0.0001 หรือต่ำกว่า) สิ่งเหล่านี้อาจบ่งชี้อย่างเป็นทางการมากกว่าการสังเกตด้วยสายตาของพล็อต qq แต่ก็มีประโยชน์มาก ท่านสามารถดูการประเมินความเบ้และความโด่ง มันมีอยู่ในตัวอย่างที่มีขนาดใหญ่มากซึ่งความดีของการทดสอบแบบพอดีนั้นเป็นปัญหา
Michael R. Chernick

4
ในกรณีเหล่านี้จะตรวจพบการออกขนาดเล็ก ตราบใดที่นักวิเคราะห์ยอมรับว่าในทางปฏิบัติการกระจายตัวของประชากรจะไม่เป็นไปตามปกติและการปฏิเสธโมโตโยชิไร้ค่าเพียงแค่บอกเขาว่าการแจกแจงของเขานั้นไม่ปกติเล็กน้อยเขาจะไม่หลงทาง จากนั้นผู้ตรวจสอบควรตัดสินด้วยตัวเองว่าข้อสันนิษฐานเกี่ยวกับภาวะปกตินั้นเป็นเรื่องที่น่ากังวลหรือไม่หรือไม่ได้รับการออกนอกเล็กน้อยที่การทดสอบตรวจพบ ชาปิโร่วิลก์เป็นหนึ่งในการทดสอบที่ทรงพลังยิ่งกว่ากับสมมติฐานของภาวะปกติ
Michael R. Chernick

+1, โดยเฉพาะอย่างยิ่งฉันชอบจุด # 2; ตามแนวเหล่านั้นมันเป็นเรื่องน่าสังเกตว่าแม้ว่าความเบ้หรือความโด่งเป็นสิ่งที่ไม่ดีโดยที่ไม่มีขนาดใหญ่มาก N ทฤษฎีบทขีด จำกัด กลางจะครอบคลุมคุณดังนั้นนั่นเป็นเวลาที่คุณต้องมีกฎเกณฑ์น้อยที่สุด
gung - Reinstate Monica

3
@ gung มีบางสถานการณ์เมื่อการประมาณค่านิยมที่ดีจะมีความสำคัญ ตัวอย่างเช่นเมื่อสร้างช่วงการทำนายโดยใช้สมมติฐานปกติ แต่ฉันยังคงต้องพึ่งพาการวินิจฉัย (ซึ่งแสดงให้เห็นว่ามันไม่ปกติ) มากกว่าการทดสอบ
Glen_b

จุดของคุณเกี่ยวกับช่วงเวลาการทำนายนั้นดี
gung - Reinstate Monica

8

การทดสอบชาปิโร - วิลค์เป็นไปได้อย่างหนึ่ง

ทดสอบ Shapiro-Wilk

การทดสอบนี้มีการใช้งานในเกือบทุกแพ็คเกจซอฟต์แวร์เชิงสถิติ สมมุติฐานว่างเป็นค่าตกค้างกระจายตามปกติดังนั้นค่า p เล็ก ๆ บ่งบอกว่าคุณควรปฏิเสธค่าว่างและสรุปว่าค่าเศษตกค้างไม่ได้กระจายตามปกติ

โปรดทราบว่าหากขนาดตัวอย่างของคุณมีขนาดใหญ่คุณจะปฏิเสธได้เกือบทุกครั้งดังนั้นการสร้างภาพข้อมูลที่เหลือจึงมีความสำคัญมากกว่า


มันคือ "Wilk" ไม่ใช่ "Wilks"
Michael R. Chernick

1

จากวิกิพีเดีย:

การทดสอบความเป็นไปตามปกติของ univariate นั้นรวมถึงการทดสอบ K-squared ของ D'Agostino, การทดสอบ Jarque – Bera, การทดสอบ Anderson – Darling, การทดสอบCramér – von Mises, การทดสอบ Lilliefors สำหรับความเป็นมาตรฐาน การทดสอบชาปิโร่ - วิลค์การทดสอบไค - สแควร์ของเพียร์สันและการทดสอบชาปิโร - ฝรั่งเศส กระดาษ 2011 จากวารสารการสร้างแบบจำลองทางสถิติและการวิเคราะห์ [1] สรุปว่า Shapiro-Wilk มีอำนาจที่ดีที่สุดสำหรับความสำคัญที่กำหนดตามด้วยอย่างใกล้ชิดโดย Anderson-Darling เมื่อเปรียบเทียบ Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors และ Anderson- การทดสอบที่รัก


1
-1: คุณอาจต้องการรวมลิงก์ไปยังหน้า Wikipedia ลบเชิงอรรถ ("[1]") และใช้ฟังก์ชัน blockquote
Bernd Weiss

1
คำเตือนที่ Glen_b ให้ไว้นั้นเป็นสิ่งที่ไม่ควรจดจำเมื่อใดก็ตามที่มีการใช้การทดสอบแบบพอดี ฉันคิดว่าผลลัพธ์ที่คุณสงสัยเกี่ยวกับชาปิโร่วิลค์นั้นไม่ธรรมดาอย่างที่คุณคิดเอาไว้ ฉันไม่เชื่อว่าจะมีการทดสอบที่มีประสิทธิภาพมากที่สุดทั่วโลกสำหรับความปกติ
Michael R. Chernick

2
n1

@ GregSnow ฉันไม่มีเวลาดูแพ็คเกจของคุณอย่างถี่ถ้วนและฉันอาจไม่เก่งพอที่จะทำตามทุกอย่าง คุณกำลังบอกว่ามีการทดสอบที่มีประสิทธิภาพมากที่สุดทั่วโลกสำหรับความปกติหรือคุณกำลังบอกว่าคุณให้ตัวอย่างเพื่อแสดงเมื่อการทดสอบต่างๆมีประสิทธิภาพมากที่สุดและดังนั้นจึงไม่มีการทดสอบระดับโลก ฉันมีความสงสัยว่ามีอยู่และฉันไม่คิดว่าชาปิโร่ - วิลก์จะเป็นเช่นนั้น หากคุณอ้างว่ามีอยู่ฉันต้องการดูหลักฐานทางคณิตศาสตร์หรือการอ้างอิงถึง
Michael R. Chernick

1
@MichaelChernick การเรียกร้องของฉันคือการทดสอบของฉันจะมีอำนาจมากขึ้นหรือมากขึ้น (เป็นหรือมีแนวโน้มที่จะปฏิเสธสมมติฐานว่างเปล่าของข้อมูลที่มาจากปกติแน่นอน) เช่นการทดสอบอื่น ๆ ของบรรทัดฐาน รหัส R ไม่ยากที่จะติดตามรหัสหลักสำหรับการคำนวณค่า p คือ "tmp.p <- ถ้า (ใด ๆ (is.rational (x))) {0" หลักฐานการใช้พลังงานควรชัดเจน ( ฉันอ้างว่ามันมีประสิทธิภาพและเอกสารอาจมีประโยชน์ไม่ใช่ว่าการทดสอบตัวเองนั้นมีประโยชน์ google สำหรับ "คำพังเพยของ Cochrane")
เกร็กสโนว์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.