การประเมินผลของ“ ประมาณปกติ” สำหรับการทดสอบที


12

ฉันกำลังทดสอบวิธีการที่เท่าเทียมกันโดยใช้การทดสอบ t ของ Welch การแจกแจงพื้นฐานอยู่ไกลจากปกติ (บิดเบือนมากกว่าตัวอย่างในการสนทนาที่เกี่ยวข้องที่นี่ ) ฉันสามารถรับข้อมูลเพิ่มเติมได้ แต่ต้องการวิธีที่มีหลักการในการพิจารณาว่าจะทำเช่นไร

  1. มีฮิวริสติกที่ดีสำหรับการประเมินว่าการแจกตัวอย่างเป็นที่ยอมรับหรือไม่? การเบี่ยงเบนใด ๆ จากภาวะปกติที่เกี่ยวข้องกับอะไรมากที่สุด
  2. มีวิธีการอื่น ๆ - เช่นอาศัยช่วงความเชื่อมั่นบูตสำหรับสถิติตัวอย่าง - ซึ่งจะทำให้รู้สึกมากขึ้น?

2
นี่เป็นคำถามที่ยอดเยี่ยม นอกเหนือจากการทดสอบเชิงบรรทัดฐานคือ "ไร้ประโยชน์เป็นหลัก"? (เชื่อมโยงแล้ว) คำถามที่เกี่ยวข้องอีกสองคำถามคือวิธีเลือกระหว่างการทดสอบ t-test หรือ non-parametric เช่น Wilcoxon ในกลุ่มตัวอย่างขนาดเล็ก และT-test ไม่ปกติเมื่อ N> 50? คำตอบที่ดีสำหรับคำถามนี้อาจเป็นประโยชน์สำหรับผู้อ่านคำถามที่เกี่ยวข้องสองข้อนี้
Silverfish

เท่าที่ฉันรู้ไม่มีวิธีใด ๆ ในการกำหนดปริมาณข้อมูลที่คุณต้องการสำหรับการแจกจ่ายให้เป็น "ปกติเพียงพอ" นี่เป็นเพราะ "ปกติมากพอ" ยากที่จะนิยามและขึ้นอยู่กับว่าการกระจายที่แฝงอยู่นั้นไม่ปกตินอกเหนือไปจากวิธีการที่คุณออกจากภาวะปกติ หากคุณมีข้อมูลที่ไม่ปกติอย่างจริงจังฉันเพียงแค่ใช้การทดสอบที่ไม่ใช่พารามิเตอร์แทน ข้อเสียคือคุณจะไม่สามารถรับช่วงความมั่นใจซึ่งมีประโยชน์มากกว่าการทดสอบสมมติฐานเพียงอย่างเดียว
dsaxton

2
ฉันยอมรับว่า "ปกติเพียงพอ" นั้นยากที่จะกำหนด แต่ผู้ประกอบการทุกคนต้องทำการประเมินก่อนที่จะให้เหตุผลเกี่ยวกับข้อมูลเชิงประจักษ์ซึ่งเป็นสาเหตุที่ฉันประหลาดใจว่าการสนทนาเล็ก ๆ น้อย ๆ ที่ฉันสามารถค้นพบได้ (บางทีฉันกำลังมองผิด . สำหรับกรณีการใช้งานที่ฉันมีอยู่ในใจที่นี่ (ซึ่งรู้สึกว่าเพียงพอ) การทดสอบแบบไม่มีพารามิเตอร์นั้นไม่น่าพอใจเมื่อเปรียบเทียบกับการรวบรวมข้อมูลเพิ่มเติมเพื่อให้แน่ใจว่ามีการกระจายตัวอย่างแบบ "ปกติพอ"
cohoz

คำตอบ:


1

เมื่อการทดสอบtใช้กฎเกณฑ์และการแจกแจงต้นแบบของคุณไม่ปกติจึงไม่มีวิธีที่ดีในการพิจารณาว่าการแจกตัวอย่างเป็นที่ยอมรับได้ แต่เป็นขนาดของกลุ่มตัวอย่างได้รับ "ใหญ่" ที่เตะทฤษฎีขีด จำกัด กลางในและคุณสามารถใช้ตัวอย่างขนาดใหญ่ Z-test ซึ่งเป็นหลักจะให้คำตอบเช่นเดียวกับT -test เพราะเสื้อแนวทางการกระจายปกติด้วย ตัวอย่างขนาดใหญ่

หนังสือ / หลักสูตรสถิติมักบอกเป็นนัยว่าขนาดตัวอย่าง 25 หรือ 30 CLT มีบทบาทในทางที่เป็นประโยชน์ อย่างไรก็ตามประสบการณ์ของฉันเป็นเช่นนั้นแม้จะมีขนาดตัวอย่างในการทดสอบซีตัวอย่างขนาดใหญ่หลายร้อยครั้งก็ยังค่อนข้างแย่ (เช่นด้วยข้อมูลนับ)

ในความคิดของฉันการทดสอบการเปลี่ยนรูปเป็นสิ่งที่เหมาะสมกับปัญหาของคุณ ควรมีพลังที่เท่ากันหรือดีกว่าการทดสอบแบบไม่มีพารามิเตอร์ (เช่น Mann-Whitney) และคุณไม่ต้องกังวลเกี่ยวกับปัญหาปกติ และพวกเขาก็สนุกที่จะเขียน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.