ดูเหมือนว่าปัญหานี้จะทำให้หัวของมันน่าเกลียดอยู่ตลอดเวลาและฉันพยายามที่จะประหารชีวิตเพื่อความเข้าใจสถิติของตัวเอง (และมีสติ!)
สมมติฐานของตัวแบบเชิงเส้นทั่วไป (t-test, ANOVA, การถดถอย ฯลฯ ) รวมถึง "สมมติฐานของความปกติ" แต่ฉันได้พบว่าสิ่งนี้ไม่ค่อยได้อธิบายอย่างชัดเจน
ฉันมักจะเจอสถิติตำรา / คู่มือ / ฯลฯ เพียงแค่ระบุว่า "ข้อสันนิษฐานของภาวะปกติ" นำไปใช้กับแต่ละกลุ่ม (เช่นตัวแปร X เด็ดขาด) และเราเราควรจะตรวจสอบการออกเดินทางจากปกติสำหรับแต่ละกลุ่ม
คำถาม :
สมมติฐานนี้อ้างถึงค่าของ Y หรือค่าตกค้างของ Y หรือไม่
สำหรับกลุ่มใดเป็นไปได้ไหมที่จะมีการแจกแจงค่า Y ที่ไม่ปกติอย่างรุนแรง(เช่นเอียง) แต่การกระจายตัวของ Y ที่เหลืออยู่โดยประมาณ (หรืออย่างน้อยกว่าปกติ)
แหล่งข้อมูลอื่น ๆ อธิบายว่าข้อสันนิษฐานที่เกี่ยวข้องกับส่วนที่เหลือของแบบจำลอง (ในกรณีที่มีกลุ่มเช่น t-tests / ANOVA) และเราควรตรวจสอบการออกจากภาวะปกติของสิ่งตกค้างเหล่านี้ (เช่นเพียง QQ plot / test เพื่อ วิ่ง).
ค่าภาวะปกติของค่าคงที่สำหรับแบบจำลองบ่งบอกความเป็นค่าปกติของค่าตกค้างสำหรับกลุ่มหรือไม่? กล่าวอีกนัยหนึ่งเราควรตรวจสอบแบบจำลองที่เหลืออยู่ (ตรงกันข้ามกับคำแนะนำในตำรามากมาย) หรือไม่
หากต้องการวางสิ่งนี้ในบริบทให้พิจารณาตัวอย่างสมมุตินี้:
- ฉันต้องการเปรียบเทียบความสูงของต้นไม้ (Y) ระหว่างสองประชากร (X)
- ในประชากรหนึ่งการกระจายตัวของ Y นั้นเอียงไปทางขวาอย่างแรง (กล่าวคือต้นไม้ส่วนใหญ่สั้นมากน้อยมาก) ในขณะที่อีกประชากรหนึ่งนั้นปกติ
- ความสูงนั้นสูงกว่าโดยรวมในประชากรที่กระจายตัวตามปกติ (แนะนำว่าอาจมีความแตกต่าง 'ของจริง')
- การแปลงข้อมูลไม่ได้ช่วยปรับปรุงการกระจายตัวของประชากรกลุ่มแรกอย่างมีนัยสำคัญ
ประการแรกมันเป็นสิ่งที่ถูกต้องในการเปรียบเทียบกลุ่มที่ได้รับการกระจายความสูงที่แตกต่างกันอย่างสิ้นเชิง?
ฉันจะเข้าใกล้ "สมมติฐานของภาวะปกติ" ที่นี่ได้อย่างไร ความสูงของการเรียกคืนในประชากรหนึ่งไม่กระจายตามปกติ ฉันจะตรวจสอบค่าคงที่สำหรับประชากรทั้งสองแยกกันหรือค่าคงที่สำหรับแบบจำลอง (t-test) หรือไม่
โปรดอ้างอิงคำถามตามหมายเลขในการตอบกลับประสบการณ์แสดงให้ฉันเห็นว่าผู้คนหลงทางหรือหลงทางได้ง่าย (โดยเฉพาะฉัน!) โปรดจำไว้ว่าฉันไม่ใช่นักสถิติ แต่ผมมีความสมเหตุสมผลความคิด (เช่นไม่ใช่ทางเทคนิค!) การทำความเข้าใจของสถิติ
ป.ล. ฉันค้นหาเอกสารสำคัญและอ่านหัวข้อต่อไปนี้ซึ่งไม่ได้ประสานความเข้าใจของฉัน:
- ANOVA สมมติฐานปกติ / การแจกแจงปกติของสารตกค้าง
- ความเป็นปกติของการตกค้างเทียบกับข้อมูลตัวอย่าง สิ่งที่เกี่ยวกับการทดสอบ t?
- การทดสอบตามปกติคือ 'ไร้ประโยชน์เป็นหลัก' หรือไม่?
- การทดสอบปกติ
- การประเมินความปกติของการแจกแจง
- ฉันจะใช้การทดสอบอะไรเพื่อยืนยันว่ามีการกระจายสารตกค้างตามปกติ
- จะทำอย่างไรเมื่อการทดสอบ Kolmogorov-Smirnov มีความสำคัญสำหรับการตกค้างของการทดสอบพาราเมทริก แต่ความเบ้และความโด่งเป็นปกติ?