ในบางกรณีดูเหมือนชัดเจนว่าทฤษฎีอาจทำงานได้ดีที่สุด (ความยาวหางของหนูจะกระจายตามปกติ)
ความยาวหางจะไม่กระจายตามปกติอย่างแน่นอน
การแจกแจงแบบปกติมีความเป็นไปได้ที่ไม่ใช่ศูนย์ในการรับค่าลบ; ความยาวหางไม่
สายที่โด่งดังของจอร์จบ็อกซ์" ทุกรุ่นผิด แต่มีประโยชน์ " ทำให้ประเด็นค่อนข้างดี กรณีที่เราอาจยืนยันความมีมาตรฐาน (แทนที่จะเป็นเพียงแค่ค่านิยมทั่วไป) นั้นหายากมากจริง ๆ แล้วเกือบเป็นสิ่งมีชีวิตในตำนานภาพลวงตาบางครั้งเกือบมองออกจากมุมตา
ในหลายกรณีอาจไม่มีทฤษฎีที่จะอธิบายชุดข้อมูลดังนั้นคุณเพียงใช้สิ่งที่เหมาะกับสิ่งที่คุณมีค่อนข้างดีโดยไม่คำนึงถึงสิ่งที่มันถูกพัฒนาขึ้นเพื่ออธิบาย?
ในกรณีที่ปริมาณที่คุณสนใจไม่อ่อนไหวเป็นพิเศษต่อตัวเลือก (ตราบใดที่คุณสมบัติในวงกว้างของการกระจายสอดคล้องกับสิ่งที่ทราบ) จากนั้นใช่คุณสามารถใช้สิ่งที่เหมาะสม
ในกรณีที่มีระดับความไวสูงกว่า 'เพียงแค่ใช้สิ่งที่เหมาะกับ' ไม่เพียงพอสำหรับตัวเอง เราอาจใช้วิธีการบางอย่างที่ไม่ได้ตั้งสมมติฐานเป็นพิเศษ (อาจเป็นขั้นตอนแจกแจงฟรีเช่นการเรียงสับเปลี่ยนการบูตสแตรปหรือวิธีการสุ่มใหม่หรือกระบวนการที่มีประสิทธิภาพ) อีกวิธีหนึ่งเราอาจหาจำนวนความอ่อนไหวต่อสมมติฐานการกระจายเช่นผ่านการจำลอง (แน่นอนฉันคิดว่านี่เป็นความคิดที่ดีโดยทั่วไป)
ดูเหมือนจะมีปัญหาที่บางทีคุณควรใช้การกระจายเชิงประจักษ์ถ้าคุณไม่มีความคิด
ฉันจะไม่อธิบายว่าเป็นปัญหาโดยอาศัยการอนุมานจากการแจกแจงเชิงประจักษ์แน่นอนว่าวิธีการที่ถูกต้องเหมาะสมกับปัญหาหลายประการ (การเรียงสับเปลี่ยน / การสุ่มตัวอย่าง
บางคนมีวิธีติดต่อกัน / คิดเกี่ยวกับปัญหานี้อย่างต่อเนื่องหรือไม่
ในกรณีส่วนใหญ่ฉันมักจะพิจารณาคำถามเช่น:
1) ฉันเข้าใจอะไร * เกี่ยวกับวิธีการ (หรือปริมาณประเภทสถานที่อื่น ๆ ) สำหรับข้อมูลของแบบฟอร์มนี้
* (ไม่ว่าจะมาจากทฤษฎีหรือประสบการณ์ของข้อมูลรูปแบบนี้หรือคำแนะนำจากผู้เชี่ยวชาญหรือหากจำเป็นจากข้อมูลเองแม้ว่าจะมีปัญหาที่ต้องจัดการ)
2) สิ่งที่เกี่ยวกับการแพร่กระจาย (ความแปรปรวน, IQR, ฯลฯ ) - มันทำงานอย่างไร?
3) คุณสมบัติเกี่ยวกับการกระจายอื่น ๆ (ขอบเขต, ความเบ้, ความแตกต่าง, ฯลฯ )
4) สิ่งที่เกี่ยวกับการพึ่งพาอาศัยความหลากหลายของประชากรแนวโน้มที่จะมีค่าที่แตกต่างกันมากในบางครั้ง ฯลฯ
การพิจารณาประเภทนี้อาจเป็นแนวทางในการเลือกระหว่างโมเดลปกติ GLM โมเดลอื่นหรือแนวทางที่มีประสิทธิภาพหรือไม่ใช้การกระจาย (เช่นวิธีการ bootstrapping หรือการเปลี่ยนรูป / การสุ่มรวมถึงขั้นตอนการจัดอันดับ)