จากมุมมองของฉันปัญหาเดือดลงไปที่สิ่งที่จริงหมายถึงการดำเนินการทดสอบอย่างมีนัยสำคัญ การทดสอบความสำคัญถูกออกแบบขึ้นเพื่อใช้ในการตัดสินใจว่าจะปฏิเสธสมมติฐานว่างหรือไม่ยอมรับมัน ฟิชเชอร์เองแนะนำกฎ 0.05 ที่น่าอับอายสำหรับการตัดสินใจ (โดยพลการ)
โดยพื้นฐานแล้วตรรกะของการทดสอบอย่างมีนัยสำคัญคือผู้ใช้จะต้องระบุระดับอัลฟาสำหรับการปฏิเสธสมมติฐานว่าง (ตามอัตภาพ 0.05) ก่อนรวบรวมข้อมูลก่อนที่จะเก็บรวบรวมข้อมูลหลังจากเสร็จสิ้นการทดสอบที่สำคัญผู้ใช้จะปฏิเสธค่า Null ถ้าค่า p น้อยกว่าระดับอัลฟา (หรือล้มเหลวในการปฏิเสธเป็นอย่างอื่น)
เหตุผลที่คุณไม่สามารถประกาศผลที่มีนัยสำคัญสูง (เช่นที่ระดับ 0.001) เป็นเพราะคุณไม่สามารถหาหลักฐานที่แข็งแกร่งกว่าที่คุณกำหนดไว้ ดังนั้นหากคุณตั้งค่าระดับอัลฟ่าของคุณที่ 0.05 ก่อนการทดสอบคุณจะพบหลักฐานที่ระดับ 0.05 เท่านั้นไม่ว่าค่า p ของคุณจะเล็กเพียงใด ในทำนองเดียวกันการพูดถึงเอฟเฟ็กต์ที่ค่อนข้าง "สำคัญ" หรือ "ใกล้ความสำคัญ" ก็ไม่สมเหตุสมผลนักเพราะคุณเลือกเกณฑ์นี้ที่ 0.05 หากคุณตีความตรรกะของการทดสอบอย่างมีนัยสำคัญอย่างแท้จริงทุกอย่างที่ใหญ่กว่า 0.05 นั้นไม่สำคัญ
ฉันยอมรับว่าคำเช่น "ความสำคัญใกล้เข้ามา" มักจะถูกนำมาใช้เพื่อเพิ่มโอกาสในการตีพิมพ์ อย่างไรก็ตามฉันไม่คิดว่าผู้เขียนสามารถถูกตำหนิได้เพราะวัฒนธรรมการตีพิมพ์ในปัจจุบันในบางศาสตร์ยังคงต้องอาศัย "จอกศักดิ์สิทธิ์" อย่างหนัก 0.05
บางส่วนของปัญหาเหล่านี้จะกล่าวถึงใน:
Gigerenzer, G. (2004) สถิติไม่สนใจ วารสารเศรษฐศาสตร์สังคม, 33 (5), 587-606
Royall, R. (1997) หลักฐานทางสถิติ: กระบวนทัศน์ความน่าจะเป็น (ฉบับที่ 71) กด CRC