| x¯- 100 |
ฟิชเชอร์คิดว่าค่า p สามารถตีความได้ว่าเป็นหลักฐานที่ต่อเนื่องกับสมมติฐานว่าง ไม่มีค่าคงที่พิเศษซึ่งผลลัพธ์กลายเป็น 'สำคัญ' วิธีที่ฉันมักจะพยายามทำสิ่งนี้ให้กับผู้คนก็คือชี้ให้เห็นว่าสำหรับทุกเจตนารมณ์และจุดประสงค์ p = .049 และ p = .051 ประกอบด้วยหลักฐานจำนวนเท่ากันกับสมมติฐานว่าง (cf. @ คำตอบของ Henrik ที่นี่ ) .
บนมืออื่น ๆ , Neyman และเพียร์สันคิดว่าคุณสามารถใช้ p-value เป็นส่วนหนึ่งของกรงเล็บกระบวนการตัดสินใจ ในตอนท้ายของการสอบสวนคุณต้องปฏิเสธสมมติฐานว่างหรือไม่สามารถปฏิเสธสมมติฐานว่างได้ นอกจากนี้สมมติฐานว่างอาจเป็นจริงหรือไม่จริงก็ได้ ดังนั้นจึงมีความเป็นไปได้ทางทฤษฎีสี่ประการ (แม้ว่าจะอยู่ในสถานการณ์ใดก็ตามมีเพียงสอง): คุณสามารถตัดสินใจได้อย่างถูกต้อง (ไม่สามารถปฏิเสธความจริง - หรือปฏิเสธสมมติฐาน - โมฆะเท็จ) หรือคุณสามารถพิมพ์ได้ ข้อผิดพลาด I หรือ type II (โดยการปฏิเสธ null จริงหรือล้มเหลวในการปฏิเสธสมมติฐาน null ที่ผิดพลาดตามลำดับ) (โปรดทราบว่า p-value นั้นไม่เหมือนกับอัตราความผิดพลาดประเภทที่ฉันพูดถึงที่นี่αp < α
Fisherian และ Neyman เพียร์สันวิธีการที่มีไม่เหมือนกัน ความขัดแย้งหลักของกรอบการทำงานของเนย์แมน - เพียร์สันคือเมื่อสิ้นสุดการศึกษาคุณต้องตัดสินใจและเดินออกไป นักวิจัยเข้าหา Fisher ด้วยผลลัพธ์ที่“ ไม่สำคัญ” เมื่อถามถึงสิ่งที่เขาควรทำและฟิชเชอร์กล่าวว่า 'ไปหาข้อมูลเพิ่มเติม'
โดยส่วนตัวแล้วฉันพบว่าตรรกะที่สง่างามของวิธี Neyman-Pearson น่าดึงดูดมาก แต่ฉันคิดว่ามันไม่เหมาะสมเสมอไป ในใจของฉันต้องมีเงื่อนไขอย่างน้อยสองเงื่อนไขก่อนที่จะพิจารณากรอบการทำงานของ Neyman-Pearson:
- ควรมีสมมติฐานทางเลือกเฉพาะบางประการ (เอฟเฟกต์ขนาด ) ที่คุณสนใจด้วยเหตุผลบางอย่าง (ฉันไม่สนใจว่าขนาดเอฟเฟกต์คืออะไรเหตุผลของคุณคือไม่ว่าจะเป็นแบบที่ดีหรือเชื่อมโยงกันเป็นต้นว่าคุณมีขนาดเดียว)
- ควรมีเหตุผลบางอย่างที่สงสัยว่าผลกระทบจะเป็น 'สำคัญ' หากสมมติฐานทางเลือกเป็นจริง (ในทางปฏิบัติสิ่งนี้มักจะหมายความว่าคุณทำการวิเคราะห์พลังงานและมีข้อมูลเพียงพอ)
เมื่อไม่ปฏิบัติตามเงื่อนไขเหล่านี้ค่า p ยังคงสามารถตีความได้ตามความคิดของฟิชเชอร์ ยิ่งไปกว่านั้นมันดูเหมือนว่าสำหรับฉันที่ส่วนใหญ่เงื่อนไขเหล่านี้จะไม่พบ ต่อไปนี้เป็นตัวอย่างง่ายๆที่นึกถึงเมื่อมีการทดสอบ แต่ไม่ตรงตามเงื่อนไขข้างต้น:
- ANOVA ของ Omnibus สำหรับแบบจำลองการถดถอยหลายตัว (เป็นไปได้ที่จะหาว่าพารามิเตอร์ลาดเอียงที่ไม่เป็นศูนย์ทั้งหมดมารวมกันเพื่อสร้างพารามิเตอร์ที่ไม่เป็นศูนย์กลางสำหรับการแจกแจงแบบ Fแต่มันไม่ง่ายเลยสำหรับฉัน ทำมัน)
- W
- ค่าของการทดสอบความสม่ำเสมอของความแปรปรวน (เช่นการทดสอบของ Levene ; ความเห็นเดียวกันกับข้างบน)
- การทดสอบอื่น ๆ เพื่อตรวจสอบสมมติฐาน ฯลฯ
- t-tests ของ covariates นอกเหนือจากตัวแปรอธิบายของความสนใจหลักในการศึกษา
- การวิจัยเบื้องต้น / การสำรวจ (เช่นการศึกษานำร่อง)