บริบท
มันค่อนข้างคล้ายกับคำถามนี้แต่ฉันไม่คิดว่ามันจะซ้ำกันแน่นอน
เมื่อคุณมองหาคำแนะนำเกี่ยวกับวิธีการทดสอบสมมติฐานบู๊ตสแตรปมันมักจะกล่าวว่ามันเป็นเรื่องปกติที่จะใช้การแจกแจงเชิงประจักษ์สำหรับช่วงความเชื่อมั่น แต่คุณต้องบูตสแตรปจากการกระจายภายใต้สมมติฐานว่างเพื่อให้ได้ ราคา. เป็นตัวอย่างดูคำตอบที่ยอมรับสำหรับคำถามนี้ การค้นหาทั่วไปบนอินเทอร์เน็ตส่วนใหญ่ดูเหมือนจะเป็นคำตอบที่คล้ายกัน
เหตุผลที่ไม่ใช้ค่า p ตามการกระจายเชิงประจักษ์คือส่วนใหญ่เราไม่มีค่าคงที่การแปล
ตัวอย่าง
ขอยกตัวอย่างสั้น ๆ เรามีเหรียญและเราต้องการทดสอบด้านเดียวเพื่อดูว่าความถี่ของหัวใหญ่กว่า 0.5 หรือไม่
เราทำการทดลองและรับหัว จริง p-value สำหรับการทดสอบนี้จะเป็น0.058
ในทางกลับกันถ้าเราบูต 14 จาก 20 หัวของเราเราได้อย่างมีประสิทธิภาพตัวอย่างจากการกระจายทวินามกับและ\ การเลื่อนการกระจายตัวนี้โดยการลบ 0.2 เราจะได้ผลลัพธ์ที่มีนัยสำคัญแทบเมื่อทดสอบค่าที่สังเกตได้ของเราที่ 0.7 กับการกระจายเชิงประจักษ์ที่ได้รับ
ในกรณีนี้ความคลาดเคลื่อนมีขนาดเล็กมาก แต่จะมีขนาดใหญ่ขึ้นเมื่ออัตราความสำเร็จที่เราทดสอบเทียบได้ใกล้เคียงกับ 1
คำถาม
ตอนนี้ให้ฉันมาถึงจุดที่แท้จริงของคำถามของฉัน: ข้อบกพร่องเดียวกันมากยังถือเป็นช่วงความมั่นใจ ในความเป็นจริงถ้าเป็นช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่นที่ระบุไว้แล้วช่วงความเชื่อมั่นไม่ได้มีพารามิเตอร์ที่อยู่ภายใต้สมมติฐานที่เทียบเท่ากับการปฏิเสธสมมติฐานในระดับความสำคัญของ\
ทำไมช่วงความเชื่อมั่นที่ยึดตามการกระจายเชิงประจักษ์ได้รับการยอมรับอย่างกว้างขวางและค่า p ไม่เป็นเช่นนั้น?
มีเหตุผลที่ลึกกว่าหรือเป็นคนที่ไม่อนุรักษ์นิยมกับช่วงความมั่นใจหรือไม่?
ในคำตอบนี้Peter Dalgaard ให้คำตอบที่ดูเหมือนจะเห็นด้วยกับข้อโต้แย้งของฉัน เขาพูดว่า:
ไม่มีอะไรผิดปกติโดยเฉพาะอย่างยิ่งเกี่ยวกับเหตุผลในบรรทัดนี้หรืออย่างน้อยก็ไม่มากไปกว่าการคำนวณ CI
(มาก) มาจากไหน? มันบอกเป็นนัยว่าการสร้างค่า p ด้วยวิธีนั้นแย่กว่าเล็กน้อย แต่ไม่ได้อธิบายรายละเอียดอย่างชัดเจน
ความคิดสุดท้าย
นอกจากนี้ในAn Introduction to Bootstrapโดย Efron และ Tibshirani พวกเขาอุทิศพื้นที่จำนวนมากให้กับช่วงความเชื่อมั่น แต่ไม่ให้ค่า p เว้นแต่ว่าพวกเขาจะถูกสร้างขึ้นภายใต้การแจกแจงสมมติฐานที่ถูกต้อง ช่วงความเชื่อมั่นและค่า p ในบทที่เกี่ยวกับการทดสอบการเปลี่ยนแปลง
ให้เรากลับมาที่คำถามแรกที่ฉันเชื่อมโยง ฉันเห็นด้วยกับคำตอบของ Michael Chernick แต่อีกครั้งเขายังยืนยันว่าทั้งช่วงความมั่นใจและค่า p ตามการกระจาย bootstrap เชิงประจักษ์ไม่น่าเชื่อถือเท่ากันในบางสถานการณ์ มันไม่ได้อธิบายว่าทำไมคุณถึงพบว่ามีคนมากมายบอกคุณว่าช่วงเวลานั้นโอเค แต่ค่า p ไม่ได้