สิ่งที่เราเรียกว่าการแฮ็ก P- ใช้การทดสอบที่สำคัญหลายครั้งและรายงานผลลัพธ์ที่มีนัยสำคัญเท่านั้น ไม่ว่าจะดีหรือร้ายก็ขึ้นอยู่กับสถานการณ์
เพื่ออธิบายให้ลองคิดถึงผลกระทบที่แท้จริงในคำศัพท์แบบเบย์แทนที่จะเป็นสมมติฐานว่างและทางเลือก ตราบใดที่เราเชื่อว่าผลกระทบที่เราสนใจมาจากการกระจายอย่างต่อเนื่องเราก็รู้ว่าสมมติฐานว่างเป็นเท็จ อย่างไรก็ตามในกรณีของการทดสอบแบบสองด้านเราไม่รู้ว่ามันเป็นบวกหรือลบ ภายใต้แสงนี้เราสามารถคิดค่า p สำหรับการทดสอบสองด้านเป็นการวัดว่าหลักฐานมีความแข็งแกร่งเพียงใดที่การประเมินของเรามีทิศทางที่ถูกต้อง (เช่นผลบวกหรือลบ)
p<α
ตอนนี้ให้พิจารณาสิ่งที่เกิดขึ้นเมื่อคุณกลับไปรับข้อมูลเพิ่มเติม ทุกครั้งที่คุณรับข้อมูลเพิ่มเติมความน่าจะเป็นของการได้รับทิศทางที่ถูกต้องตามเงื่อนไขกับข้อมูลที่เพียงพอจะเพิ่มขึ้นเท่านั้น ดังนั้นภายใต้สถานการณ์นี้เราควรตระหนักว่าการได้รับข้อมูลมากขึ้นแม้ว่าเราจะเพิ่มความน่าจะเป็นของความผิดพลาดประเภทที่ 1 แต่เราก็ลดความน่าจะเป็นที่จะสรุปทิศทางผิดโดยไม่ตั้งใจ
ใช้สิ่งนี้ตรงกันข้ามกับการแฮ็ก P-hacking ที่ใช้กันทั่วไปมากกว่า เราทดสอบขนาดเอฟเฟกต์ 100 รายการที่มีความน่าจะเป็นที่จะเล็กมากและรายงานเฉพาะขนาดที่สำคัญเท่านั้น โปรดทราบว่าในกรณีนี้หากเอฟเฟกต์ทั้งหมดมีขนาดเล็กเรามีโอกาส 50% ที่จะได้รับทิศทางที่ผิดเมื่อเราประกาศความสำคัญ
แน่นอนว่าค่า p ที่สร้างจาก data-double-down นี้ควรมาพร้อมกับเม็ดเกลือ โดยทั่วไปแล้วคุณไม่ควรมีปัญหากับคนที่รวบรวมข้อมูลเพิ่มเติมเพื่อให้แน่ใจเกี่ยวกับขนาดของเอฟเฟ็กต์มากขึ้นซึ่งอาจถูกใช้ในทางอื่น ตัวอย่างเช่น PI ที่ฉลาดอาจรู้ว่าแทนที่จะเก็บรวบรวม 100 จุดข้อมูลทั้งหมดในครั้งเดียวพวกเขาสามารถประหยัดเงินจำนวนมากและเพิ่มพลังงานโดยการรวบรวมจุดข้อมูล 50 จุดแรกวิเคราะห์ข้อมูลแล้วเก็บ 50 ถัดไปหากไม่สำคัญ . ในสถานการณ์นี้พวกเขาเพิ่มความน่าจะเป็นที่จะได้รับทิศทางของผลที่ผิดตามเงื่อนไขในการประกาศความสำคัญเนื่องจากพวกเขามีแนวโน้มที่จะได้รับทิศทางของผลที่ไม่ถูกต้องกับ 50 จุดข้อมูลมากกว่า 100 จุดข้อมูล
และสุดท้ายให้พิจารณาถึงผลกระทบของการไม่ได้รับข้อมูลมากขึ้นเมื่อเรามีผลลัพธ์ที่ไม่สำคัญ นั่นหมายความว่าจะไม่รวบรวมข้อมูลเพิ่มเติมในหัวข้อซึ่งจะไม่ผลักดันวิทยาศาสตร์ไปข้างหน้าจริง ๆ ใช่ไหม? การศึกษาที่ต่ำกว่าเกณฑ์จะฆ่าสาขาทั้งหมด