ก่อนอื่นคุณต้องเข้าใจว่าการทดสอบสองขั้นตอนนี้ไม่ได้ควบคุมสิ่งเดียวกัน จากตัวอย่างของคุณเรามีสองกลุ่มที่มีตัวแปรที่สังเกตได้ 18,000 ตัวและคุณทำการทดสอบ 18,000 ชุดเพื่อระบุตัวแปรบางตัวที่แตกต่างจากกลุ่มหนึ่งไปอีกกลุ่มหนึ่ง
การแก้ไข Bonferroni จะควบคุมอัตราความผิดพลาด Familywiseนั่นคือความน่าจะเป็นโดยสมมติว่าตัวแปร 18,000 ตัวทั้งหมดมีการแจกแจงที่เหมือนกันในสองกลุ่มซึ่งคุณอ้างว่าเป็นเท็จ "ที่นี่ฉันมีความแตกต่างที่สำคัญ" โดยทั่วไปแล้วคุณจะตัดสินใจว่าหากความน่าจะเป็นนี้ <5% การอ้างสิทธิ์ของคุณน่าเชื่อถือ
การแก้ไข Benjamini-Hochberg ควบคุมอัตราการค้นพบที่ผิดนั่นคือสัดส่วนที่คาดหวังของผลบวกเท็จในตัวแปรที่คุณอ้างว่ามีความแตกต่าง ตัวอย่างเช่นหากใช้การควบคุมแบบ FDR ถึง 5% 20 การทดสอบจะเป็นค่าบวก "โดยเฉลี่ย" การทดสอบเหล่านี้เพียง 1 รายการเท่านั้นจะเป็นผลบวกที่ผิดพลาด
ทีนี้เมื่อจำนวนการเปรียบเทียบเพิ่มขึ้น ... ทีนี้ก็ขึ้นอยู่กับจำนวนของสมมติฐานว่างที่เป็นจริง แต่โดยพื้นฐานแล้วด้วยขั้นตอนทั้งสองถ้าคุณมีไม่กี่ตัวสมมุติว่า 5 หรือ 10 เกี่ยวข้องกันอย่างแท้จริงคุณมีโอกาสมากขึ้นที่จะตรวจจับพวกมันในตัวแปร 100 ตัวแทนที่จะเป็น 1,000,000 ตัว นั่นควรจะเป็นสัญชาตญาณนั่นเอง ไม่มีวิธีหลีกเลี่ยงสิ่งนี้