หากคุณรันการทดสอบทางสถิติอิสระโดยใช้เป็นระดับความสำคัญของคุณและ null จะได้รับในทุกกรณีไม่ว่าคุณจะพบว่า 'ความสำคัญ' นั้นเป็นเพียงการสุ่มจากตัวแปรสุ่ม โดยเฉพาะมันจะนำมาจากการกระจายทวินามกับและ k ตัวอย่างเช่นหากคุณวางแผนที่จะรันการทดสอบ 3 ครั้งโดยใช้และ (ที่คุณไม่ทราบ) จริง ๆ แล้วก็ไม่แตกต่างกันในแต่ละกรณีมีโอกาส 5% ในการค้นหาผลลัพธ์ที่สำคัญในการทดสอบแต่ละครั้ง ด้วยวิธีนี้อัตราความผิดพลาดประเภทที่ 1 จะถูกเก็บไว้ที่α P = α n = k α = 0.05 α α α α o α n E Wkαp=αn=kα=.05αสำหรับการทดสอบแยกกัน แต่ในชุดทดสอบ 3 ชุดอัตราความผิดพลาดประเภทที่ 1 ในระยะยาวจะสูงขึ้น หากคุณเชื่อว่ามีความหมายในการจัดกลุ่ม / คิดว่าการทดสอบทั้งสามนี้ร่วมกันคุณอาจต้องการเก็บอัตราความผิดพลาดประเภท I ที่สำหรับชุดโดยรวมแทนที่จะเป็นรายบุคคล คุณจะไปเกี่ยวกับเรื่องนี้ได้อย่างไร มีวิธีการสองวิธีที่เปลี่ยนจาก (เช่น ) เป็นค่าใหม่ (เช่น ) :αααoαnew
Bonferroni:ปรับใช้ประเมิน 'นัยสำคัญ' เช่นนั้นα
αnew=αok
Dunn-Sidak:ปรับโดยใช้α
αnew=1−(1−αo)1/k
(โปรดทราบว่า Dunn-Sidak ถือว่าการทดสอบทั้งหมดภายในชุดมีความเป็นอิสระจากกันและสามารถให้ผลตามประเภทข้อผิดพลาดในครอบครัวที่อัตราเงินเฟ้อผิดพลาดหากข้อสันนิษฐานนั้นไม่มี)
มันเป็นสิ่งสำคัญที่จะต้องทราบว่าเมื่อการดำเนินการทดสอบมีสองชนิดของข้อผิดพลาดที่คุณต้องการที่จะหลีกเลี่ยง Type I (เช่นบอกว่าเป็นความแตกต่างเมื่อมีไม่ได้เป็นหนึ่ง) และพิมพ์ครั้งที่สอง (เช่นบอกว่าไม่ความแตกต่างเมื่อมีจริง) โดยทั่วไปเมื่อผู้คนอภิปรายหัวข้อนี้พวกเขาจะพูดคุยกันเท่านั้น - และดูเหมือนจะรับรู้ / เกี่ยวข้องกับ - ข้อผิดพลาดประเภทที่ 1 เท่านั้น นอกจากนี้ผู้คนมักจะละเลยที่จะพูดถึงว่าอัตราความผิดพลาดที่คำนวณได้จะเกิดขึ้นต่อเมื่อค่า Null ทั้งหมดเป็นจริงเท่านั้น เป็นที่แน่ชัดว่าคุณไม่สามารถทำผิดพลาดแบบที่ 1 ได้หากสมมติฐานว่างเป็นเท็จ แต่เป็นสิ่งสำคัญที่ต้องถือความจริงนั้นไว้ในใจเมื่อพูดถึงปัญหานี้
ฉันนำเรื่องนี้ขึ้นมาเพราะมีความหมายของข้อเท็จจริงเหล่านี้ที่ดูเหมือนจะไม่ได้รับการพิจารณา ก่อนอื่นถ้าวิธีการของ Dunn-Sidak จะให้พลังงานที่สูงกว่า (แม้ว่าความแตกต่างอาจมีขนาดเล็กมากที่มีเล็ก) ดังนั้นจึงควรเป็นที่ต้องการมากกว่า (เมื่อใช้ได้) ประการที่สองควรใช้วิธีการ'ลดระดับ' นั่นคือทดสอบผลกระทบที่ใหญ่ที่สุดก่อน หากคุณมั่นใจว่า null ไม่ได้รับในกรณีนั้นจำนวนข้อผิดพลาด type I ที่เป็นไปได้สูงสุดคือดังนั้นการทดสอบครั้งต่อไปควรปรับตามลำดับและอื่น ๆ (นี่มักจะทำให้คนไม่สบายใจและดูเหมือนว่าตกปลา แต่มันไม่ใช่k k - 1 αk>1kk−1การตกปลาเนื่องจากการทดสอบนั้นมีความเป็นอิสระและคุณตั้งใจจะทำการทดสอบก่อนที่จะเห็นข้อมูล นี่เป็นเพียงวิธีการปรับเหมาะสมที่สุด) α
ข้อมูลข้างต้นไม่ว่าคุณจะให้คุณค่ากับประเภทที่ 1 ของคุณอย่างไรเมื่อเทียบกับข้อผิดพลาดประเภท II อย่างไรก็ตามa-prioriไม่มีเหตุผลที่จะเชื่อว่าข้อผิดพลาดประเภทที่ 1 นั้นแย่กว่ารุ่น II แต่นี่เป็นการตัดสินใจที่ผู้วิจัยต้องทำและต้องเจาะจงเฉพาะกับสถานการณ์นั้น ส่วนตัวถ้าผมกำลังทำงานในทางทฤษฎี-แนะนำแบบนิรนัยแตกมุมฉากผมมักจะไม่ปรับ\α
(และการที่รัฐนี้อีกครั้งเพราะมันเป็นสิ่งที่สำคัญทั้งหมดข้างต้นสันนิษฐานว่าการทดสอบมีความเป็นอิสระ. หากความแตกต่างจะไม่เป็นอิสระเช่นเมื่อรักษาหลายแต่ละถูกเมื่อเทียบกับการควบคุมเดียวกันแนวทางที่แตกต่างกว่าปรับ เช่นควรใช้การทดสอบของ Dunnett) α