p
สิ่งนี้จะนำในยุคทองของวิทยาศาสตร์และเหตุผล? ไม่อาจจะไม่
tH0:HA: The groups have the same mean. The groups have different means.
H0H0สมมติฐานมีความหมายบางอย่าง "น่าเบื่อ" และนักวิจัยมักเกี่ยวข้องกับการหลีกเลี่ยงสถานการณ์ที่ "ผิดพลาด" ซึ่งพวกเขาอ้างว่าพบความแตกต่างระหว่างกลุ่มที่ไม่มีอยู่จริง ดังนั้นเราจึงเรียกผลลัพธ์ที่ "สำคัญ" เท่านั้นหากพวกเขาดูเหมือนว่าไม่น่าเป็นไปได้ภายใต้สมมติฐานว่างและโดยการประชุมนั้นเกณฑ์ความไม่ชอบมาพากลตั้งไว้ที่ 5%
H0
วิธีการแก้ไขที่หลากหลายนั้นมีวัตถุประสงค์เพื่อช่วยให้คุณกลับไปสู่อัตราความผิดพลาดเล็กน้อยที่คุณได้เลือกไว้สำหรับการทดสอบแต่ละครั้ง พวกเขาทำในวิธีที่แตกต่างกันเล็กน้อย วิธีการที่ควบคุมอัตราข้อผิดพลาดที่เหมาะสำหรับครอบครัวอย่างBonferroni , SidakและHolmให้พูดว่า "คุณต้องการโอกาส 5% ในการทำข้อผิดพลาดในการทดสอบครั้งเดียวดังนั้นเราจึงมั่นใจได้ว่าคุณจะไม่เกิน 5 โอกาสที่จะทำผิดพลาดในทุกการทดสอบของคุณ วิธีการที่ควบคุมอัตราการค้นพบที่ผิดแทนที่จะพูดว่า "คุณเห็นได้ชัดว่าไม่ถูกต้องมากถึง 5% ของเวลาด้วยการทดสอบเดียวดังนั้นเราจะตรวจสอบให้แน่ใจว่าไม่เกิน 5% ของ 'การโทร' ของคุณผิดเมื่อทำการทดสอบหลายครั้ง" (ดูความแตกต่าง?)
ทีนี้สมมติว่าคุณพยายามควบคุมอัตราความผิดพลาดที่เหมาะสำหรับครอบครัวของการทดสอบสมมติฐาน
ทั้งหมดที่เคยทำงาน คุณกำลังบอกว่าคุณต้องการโอกาส <5% ในการปฏิเสธสมมติฐานที่ไม่มีเหตุผลใด ๆ สิ่งนี้ตั้งค่าเกณฑ์ที่เข้มงวดและการอนุมานที่เป็นไปไม่ได้จะไร้ประโยชน์อย่างมีประสิทธิภาพ แต่มีปัญหาเร่งด่วนยิ่งขึ้น: การแก้ไขทั่วโลกของคุณหมายความว่าคุณกำลังทดสอบ "สมมุติฐานผสม" ที่ไร้สาระอย่างเช่น
H1:Drug XYZ changes T-cell count ∧Grapes grow better in some fields ∧…∧…∧…∧…∧Men and women eat different amounts of ice cream
ด้วยการแก้ไขอัตราการค้นพบที่ผิดพลาดปัญหาที่เป็นตัวเลขนั้นค่อนข้างไม่รุนแรงนัก แต่มันก็ยังเป็นระเบียบ ในทางกลับกันมันก็สมเหตุสมผลที่จะนิยาม "ตระกูล" ของการทดสอบที่เกี่ยวข้องเช่นรายการยีนของผู้สมัครในระหว่างการศึกษาฟังก์ชั่นจีโนมหรือชุดของถังขยะความถี่เวลาระหว่างการวิเคราะห์สเปกตรัม การปรับแต่งครอบครัวให้เข้ากับคำถามที่เฉพาะเจาะจงช่วยให้คุณสามารถตีความความผิดพลาด Type I ของคุณได้อย่างถูกต้อง ตัวอย่างเช่นคุณสามารถดูชุด p-values ที่ถูกต้อง FWER จากข้อมูลจีโนมของคุณเองและพูดว่า "มีโอกาส <5% ที่ยีนเหล่านี้ใด ๆ ที่เป็นผลบวกปลอม" นี่เป็นสิ่งที่ดีกว่าการรับประกันแบบคลุมเครือที่ครอบคลุมการอนุมานที่ทำโดยคนที่คุณไม่สนใจในหัวข้อที่คุณไม่สนใจ
ด้านพลิกของเรื่องนี้คือเขาเลือกที่เหมาะสมของ "ครอบครัว" เป็นที่ถกเถียงกันและอัตนัยเล็กน้อย (เป็นยีนทั้งหมดครอบครัวหนึ่งหรือฉันสามารถพิจารณาไคเนส?) แต่มันควรได้รับแจ้งจากปัญหาของคุณและฉันไม่เชื่อว่าใคร ได้ให้การสนับสนุนอย่างจริงจังในการกำหนดครอบครัวอย่างกว้างขวาง
แล้วเบย์ล่ะ
การวิเคราะห์แบบเบย์นำเสนอทางเลือกที่สอดคล้องกันสำหรับปัญหานี้ - หากคุณยินดีที่จะย้ายออกไปเล็กน้อยจากกรอบข้อผิดพลาดของ Type I / Type II เราเริ่มต้นด้วยการไม่ผูกมัดก่อน ... ดี ... ทุกอย่าง ทุกครั้งที่เราเรียนรู้บางสิ่งข้อมูลนั้นจะถูกรวมเข้าด้วยกันก่อนหน้านี้เพื่อสร้างการกระจายหลังซึ่งจะกลายเป็นก่อนในครั้งต่อไปที่เราเรียนรู้บางสิ่งบางอย่าง สิ่งนี้จะให้กฎการอัพเดทที่ต่อเนื่องกันและคุณสามารถเปรียบเทียบสมมติฐานที่แตกต่างกันเกี่ยวกับสิ่งต่าง ๆ โดยการคำนวณปัจจัย Bayes ระหว่างสองสมมติฐาน คุณน่าจะสามารถแยกแยะโมเดลขนาดใหญ่ซึ่งอาจไม่ทำให้เรื่องนี้ยุ่งยากโดยเฉพาะ
มี ... perse ที่วิธีการแบบเบย์ไม่จำเป็นต้องมีการแก้ไขเปรียบเทียบหลายรายการ น่าเสียดายที่อัตราต่อรองหลังเป็นเพียงสถิติการทดสอบอีกรูปแบบหนึ่งสำหรับผู้ที่ใช้บ่อย พวกเขาไม่มีคุณสมบัติพิเศษใด ๆ ที่ควบคุมข้อผิดพลาดประเภทนี้ (ทำไมจะเป็นเช่นนั้น) ดังนั้นคุณกลับมาอยู่ในดินแดนที่ยากลำบาก แต่อาจอยู่บนพื้นดินที่มีหลักการมากกว่าเล็กน้อย
ข้อโต้แย้งแบบเบย์คือเราควรมุ่งเน้นไปที่สิ่งที่เราสามารถรู้ได้ในตอนนี้และด้วยเหตุนี้อัตราความผิดพลาดจึงไม่สำคัญ
เกี่ยวกับการทำสำเนา
คุณดูเหมือนจะเสนอว่าการเปรียบเทียบการแก้ไขหลายรายการไม่ถูกต้องเป็นเหตุผลที่ทำให้เกิดผลลัพธ์ที่ไม่ถูกต้อง / ไม่สามารถพิสูจน์ได้จำนวนมาก ความรู้สึกของฉันคือปัจจัยอื่น ๆ มีแนวโน้มที่จะเป็นปัญหา สิ่งที่ชัดเจนคือความกดดันในการเผยแพร่ทำให้คนหลีกเลี่ยงการทดลองที่เน้นสมมติฐานของพวกเขา (กล่าวคือการออกแบบการทดลองที่ไม่ดี)
p