อะไรอาจเป็นคำจำกัดความที่ชัดเจนและใช้งานได้จริงสำหรับ“ ครอบครัวของสมมุติฐาน” (เทียบกับอัตราความผิดพลาดตามลำดับของครอบครัว)


9

เมื่อพยายามประเมินสิ่งที่ถือเป็นครอบครัวของสมมุติฐานในการทดลอง / โครงการ / การวิเคราะห์ฉันพบว่า "มีจุดประสงค์คล้ายกัน" และ "คล้ายกันในเนื้อหา" ที่ให้ไว้เป็นแนวทางในการกำหนดครอบครัว แต่สิ่งเหล่านี้ค่อนข้างเปิดกว้างสำหรับการตีความ พูดน้อยที่สุด)

เห็นได้ชัดว่าถ้าในระหว่างการวิเคราะห์ฉันทำการทดสอบหลายวิธีในกลุ่มและแยกชุดการทดสอบความเป็นเนื้อเดียวกันของสัดส่วนที่ว่าฉันจะไม่รวมทุกอย่างเข้าด้วยกันเป็นสมมุติฐานตระกูลเดี่ยว

อย่างไรก็ตามถ้าฉันมีการทดสอบกลุ่มที่เกี่ยวข้องกันหลายชุดกระบวนการเกณฑ์ใดที่นำพวกเขามารวมกันในครอบครัว (หรือแยกพวกมันออกเป็นครอบครัวแยก) สมาชิกทุกคนในครอบครัวควรมีตัวแปรตอบกลับที่เหมือนกันหรือไม่? ถ้าฉันมีตัวแปรตอบกลับต่างกัน แต่มีชุดคดีเดียวกันที่เกี่ยวข้องพวกนั้นทั้งหมดจะรวมอยู่ในครอบครัวของสมมติฐานหรือไม่?

คำตอบ:


4

ปัญหาของการเปรียบเทียบหลายรายการเป็นหัวข้อใหญ่มาก มีความคิดเห็นมากมายและหลายคนไม่เห็นด้วย นี่คือสาเหตุที่หลายสิ่งหลายอย่าง; ส่วนหนึ่งเป็นเพราะประเด็นนี้มีความสำคัญจริง ๆ และอีกส่วนหนึ่งเป็นเพราะไม่มีกฎหรือเกณฑ์ขั้นสูงสุด ทำกรณีต้นแบบ: คุณทำการทดลองกับรีทเม้นต์และรับ ANOVA ที่สำคัญดังนั้นตอนนี้คุณสงสัยว่าวิธีการรักษาใดที่แตกต่างกัน คุณควรทำยังไงให้เรียกใช้การทดสอบ t t? แม้ว่าการทดสอบเหล่านี้จะมีที่แต่ละ. 05 แต่ 'Familywise' (เช่นความน่าจะเป็นที่เกิดข้อผิดพลาดอย่างน้อย 1 ประเภทที่ฉันจะเกิดขึ้น) จะระเบิด ในความเป็นจริงอัตราความผิดพลาดในครอบครัวจะเป็นkk(k1)/2αα1(1α)k. คำถามคือสิ่งที่กำหนด 'ครอบครัว'? และไม่มีคำตอบที่ดีไปกว่าคำว่าครอบครัวคือชุดของความแตกต่าง ไม่ว่าชุดของความขัดแย้งใด ๆ โดยเฉพาะควรได้รับการพิจารณาว่าเป็นครอบครัวหรือไม่เป็นการตัดสินใจเชิงอัตวิสัย การวิเคราะห์ครั้งที่ 3 วันที่ 17 และ 42 ที่ฉันเคยทำในชีวิตของฉันเป็นชุดของความแตกต่างและฉันสามารถปรับ threshold ของฉันเพื่อประกันว่าความน่าจะเป็นของข้อผิดพลาดประเภทที่ฉันจัดขึ้นที่ 5% แต่ไม่มีใคร จะได้พบกับความรู้สึกนี้ คำถามสำหรับคุณคือคุณพิจารณาความแตกต่างของคุณว่าเป็นฉากที่มีความหมายและมีเพียงคุณเท่านั้นที่สามารถตัดสินใจได้ ฉันจะเสนอวิธีการมาตรฐานบางอย่าง นักวิเคราะห์หลายคนเชื่อว่าหากความแตกต่างมาจากการทดลอง / ชุดข้อมูลเดียวกันพวกเขาควรได้รับการปฏิบัติเหมือนเป็นครอบครัวααจำเป็นต้องปรับ ) คนอื่นเชื่อว่าแม้ว่าจะมีความแตกต่างจากการทดลองเดียวกันหากพวกเขาเป็นแบบอย่างและแบบ orthogonal ก็ไม่จำเป็นต้องมีขั้นตอนพิเศษ ทั้งสองตำแหน่งสามารถป้องกันได้ สุดท้ายโปรดทราบว่ากระบวนการในการควบคุมอัตราความผิดพลาดแบบครอบครัวมาที่ต้นทุน - ได้แก่ เพิ่มอัตราความผิดพลาด type II


3

เกณฑ์ก็คือสมมติฐานมีการพึ่งพาซึ่งกันและกันในแง่ที่ว่าหากหนึ่งในนั้นแตกแล้วข้อสรุปหรือทฤษฎีของคุณทั้งหมด ดังนั้นคุณต้องรับประกันว่าหากการทดสอบทั้งหมดมีความสำคัญไม่มีการทดสอบใดที่มีนัยสำคัญเท็จ


ดังนั้นการใช้การทดสอบ t-test หลายพันครั้งในการวัดที่แตกต่างกันในการทดลองก่อนและหลังการรักษา (เช่นการทดสอบการแสดงออกของยีน) จะไม่นับรวมกับการทดสอบในตระกูล? การบวกที่ผิดพลาดอย่างหนึ่งจะไม่เป็นที่ต้องการ แต่มันจะไม่ทำให้ข้อสรุปที่สมบูรณ์จากการทดสอบโดยรวม
Ryan

ฉันคิดอย่างนั้น หากนั่นไม่ใช่เสียงนักสถิติควรปรารถนาที่จะตายในวัยหนุ่มสาวหรือเลิกอาชีพเร็ว ๆ นี้เพื่อหลีกเลี่ยงข้อผิดพลาดประเภทคูณที่ฉันในหลักสูตรชีวิตของเขา
ttnphns

ตกลงก็ได้ การทำตามตรรกะบูลีนที่เข้มงวดในโลกที่ทุกปัญหาเหมือนกับที่พบในคาสิโนและเกมง่าย ๆ ข้อผิดพลาดประเภทหนึ่งที่ฉันแน่นอนจะทำให้ทฤษฎีทั้งหมดไม่ถูกต้อง
Ryan

2

การอภิปรายเกี่ยวกับ researchgate ( http://www.researchgate.net/post/Bonferroni-how_is_the_family_of_hypotheses_defined ) ได้จัดทำรายการเอกสารซึ่งอาจช่วยรวบรวมความคิดเห็น - เอกสารจริงเริ่มจากคำถาม "เมื่อใช้การแก้ไขในสถานการณ์การทดสอบหลายครั้ง " เอกสาร - อ้างถึงบ่อยครั้ง - คือ:

1) Rothman KJ ไม่จำเป็นต้องทำการปรับเปลี่ยนสำหรับการเปรียบเทียบหลายรายการ Epidemiology.1990 1 (1): 43-6 http://psg-mac43.ucsf.edu/ticr/syllabus/courses/9/2003/02/27/Lecture/readings/Rothman.pdf

2) Perneger TV มีอะไรผิดปกติกับการปรับ Bonferroni BMJ 1998; 316 (7139): 1236-8 http://static.sdu.dk/mediafiles/D/1/F/%7BD1F06030-8FA7-4EE2-BB7D-60D683B18EAA%7DWhat_s-wrong%20_with_Bonferroni_adjustments.BMJ.1998.pdf

3) Bender R, Lange S. ปรับสำหรับการทดสอบหลายครั้งเมื่อใดและอย่างไร J Clin Epidemiol 2001; 54: 343-9 http://www.rbsd.de/PDF/multiple.pdf

สรุป:

1) และ 2) มุ่งเน้นไปที่ "สมมติฐานว่างทั้งหมดเป็นจริง" เรียกว่าสมมติฐานว่างทั่วไป มันสามารถถูกปฏิเสธได้อย่างถูกต้องมากขึ้น (เช่นไม่มีอัลฟา -Cummulation) ถ้ามีการปรับใช้สำหรับการเปรียบเทียบหลาย อย่างไรก็ตามทั้ง 1) และ 2) คัดค้านว่าสมมติฐานว่างทั่วไปนั้นไม่ค่อยถูกนำมาใช้อย่างเต็มที่ในกระบวนการวิจัยทางวิทยาศาสตร์ดังนั้นเกณฑ์ "ทั้งทฤษฎีแตก" จึงไม่นำมาใช้โดยอัตโนมัติเมื่อหนึ่ง / บางส่วนของสมมติฐานว่างในข้อมูล การวิเคราะห์ถูกปฏิเสธโดยบังเอิญ 1) เสริมว่ามันไร้เดียงสาที่จะคิดว่าเป็นโมฆะสมมุติฐานซึ่งถูกปฏิเสธ (เท็จ) จะไม่กลับมาจากชุมชนวิทยาศาสตร์อีกครั้ง

3) ระบุว่าเมื่อสมมติฐานเดียวละลายในการโต้แย้งหนึ่งการปรับจะต้องทำ

จากมุมมองของฉัน 1), 2), 3) ด้วยกันเพียงแค่กระจกเงาวิธีที่เราต้องใช้เกณฑ์ "ทั้งทฤษฎีแบ่ง" อย่างระมัดระวัง ไม่มีวิธีใดที่จะวางสมมุติฐานว่างทั้งหมดไว้ในไส้กรอกก้อนใหญ่ - หรือวิธีที่จะพึ่งพาชิ้นส่วนของไส้กรอกที่นำเสนอเป็นสมมติฐานเดียวจำนวนมาก นี่คืองานเชิงประจักษ์ที่ได้พบกับการทำงานกับทฤษฎีจากโดเมนภายใต้การวิจัย


สิ่งเหล่านี้เป็นเอกสารที่ดี แต่บางทีคุณอาจให้ข้อสรุปสั้น ๆ เกี่ยวกับสิ่งที่พวกเขาพูดเกี่ยวกับคำถามนี้ ในกรณีที่การเชื่อมโยงลงไปเราต้องการที่จะบันทึก
คริสซี

ดีใจที่ได้ยินถ้ามีบทสรุปช่วย (หรือไม่)
Statos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.