คำถามติดแท็ก multiple-comparisons

สถานการณ์สัญญาณที่มีความกังวลเกี่ยวกับการบรรลุอำนาจและขนาดที่กำหนดเมื่อทำการทดสอบสมมติฐานมากกว่าหนึ่งครั้ง

2
จะรับผลการทดสอบ Tukey HSD หลังการทดสอบในตารางที่แสดงคู่ที่จัดกลุ่มได้อย่างไร
ฉันชอบที่จะทำการทดสอบหลัง TukeyHSD หลังจาก Anova สองทางของฉันกับ R เพื่อรับตารางที่มีคู่ที่เรียงลำดับซึ่งจัดกลุ่มตามความแตกต่างที่สำคัญ (ขออภัยเกี่ยวกับถ้อยคำฉันยังใหม่กับสถิติ) ฉันต้องการที่จะมีอะไรเช่นนี้: ดังนั้นจัดกลุ่มด้วยดาวหรือตัวอักษร ความคิดใด ๆ ฉันทดสอบฟังก์ชั่นHSD.test()จากagricolaeแพ็คเกจ แต่ดูเหมือนว่ามันไม่ได้จัดการกับตารางแบบสองทาง

4
โพสต์การทดสอบใน ANCOVA
คำถาม: วิธีการที่ดีในการดำเนินการทดสอบหลังความแตกต่างระหว่างกลุ่มหมายถึงหลังจากการปรับผลกระทบของ covariate คืออะไร? ตัวอย่างต้นแบบ: สี่กลุ่มผู้เข้าร่วม 30 คนต่อกลุ่ม (เช่นประชากรจิตวิทยาคลินิกสี่คน) ตัวแปรตามคือตัวเลข (เช่นคะแนนเชาวน์ปัญญา) Covariate เป็นตัวเลข (เช่นดัชนีสถานะทางเศรษฐกิจและสังคม) คำถามวิจัยเกี่ยวข้องว่าคู่ของกลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญกับตัวแปรตามหลังจากการควบคุมสำหรับค่า covariate คำถามที่เกี่ยวข้อง : วิธีการที่ต้องการคืออะไร? มีการนำไปใช้งานอะไรบ้างใน R มีการอ้างอิงทั่วไปเกี่ยวกับวิธีการเปลี่ยนแปลงของโควารีเอตสำหรับการดำเนินการทดสอบโพสต์เฉพาะกิจหรือไม่?

4
Sidak หรือ Bonferroni
ฉันใช้โมเดลเชิงเส้นทั่วไปใน SPSS เพื่อดูความแตกต่างของจำนวนตัวหนอนเฉลี่ย (ไม่ใช่แบบปกติโดยใช้การกระจายแบบทวีด) ในพืช 16 ชนิดที่แตกต่างกัน ฉันต้องการเรียกใช้การเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าควรใช้การทดสอบการแก้ไข Sidak หรือ Bonferroni ความแตกต่างระหว่างการทดสอบทั้งสองคืออะไร? ดีกว่าอีกไหม?

3
นักวิจัย 1 ทำงาน 1,000 การถดถอยนักวิจัย 2 ทำงานเพียง 1 ทั้งสองได้ผลลัพธ์เดียวกัน - พวกเขาควรทำการอนุมานที่แตกต่างกันหรือไม่
ลองนึกภาพนักวิจัยกำลังสำรวจชุดข้อมูลและเรียกใช้การถดถอยที่แตกต่างกัน 1,000 รายการและเขาพบว่ามีความสัมพันธ์ที่น่าสนใจหนึ่งอย่างในหมู่พวกเขา ทีนี้ลองนึกภาพว่านักวิจัยอีกคนที่มีข้อมูลเดียวกัน ทำงานเพียง 1 การถดถอยและมันกลับกลายเป็นว่าเป็นสิ่งเดียวกับที่นักวิจัยคนอื่นเอามา 1,000 การค้นหา นักวิจัย 2 ไม่รู้จักนักวิจัย 1 นักวิจัย 1 ควรอนุมานต่างจากนักวิจัย 2 หรือไม่? ทำไม? ตัวอย่างเช่นนักวิจัย 1 ควรทำการแก้ไขการเปรียบเทียบหลายรายการ แต่นักวิจัย 2 ไม่ควร? หากนักวิจัย 2 แสดงให้คุณเห็นการถดถอยเดี่ยวของคุณก่อนคุณจะทำการอนุมานอะไร หากหลังจากนักวิจัยคนที่ 1 แสดงผลลัพธ์ให้คุณคุณควรเปลี่ยนการอนุมานของคุณหรือไม่ ถ้าเป็นเช่นนั้นทำไมมันถึงสำคัญ? ป.ล. 1 : ถ้าพูดถึงนักวิจัยสมมุติที่ทำให้ปัญหาเป็นนามธรรมลองคิดดูสิ: ลองจินตนาการว่าคุณใช้การถดถอยเพียงครั้งเดียวสำหรับกระดาษของคุณโดยใช้วิธีการที่ดีที่สุด จากนั้นนักวิจัยอีกสำรวจ 1000 ถดถอยที่แตกต่างกับข้อมูลเดียวกันจนกระทั่งเขาพบถดถอยเดียวกันแน่นอนคุณขับรถ คุณสองคนควรทำการอนุมานที่แตกต่างกันหรือไม่? หลักฐานนี้เหมือนกันทั้งสองกรณีหรือไม่? คุณควรเปลี่ยนข้อสรุปของคุณถ้าคุณรู้ผลลัพธ์ของนักวิจัยคนอื่น ๆ ? ประชาชนควรประเมินหลักฐานของการศึกษาทั้งสองอย่างไร ป.ล. 2:โปรดพยายามเจาะจงและให้เหตุผลทางคณิตศาสตร์ / ทฤษฎีถ้าเป็นไปได้!

4
การทดสอบสมมติฐานสำหรับความแตกต่างของค่ามัธยฐานในกลุ่มตัวอย่างมากกว่าสองตัวอย่าง
คำถาม คะแนนการทดสอบของคนสามกลุ่มจะถูกบันทึกเป็นเวกเตอร์แยกในอาร์ set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) ฉันต้องการทราบว่ามีความแตกต่างที่สำคัญในค่ามัธยฐานระหว่างกลุ่มเหล่านี้หรือไม่ ฉันรู้ว่าฉันสามารถทดสอบกลุ่ม 1 กับกลุ่ม 2 ได้โดยใช้การทดสอบ Wilcoxon เช่นนั้น wilcox.test(group1, group2) อย่างไรก็ตามการเปรียบเทียบครั้งนี้มีเพียงสองกลุ่มเท่านั้นและฉันต้องการเปรียบเทียบทั้งสามกลุ่มพร้อมกัน ฉันต้องการทดสอบสถิติที่ให้ค่า ap ที่ระดับนัยสำคัญ 0.05 มีคนช่วยได้ไหม แก้ไข # 1 - …

2
การปรับค่า p สำหรับการวิเคราะห์ลำดับแบบปรับตัว (สำหรับการทดสอบไคสแควร์)?
ฉันต้องการทราบว่าวรรณกรรมทางสถิติใดที่เกี่ยวข้องกับปัญหาต่อไปนี้และอาจเป็นแนวคิดในการแก้ไข ลองนึกภาพปัญหาต่อไปนี้: เรามีวิธีการรักษา 4 ประการสำหรับโรคบางประเภท เพื่อตรวจสอบว่าการรักษาใดดีกว่าเราทำการทดลองพิเศษ ในการทดลองเราเริ่มโดยไม่มีวิชาจากนั้นหนึ่งต่อหนึ่งวิชาเพิ่มเติมเข้าสู่การทดลอง ผู้ป่วยแต่ละรายจะถูกสุ่มเลือกหนึ่งใน 4 การรักษาที่เป็นไปได้ ผลลัพธ์สุดท้ายของการรักษาคือ "สุขภาพดี" หรือ "ยังป่วย" และให้เราบอกว่าเราสามารถรู้ผลลัพธ์นี้ได้ทันที ซึ่งหมายความว่า ณ จุดใดก็ตามเราสามารถสร้างตารางฉุกเฉินได้สองถึงสี่ตารางโดยบอกว่าอาสาสมัครของเรามีจำนวนเท่าใดที่เข้ารับการรักษา / สิ้นสุดผล ณ จุดใดก็ตามเราสามารถตรวจสอบตารางฉุกเฉิน (ตัวอย่างเช่นใช้การทดสอบไคสแควร์) เพื่อดูว่ามีการรักษาที่แตกต่างกันทางสถิติระหว่าง 4 การรักษาที่เป็นไปได้หรือไม่ หากหนึ่งในนั้นดีกว่าส่วนที่เหลือทั้งหมด - เราจะหยุดการทดลองและเลือกเป็น "ผู้ชนะ" หากการทดลองบางอย่างแสดงว่าแย่กว่านั้นอีกสามเราจะปล่อยเขาจากการทดลองและหยุดให้มันแก่ผู้ป่วยในอนาคต อย่างไรก็ตามปัญหานี่คือฉันจะปรับ p-valueสำหรับข้อเท็จจริงได้อย่างไรว่าการทดสอบสามารถดำเนินการได้ทุกจุดว่ามีความสัมพันธ์ระหว่างการทดสอบและลักษณะการปรับตัวของกระบวนการจัดการกระบวนการ (สำหรับ เช่นหากการรักษาบางอย่างพบว่า "ไม่ดี")?

1
ข้อผิดพลาดประเภทโดยรวมเมื่อทำการทดสอบข้อมูลที่สะสมซ้ำ ๆ
ฉันมีคำถามเกี่ยวกับกลุ่มวิธีการตามลำดับ ตามที่ Wikipedia: ในการทดลองแบบสุ่มกับกลุ่มการรักษาสองกลุ่มการทดสอบตามลำดับกลุ่มแบบดั้งเดิมจะใช้ในลักษณะดังต่อไปนี้: หากมีอาสาสมัครในแต่ละกลุ่มมีการวิเคราะห์ระหว่างกาลจะดำเนินการในอาสาสมัคร 2n การวิเคราะห์ทางสถิติจะดำเนินการเพื่อเปรียบเทียบทั้งสองกลุ่มและหากยอมรับสมมติฐานทางเลือกการทดลองจะสิ้นสุดลง มิเช่นนั้นการทดลองจะดำเนินต่อไปสำหรับวิชา 2n อีกวิชาโดยมี n วิชาต่อกลุ่ม การวิเคราะห์ทางสถิติจะดำเนินการอีกครั้งในวิชา 4n หากทางเลือกได้รับการยอมรับการทดลองจะสิ้นสุดลง มิฉะนั้นจะดำเนินการประเมินเป็นระยะ ๆ จนกว่าจะมีตัวแบบ N 2 ชุดให้เลือก เมื่อมาถึงจุดนี้การทดสอบทางสถิติครั้งสุดท้ายจะดำเนินการและการทดลองจะถูกยกเลิก แต่ด้วยการทดสอบข้อมูลที่สะสมซ้ำ ๆ ในแบบนี้ระดับความผิดพลาดที่เป็นประเภทที่สูงเกินจริง ... หากตัวอย่างเป็นอิสระจากกันข้อผิดพลาดประเภท I โดยรวมจะเป็นα⋆α⋆\alpha^{\star} α⋆= 1 - ( 1 - α )kα⋆=1−(1−α)k\alpha^{\star} = 1 - (1 - \alpha)^k โดยที่คือระดับของการทดสอบแต่ละครั้งและคือจำนวนการค้นหาระหว่างกาลkαα\alphakkk แต่ตัวอย่างไม่ได้เป็นอิสระเนื่องจากทับซ้อนกัน สมมติว่าการวิเคราะห์ระหว่างกาลจะดำเนินการที่เพิ่มขึ้นของข้อมูลเท่ากันจะพบว่า (สไลด์ 6) คุณช่วยอธิบายให้ฉันฟังว่าตารางนี้ได้มาอย่างไร

3
วิธีการเปรียบเทียบการอยู่รอดเฉลี่ยระหว่างกลุ่ม?
ฉันกำลังดูความอยู่รอดของคนไข้โดยใช้ Kaplan-Meier ในรัฐต่าง ๆ สำหรับโรคมะเร็ง มีความแตกต่างค่อนข้างมากระหว่างรัฐ ฉันจะเปรียบเทียบความอยู่รอดของค่ามัธยฐานระหว่างรัฐทั้งหมดและตัดสินว่ารัฐใดมีความแตกต่างอย่างมีนัยสำคัญจากค่าเฉลี่ยการอยู่รอดเฉลี่ยทั่วประเทศ?

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

2
ขอบเขตข้อผิดพลาดที่เหมาะสำหรับครอบครัว: การใช้ชุดข้อมูลซ้ำในการศึกษาที่แตกต่างกันของคำถามอิสระทำให้เกิดปัญหาการทดสอบหลายครั้งหรือไม่
หากทีมนักวิจัยทำการทดสอบหลายชุด (สมมติฐาน) ในชุดข้อมูลที่ระบุมีหนังสือรับรองจำนวนหนึ่งที่ยืนยันว่าพวกเขาควรใช้รูปแบบการแก้ไขสำหรับการทดสอบหลายรายการ (Bonferroni ฯลฯ ) แม้ว่าการทดสอบจะเป็นอิสระ คำถามของฉันคือสิ่งนี้: ตรรกะเดียวกันนี้ใช้กับหลาย ๆ ทีมที่ทดสอบสมมติฐานในชุดข้อมูลเดียวกันหรือไม่? กล่าวอีกวิธีหนึ่ง - อะไรคืออุปสรรคในการคำนวณข้อผิดพลาดที่เหมาะกับครอบครัว นักวิจัยควร จำกัด การใช้ชุดข้อมูลซ้ำเพื่อการสำรวจเท่านั้นหรือไม่

1
เมื่อใดที่จะแก้ไขค่า p ในการเปรียบเทียบหลาย ๆ
ฉันเกรงว่าคำถามที่เกี่ยวข้องไม่ได้ตอบฉัน เราประเมินการแสดงของตัวจําแนก> 2 ตัว (การเรียนรู้ของเครื่อง) สมมติฐานว่างของเราคือการแสดงไม่แตกต่างกัน เราทำการทดสอบพารามิเตอร์ (ANOVA) และการทดสอบที่ไม่ใช่พารามิเตอร์ (ฟรีดแมน) เพื่อประเมินสมมติฐานนี้ หากพวกเขาสำคัญเราต้องการค้นหาว่าตัวแยกประเภทใดที่แตกต่างกันในเควสต์แบบเฉพาะกิจ คำถามของฉันคือสองเท่า: 1) การแก้ไขค่า p หลังจากการทดสอบแบบเปรียบเทียบหลายรายการจำเป็นหรือไม่? เว็บไซต์ Wikipedia ของเยอรมันใน "Alphafehler Kumulierung" กล่าวว่าปัญหาจะเกิดขึ้นก็ต่อเมื่อมีการทดสอบสมมติฐานหลายข้อในข้อมูลเดียวกัน เมื่อเปรียบเทียบตัวแยกประเภท (1,2), (1,3), (2,3) ข้อมูลจะทับซ้อนกันเพียงบางส่วนเท่านั้น ยังจำเป็นต้องแก้ไขค่า p หรือไม่? 2) การแก้ไขค่า P มักใช้หลังจากการทดสอบแบบคู่กับการทดสอบที มันเป็นสิ่งจำเป็นหรือไม่เมื่อทำการทดสอบแบบเฉพาะหลังเช่นการทดสอบแบบ Nemenyi (ไม่ใช่แบบพารามิเตอร์) หรือการทดสอบ HSD ของ Tukey คำตอบนี้บอกว่า "ไม่" สำหรับ HSD ของ Tukey: การทดสอบ Tukey …

1
การเปรียบเทียบหลายรายการในการทดสอบแบบไม่มีพารามิเตอร์
ฉันกำลังทำงานกับชุดข้อมูลที่ไม่ใช่พารามิเตอร์และมี 12 การรักษา ฉันทำการทดสอบ Kruskal-Wallis และได้ค่าสำคัญและตอนนี้ฉันต้องการทำการเปรียบเทียบหลายขั้นตอนเพื่อดูว่าการรักษาใดที่แตกต่างกันอย่างมีนัยสำคัญ มีข้อมูลจำนวนมากเกี่ยวกับหัวข้อนี้ แต่ฉันไม่พบสิ่งใดที่แก้ไขปัญหานี้โดยเฉพาะ ความคิดใด ๆ ?? พีพีp

1
การเปรียบเทียบแบบหลายแบบผสมสำหรับการโต้ตอบระหว่างตัวทำนายแบบต่อเนื่องและหมวดหมู่
ฉันต้องการใช้lme4เพื่อให้พอดีกับการถดถอยแบบผสมและmultcompเพื่อคำนวณการเปรียบเทียบแบบคู่ ฉันมีชุดข้อมูลที่ซับซ้อนพร้อมตัวทำนายอย่างต่อเนื่องและจัดหมวดหมู่หลายชุด แต่คำถามของฉันสามารถแสดงให้เห็นได้โดยใช้ChickWeightชุดข้อมูลในตัวเป็นตัวอย่าง: m <- lmer(weight ~ Time * Diet + (1 | Chick), data=ChickWeight, REML=F) Timeมีความต่อเนื่องและDietเป็นหมวดหมู่ (4 ระดับ) และมีลูกไก่หลายตัวต่ออาหาร ลูกไก่ทุกตัวเริ่มต้นด้วยน้ำหนักเท่ากัน แต่อาหารของพวกมัน (อาจ) ส่งผลต่ออัตราการเติบโตดังนั้นการDietสกัดกั้นควรจะเหมือนกัน (มากหรือน้อย) เหมือนกัน แต่ความลาดชันอาจแตกต่างกัน ฉันจะได้รับการเปรียบเทียบแบบคู่สำหรับผลของการสกัดกั้นDietแบบนี้: summary(glht(m, linfct=mcp(Diet = "Tukey"))) และแน่นอนพวกเขาไม่ได้แตกต่างกันอย่างมีนัยสำคัญ แต่ฉันจะทำการทดสอบแบบอะนาล็อกเพื่อให้ได้Time:Dietผลอย่างไร เพียงแค่ใส่คำที่โต้ตอบลงไปในmcpข้อผิดพลาด: summary(glht(m, linfct=mcp('Time:Diet' = "Tukey"))) Error in summary(glht(m, linfct = mcp(`Time:Diet` = "Tukey"))) : error in …

3
สูตรเหล่านี้สำหรับการเปลี่ยน P, LSD, MSD, HSD, CI เพื่อ SE เป็นประมาณการแน่นอนหรือพอง / อนุลักษณ์ของ
พื้นหลัง ฉันกำลังทำการวิเคราะห์เมตาซึ่งรวมถึงข้อมูลที่เผยแพร่ก่อนหน้านี้ บ่อยครั้งที่รายงานความแตกต่างระหว่างการรักษาด้วยค่า P, ความแตกต่างอย่างมีนัยสำคัญน้อยที่สุด (LSD) และสถิติอื่น ๆ แต่ไม่มีการประมาณความแปรปรวนโดยตรง ในบริบทของแบบจำลองที่ฉันใช้ความแปรปรวนสูงเกินไปก็โอเค ปัญหา นี่คือรายการของการแปลงเป็นโดยที่S E = √SESESE (Saville 2003)ที่ฉันกำลังพิจารณาข้อเสนอแนะชื่นชม; ด้านล่างฉันสมมติว่าα=0.05ดังนั้น1- α / 2=0.975 และตัวแปรจะกระจายตามปกติเว้นแต่จะระบุไว้เป็นอย่างอื่น:SE= MSE/ n-------√SE=MSE/nSE=\sqrt{MSE/n} α = 0.05α=0.05\alpha=0.051 -α/2= 0.9751-α/2=0.9751-^{\alpha}/_2=0.975 คำถาม: กำหนด , nและการรักษาหมายถึงˉ X 1และˉ X 2 S E = ˉ X 1 - ˉ X 2PPPnnnX¯1X¯1\bar X_1X¯2X¯2\bar X_2 SE= …

4
การทดสอบ Chi-Squared หลายรายการ
ฉันมีข้อมูลข้ามประเภทในตาราง 2 x 2 x 6 ขอเรียกมิติresponse, และA ฉันพอดีกับการถดถอยโลจิสติกข้อมูลกับรูปแบบB response ~ A * Bการวิเคราะห์ความเบี่ยงเบนของโมเดลนั้นบอกว่าทั้งคำศัพท์และปฏิสัมพันธ์ของพวกมันมีความสำคัญ อย่างไรก็ตามเมื่อดูสัดส่วนของข้อมูลดูเหมือนว่ามีเพียง 2 หรือมากกว่านั้นBเท่านั้นที่รับผิดชอบต่อผลกระทบที่สำคัญเหล่านี้ ฉันต้องการทดสอบเพื่อดูว่าระดับใดเป็นต้นเหตุ ตอนนี้แนวทางของฉันคือทำการทดสอบแบบไคสแควร์จำนวน 6 ครั้งบนตารางขนาด 2x2 ตารางresponse ~ Aแล้วจึงปรับค่า p จากการทดสอบเหล่านั้นสำหรับการเปรียบเทียบหลาย ๆ แบบ (โดยใช้การปรับแบบโฮล์ม) คำถามของฉันคือว่ามีวิธีการที่ดีกว่าในการแก้ไขปัญหานี้หรือไม่ มีวิธีการสร้างแบบจำลองหลักการมากขึ้นหรือวิธีการเปรียบเทียบการทดสอบแบบไคสแควร์หลายวิธีหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.