สมมติว่าฉันมีการทดสอบด้วยสองปัจจัยขึ้นไป ANOVA โดยรวมถูกสร้างขึ้นจากนั้นเราติดตามด้วยชุดการทดสอบpost hocสองชุดขึ้นไปพูดเปรียบเทียบหลาย ๆ อย่าง คำถามของฉันเกี่ยวกับขนาดใหญ่และจำนวนครอบครัวที่ควรใช้เป็นพื้นฐานสำหรับการปรับหลายหลากของการทดสอบหลังการโพสต์นี้
ตัวอย่างคือชุดข้อมูล warp-break จากหนังสือของ Tukey บน EDA มีสองปัจจัย: wool
(ที่สองระดับ) และtension
(ที่สามระดับ) ตาราง ANOVA คือ:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
เห็นได้ชัดว่ามีความจำเป็นต้องมีปฏิสัมพันธ์ในรูปแบบ ดังนั้นเราจึงตัดสินใจทำการเปรียบเทียบระดับของแต่ละปัจจัยโดยคงปัจจัยอื่นไว้ ผลลัพธ์อยู่ด้านล่างโดยมีคำอธิบายประกอบที่จะอ้างอิงในภายหลัง:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
ฉันคิดว่ามีวิธีปฏิบัติที่แตกต่างกันออกไปและฉันสงสัยว่าสิ่งใดเป็นเรื่องที่พบได้บ่อยที่สุด ในการคำนวณปรับ ค่าเราควรทำการปรับหลายหลากสำหรับ ...
- แต่ละครอบครัวที่เล็กที่สุดทั้งห้า (T | A, T | B, ... , W | H) แยกกันหรือไม่ (หมายเหตุ - 3 ตระกูลสุดท้ายมีเพียงการทดสอบเดียวดังนั้นจะไม่มีการปรับหลายหลากสำหรับการทดสอบเหล่านั้น)
- ครอบครัวใหญ่แต่ละครอบครัว (T, 6 การทดสอบและ W, 3 การทดสอบ) แยกกันหรือไม่?
- ทั้งหมด การทดสอบถือเป็นครอบครัวใหญ่หรือไม่?
ฉันสนใจทั้งในสิ่งที่คนทั่วไปทำ (แม้ว่าพวกเขาจะไม่ได้คิดมาก) และทำไม (ถ้ามี) สองสิ่งที่ฉันอาจกล่าวถึงคือ:
- มี 3 การทดสอบในตาราง ANOVA ฉันจำไม่ได้ว่ามีใครพิจารณาการปรับความหลากหลายของการทดสอบ ANOVA หากเป็นเช่นนั้นและคุณแนะนำตัวเลือก (3) คุณไม่สอดคล้องหรือไม่?
- หากเราทำการทดลองที่มีขนาดเล็กลงซึ่งการทดสอบทั้งหมดมีประสิทธิภาพน้อยกว่าก็เป็นไปได้ที่การโต้ตอบจะไม่สำคัญทำให้มีการเปรียบเทียบโพสต์เฉพาะกิจน้อยจำนวนเล็กน้อยเท่านั้น ยิ่งกว่านั้นค่าเฉลี่ยเล็กน้อยอาจมีค่า SEs น้อยกว่าค่าเฉลี่ยของเซลล์ในการทดสอบขนาดใหญ่ หากนอกจากนี้การปรับหลายหลากเป็นแบบอนุรักษ์นิยมน้อยเราอาจมีผลลัพธ์ "สำคัญ" มากขึ้นโดยมีข้อมูลน้อยกว่าที่เรามีกับข้อมูลมากขึ้น
สนใจที่จะเห็นสิ่งที่ผู้คนพูด ...