เป็นความผิดหรือไม่ที่จะใช้ ANOVA แทนที่จะใช้ t-test เพื่อเปรียบเทียบสองวิธี?


11

ฉันมีการกระจายเงินเดือนและฉันต้องการเปรียบเทียบความแตกต่างของค่าเฉลี่ยสำหรับชายและหญิง ฉันรู้ว่ามีนักเรียน T-test สำหรับเปรียบเทียบสองวิธี แต่หลังจากแนะนำ ANOVA ฉันได้รับการวิจารณ์ว่า ANOVA นั้นสำหรับเปรียบเทียบมากกว่าสองวิธี

มีอะไรผิดพลาดในการใช้มันเพื่อเปรียบเทียบเพียง 2 หมายความว่าอย่างไร


9
ใครบอกว่ามันผิด
gung - Reinstate Monica

1
ทำไมคุณไม่ใช้ถ้อยคำใหม่เพื่อระงับคำถามใด ๆ ? มีบางสิ่งในแนวของ "ANOVA เทียบเท่ากับ t-test เมื่อเปรียบเทียบสองกลุ่มหรือไม่" เพียงแค่ความคิด ... ฉันจะต้องรับผิดชอบสำหรับวิธีการต้อนรับคำถามคือวิธีใด :-) ไม่มี
อันโต Parellada

4
หรือปรับเปลี่ยนคำถามของคุณเพื่อแสดงให้คนอื่นเห็นว่ามันผิด ... เราสามารถอธิบายได้ว่าพวกเขาเข้าใจผิด ความยากลำบากของที่นี่คือหลักฐานของคำถาม (ว่ามันผิด) ผิดพลาด
Glen_b -Reinstate Monica

1
แม้ว่าหลักฐานจะผิดพลาดคำถามนี้ดูเหมือนจะไม่ปิดหัวข้อหรือไม่ชัดเจนว่าไม่สามารถตอบได้ (แน่นอนมีการตอบแล้ว) ฉันคิดว่านี่คงเปิดอยู่
gung - Reinstate Monica

1
ตกลงเห็นด้วย @ gung ฉันคิดว่าคำถามสะท้อนให้เห็นถึงการขาดความรู้เกี่ยวกับหัวข้อ ถ้ามันเป็นคำที่แตกต่างกัน (หรือ "ดีกว่า") จากนั้นคำถามอาจจะไม่ได้รับการถามเพราะแล้วพวกเขาจะได้รู้คำตอบแล้ว
D_ วิลเลียมส์

คำตอบ:


20

มันไม่ผิดและจะเทียบเท่ากับการทดสอบที่ถือว่าผลต่างเท่ากัน นอกจากนี้ด้วยสองกลุ่ม sqrt (f-statistic) เท่ากับ (aboslute value ของ) t-statistic ฉันค่อนข้างมั่นใจว่าการทดสอบด้วยความแปรปรวนที่ไม่เท่ากันนั้นไม่เทียบเท่า เนื่องจากคุณสามารถได้รับการประมาณการที่เหมาะสมเมื่อความแปรปรวนไม่เท่ากัน (ความแปรปรวนมักจะไม่เท่ากันกับทศนิยมบางตำแหน่ง) จึงอาจเหมาะสมที่จะใช้การทดสอบ t-test เนื่องจากยืดหยุ่นมากกว่า ANOVA (สมมติว่าคุณมีเพียงสองกลุ่ม)

ปรับปรุง:

นี่คือรหัสที่แสดงว่า t-statistic ^ 2 สำหรับความแปรปรวนที่เท่ากัน t-test แต่ไม่ใช่ t-test ที่ไม่เท่ากันนั้นเหมือนกับ f-statistic

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1 โปรดทราบว่าสามารถปรับ ANOVA / F-test แบบทางเดียวสำหรับความแปรปรวนที่ไม่เท่ากัน (cf. ทางเลือกแทน ANOVA แบบทางเดียวสำหรับข้อมูล heteroskedastic )
gung - Reinstate Monica

@gung ตกลง ฉันไม่แน่ใจเกี่ยวกับเรื่องนี้เพราะฉันไม่ได้ใช้ ANOVA ในบางครั้ง (ทำสิ่งที่เบย์)
D_ วิลเลียมส์

มีอยู่คนหนึ่งประโยชน์อื่น ๆ ที่จะดำเนินการเป็นทดสอบ: หากคุณมีสมมติฐานทิศทางคุณสามารถดำเนินการอย่างใดอย่างหนึ่งนกทดสอบ; ในทางตรงกันข้ามการทดสอบ ANOVA มักจะทดสอบสมมติฐานที่ไม่ใช่ทิศทาง tเสื้อเสื้อ
crsh

4

พวกเขาเทียบเท่า ANOVA ที่มีเพียงสองกลุ่มจะเทียบเท่ากับการทดสอบ t ข้อแตกต่างคือเมื่อคุณมีหลายกลุ่มดังนั้นข้อผิดพลาดประเภท I จะเพิ่มขึ้นสำหรับการทดสอบ t เนื่องจากคุณไม่สามารถทดสอบสมมติฐานร่วมกันได้ ANOVA ไม่ประสบปัญหานี้ในขณะที่คุณทดสอบร่วมกันผ่านการทดสอบ F


1
ฉันไม่คิดว่ามันจะสูญเสียพลังงานฉันคิดว่ามันเกี่ยวข้องกับข้อผิดพลาดประเภทที่ฉันทำมากกว่า โดยทั่วไปยิ่งมีการทดสอบมากเท่าไหร่คุณก็ยิ่งมีพลังมากขึ้นเท่านั้น
HelloWorld

ฉันเชื่อว่า (ตามที่ @StudentT พูดว่า) มันเป็นเรื่องของข้อผิดพลาดประเภทที่หนึ่งในหลักสูตรที่ฉันเรียนอยู่พวกเขากำลังทำให้เราใช้ "การแก้ไข Bonferroni" สำหรับสิ่งนี้ en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

ใช่คุณถูกต้อง มันไม่ควรจะเป็นพลังงาน (ประเภท II) แต่ข้อผิดพลาดประเภทที่ฉัน ฉันเชื่อว่าการใช้เหตุผลนั้นถูกต้อง แต่ด้วยเหตุผลบางอย่างที่ฉันเขียนขึ้นและไม่ใช่ข้อผิดพลาดประเภท 1 ฉันจะแก้ไขเพื่อให้แน่ใจว่าฉันไม่ได้หลอกใคร
robinsa
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.