คำถามติดแท็ก anova

ANOVA ย่อมาจาก Analysis Of VAriance ซึ่งเป็นโมเดลเชิงสถิติและชุดของขั้นตอนสำหรับการเปรียบเทียบค่าเฉลี่ยของหลายกลุ่ม ตัวแปรอิสระในรูปแบบ ANOVA เป็นหมวดหมู่ แต่ตาราง ANOVA สามารถใช้ในการทดสอบตัวแปรต่อเนื่องเช่นกัน

2
ลำดับของตัวแปรใน ANOVA นั้นสำคัญหรือไม่
ฉันถูกต้องหรือไม่ที่จะเข้าใจว่าลำดับของตัวแปรที่ระบุในการวิเคราะห์ความแปรปรวนทำให้เกิดความแตกต่าง แต่ลำดับนั้นไม่สำคัญเมื่อทำการถดถอยเชิงเส้นหลายครั้ง? ดังนั้นสมมติว่าผลลัพธ์เช่นการสูญเสียเลือดที่วัดได้ yและตัวแปรเด็ดขาดสองอย่าง วิธี adenoidectomy a , bวิธีการผ่าตัด โมเดลy~a+bแตกต่างจากโมเดลy~b+a(หรือดังนั้นการนำไปใช้ของฉันใน R ดูเหมือนจะบ่งบอก) ฉันถูกต้องหรือไม่ที่จะเข้าใจว่าคำนี้คือ ANOVA เป็นรูปแบบลำดับขั้นเนื่องจากมันเป็นคุณลักษณะแรกที่มีความแปรปรวนมากที่สุดเท่าที่จะเป็นไปได้สำหรับปัจจัยแรกก่อนที่จะลองคำนวณความแปรปรวนที่เหลือกับปัจจัยที่สอง ในตัวอย่างข้างต้นลำดับชั้นทำให้รู้สึกเพราะฉันมักจะทำ adenoidectomy ก่อนที่จะทำต่อมทอนซิล แต่สิ่งที่จะเกิดขึ้นหากมีสองตัวแปรที่ไม่มีคำสั่งโดยธรรมชาติ?

4
ในทางปฏิบัติผู้คนจัดการกับ ANOVA อย่างไรเมื่อข้อมูลไม่เป็นไปตามสมมติฐาน
นี่ไม่ใช่คำถามเกี่ยวกับสถิติอย่างเด็ดขาด - ฉันสามารถอ่านหนังสือเรียนทั้งหมดเกี่ยวกับสมมติฐานของ ANOVA ได้ - ฉันพยายามคิดว่านักวิเคราะห์การทำงานจริงจัดการกับข้อมูลที่ไม่ตรงตามสมมติฐาน ฉันได้ผ่านคำถามมากมายในเว็บไซต์นี้เพื่อค้นหาคำตอบและฉันค้นหาโพสต์เกี่ยวกับเวลาที่จะไม่ใช้ ANOVA (ในบริบททางคณิตศาสตร์นามธรรมในอุดมคติ) หรือวิธีการทำสิ่งที่ฉันอธิบายด้านล่างใน R. พยายามคิดให้ดีว่าการตัดสินใจของผู้คนเป็นอย่างไรและทำไม ฉันกำลังทำการวิเคราะห์ข้อมูลที่จัดกลุ่มจากต้นไม้ (ต้นไม้จริงไม่ใช่ต้นไม้ทางสถิติ) ในสี่กลุ่ม ฉันได้รับข้อมูลเกี่ยวกับคุณลักษณะ 35 รายการสำหรับต้นไม้แต่ละต้นและฉันจะผ่านแต่ละแอตทริบิวต์เพื่อตรวจสอบว่ากลุ่มแตกต่างกันอย่างมีนัยสำคัญในคุณลักษณะนั้นหรือไม่ อย่างไรก็ตามในสองกรณีสมมติฐาน ANOVA นั้นถูกละเมิดเล็กน้อยเนื่องจากความแปรปรวนไม่เท่ากัน (ตามการทดสอบของ Levene โดยใช้ alpha = .05) ตามที่ฉันเห็นตัวเลือกของฉันคือ: 1. พลังแปลงข้อมูลและดูว่ามันเปลี่ยน Levene p-val หรือไม่ 2. ใช้การทดสอบแบบไม่อิงพารามิเตอร์เช่น Wilcoxon (ถ้าเป็นเช่นนั้นแบบไหน?) 3. การแก้ไขผลลัพธ์ ANOVA บางอย่างเช่น Bonferroni (ฉันไม่แน่ใจว่ามีอะไรเช่นนี้หรือไม่) ฉันได้ลองสองตัวเลือกแรกและได้ผลลัพธ์ที่แตกต่างกันเล็กน้อย - ในบางกรณีวิธีการหนึ่งมีความสำคัญและอีกวิธีหนึ่งไม่ ฉันกลัวที่จะตกอยู่ในกับดักจับปลา p-value และฉันกำลังมองหาคำแนะนำที่จะช่วยให้ฉันพิสูจน์ว่าวิธีการใช้งานแบบใด …

2
วัด ANOVA ซ้ำด้วย lme / lmer ใน R สำหรับปัจจัยภายในสองเรื่อง
ฉันพยายามใช้lmeจากnlmeแพ็คเกจเพื่อทำซ้ำผลลัพธ์จากaovมาตรการ ANOVAs ซ้ำ ๆ ฉันได้ทำสิ่งนี้สำหรับการทดสอบซ้ำปัจจัยเดียวและสำหรับการทดสอบสองปัจจัยด้วยปัจจัยหนึ่งระหว่างวิชาและอีกหนึ่งปัจจัยในวิชา แต่ฉันมีปัญหาในการทดลองสองปัจจัยกับสองภายใน - หัวข้อย่อย ตัวอย่างที่แสดงด้านล่าง AและBเป็นปัจจัยที่มีผลคงที่และsubjectเป็นปัจจัยที่มีผลแบบสุ่ม set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = …

3
มีการทดสอบ Kruskal Wallis ทางเดียวสำหรับแบบจำลองสองทางหรือไม่?
หากแบบจำลองนั้นไม่เป็นไปตามสมมติฐานของ ANOVA (โดยเฉพาะในภาวะปกติ) หากเป็นแบบทางเดียวแนะนำให้ทำการทดสอบแบบไม่ใช้พารามิเตอร์ของ Kruskal-Wallis แต่ถ้าคุณมีหลายปัจจัย

2
คุณ“ ควบคุม” สำหรับปัจจัย / ตัวแปรอย่างไร
เพื่อความเข้าใจของฉัน "การควบคุม" สามารถมีความหมายสองอย่างในสถิติ กลุ่มควบคุม: ในการทดสอบจะไม่มีการรักษาให้กับสมาชิกของกลุ่มควบคุม ตัวอย่าง: ยาหลอกเทียบกับยา: คุณให้ยาแก่กลุ่มหนึ่งและไม่ให้อีกกลุ่มหนึ่ง (กลุ่มควบคุม) ซึ่งเรียกอีกอย่างว่า "การทดลองที่ควบคุม" การควบคุมตัวแปร: เทคนิคการแยกเอฟเฟกต์ของตัวแปรอิสระเฉพาะ ชื่ออื่นที่ให้กับเทคนิคนี้คือ "การบัญชีสำหรับ", "การถือค่าคงที่", "การควบคุมสำหรับ", ตัวแปรบางตัว ตัวอย่างเช่น: ในการศึกษาดูฟุตบอล (เหมือนหรือไม่ชอบ) คุณอาจต้องการใช้เอฟเฟกต์ของเพศเมื่อเราคิดว่าเพศเป็นสาเหตุของความลำเอียงนั่นคือผู้ชายอาจชอบมากกว่าผู้หญิง ดังนั้นคำถามของฉันมีไว้สำหรับจุด (2) สองคำถาม: คุณ "ควบคุม" / "บัญชีสำหรับ" ตัวแปรโดยทั่วไปได้อย่างไร ใช้เทคนิคอะไร (ในแง่ของการถดถอยกรอบ ANOVA) ในตัวอย่างด้านบนการเลือกชายและหญิงจะเป็นการควบคุมแบบสุ่มหรือไม่? นั่นคือ "การสุ่ม" เป็นหนึ่งในเทคนิคในการควบคุมเอฟเฟกต์อื่น ๆ หรือไม่?

3
ANOVA ควรใช้มาตรการซ้ำ ๆ มากกว่าแบบจำลองเอฟเฟกต์เมื่อใด
ในการตอบคำถามนี้เกี่ยวกับว่าการออกแบบของฉันที่ฉันนำเสนอผู้เข้าร่วมด้วยภาพจากหมวดหมู่ที่แตกต่างกันเป็นตัวอย่างที่ฉันควรใช้มาตรการ ANOVA ซ้ำ ๆ หรือไม่ฉันได้รับคำตอบว่าฉันควรใช้รูปแบบผสมแทนด้วยหนึ่งใน เหตุผลที่ทำให้ฉันมีการพึ่งพาสองรูปแบบ: สำหรับวิชาและสำหรับหมวดหมู่ คำถามของฉันคือตอนนี้: มันไม่ใช่กรณีที่คุณมีสองการพึ่งพาในลักษณะนี้เมื่อทำการออกแบบมาตรการซ้ำ ๆ แบบนี้หรือไม่? นั่นคือภายใต้สถานการณ์ใดที่ ANOVA จะทำซ้ำมาตรการจะดีกว่าวิธีการสร้างแบบจำลองผลกระทบผสมและทำไม?

1
Bonferroni หรือ Tukey? จำนวนการเปรียบเทียบมีขนาดใหญ่เมื่อใด
การค้นพบสถิติการอ่านของฟิลด์โดยใช้ SPSS (ฉบับที่ 3) ฉันรู้สึกสับสนเล็กน้อยเกี่ยวกับการทดสอบหลังเหตุการณ์ใน ANOVA สำหรับผู้ที่ต้องการควบคุมอัตราความผิดพลาด Type I เขาแนะนำ Bonferroni หรือ Tukey และพูดว่า (หน้า 374): Bonferroni มีพลังมากขึ้นเมื่อจำนวนการเปรียบเทียบมีขนาดเล็กในขณะที่ Tukey มีประสิทธิภาพมากกว่าเมื่อทดสอบค่าเฉลี่ยจำนวนมาก ควรวาดเส้นตรงระหว่างจำนวนที่น้อยและมาก

1
ทำไมต้องใช้ ANOVA เลยแทนที่จะกระโดดเข้าสู่การทดสอบแบบโพสต์เฉพาะกิจหรือการวางแผนเปรียบเทียบ
เมื่อมองสถานการณ์ ANOVA ระหว่างกลุ่มคุณจะได้อะไรจากการทำแบบทดสอบ ANOVA ก่อนและหลังทำการทดสอบ (Bonferroni, Šidák ฯลฯ ) หรือการทดสอบเปรียบเทียบที่วางแผนไว้ ทำไมไม่ข้ามขั้นตอน ANOVA ทั้งหมด? ฉันรวบรวมว่าในสถานการณ์เช่นนี้ประโยชน์อย่างหนึ่งของ ANOVA ระหว่างกลุ่มคือความสามารถในการใช้ HSD ของ Tukey เป็นแบบทดสอบหลังเลิกเรียน หลังต้องการตารางภายในกลุ่มหมายถึงจากตาราง ANOVA เพื่อคำนวณข้อผิดพลาดมาตรฐานที่เกี่ยวข้อง แต่การปรับ Bonferroni และŠidákเป็นการทดสอบ t-unpaired นั้นไม่จำเป็นต้องมีการวิเคราะห์ ANOVA ใด ๆ ฉันอยากจะถามคำถามเดียวกันเกี่ยวกับสถานการณ์ ANOVA ภายในกลุ่ม ฉันรู้ว่าในกรณีเช่นนี้การทดสอบ HSD ของ Tukey ไม่ได้เป็นการพิจารณาที่เกี่ยวข้องทำให้คำถามนี้มีความกดดันมากขึ้น

1
เหตุใด t-test และ ANOVA จึงให้ค่า p แตกต่างกันสำหรับการเปรียบเทียบสองกลุ่ม
ในบทความ Wikipedia เกี่ยวกับANOVAมันบอกว่า ในรูปแบบที่ง่ายที่สุด ANOVA จัดให้มีการทดสอบทางสถิติว่าค่าเฉลี่ยของหลาย ๆ กลุ่มมีค่าเท่ากันหรือไม่และดังนั้นจึงทำให้การทดสอบ t-test เป็นมากกว่าสองกลุ่ม ความเข้าใจของฉันเกี่ยวกับเรื่องนี้คือ ANOVA นั้นเหมือนกับ t-test เมื่อเปรียบเทียบกับกลุ่มสองกลุ่ม อย่างไรก็ตามในตัวอย่างง่าย ๆ ของฉันด้านล่าง (ใน R) การวิเคราะห์ความแปรปรวนและการทดสอบ t ให้ค่า p ที่เหมือนกัน แต่แตกต่างกันเล็กน้อย มีใครอธิบายได้บ้างไหม x1=rnorm(100,mean=0,sd=1) x2=rnorm(100,mean=0.5,sd=1) y1=rnorm(100,mean=0,sd=10) y2=rnorm(100,mean=0.5,sd=10) t.test(x1,x2)$p.value # 0.0002695961 t.test(y1,y2)$p.value # 0.8190363 df1=as.data.frame(rbind(cbind(x=x1,type=1), cbind(x2,type=2))) df2=as.data.frame(rbind(cbind(x=y1,type=1), cbind(y2,type=2))) anova(lm(x~type,df1))$`Pr(>F)`[1] # 0.0002695578 anova(lm(x~type,df2))$`Pr(>F)`[1] # 0.8190279

1
สูตรชีต ANOVA ตัวอักษรซุปและการถดถอยเท่าเทียมกัน
ฉันสามารถขอความช่วยเหลือในการพยายามรับตลับลูกปืนของฉันให้เทียบเท่ากับ ANOVA และ REGRESSION ได้หรือไม่? ฉันพยายามปรับความคิดศัพท์ศัพท์และไวยากรณ์ของวิธีการทั้งสองนี้ มีโพสต์จำนวนมากในไซต์นี้เกี่ยวกับความเหมือนกันของพวกเขาเช่นนี้หรือนี่แต่ก็ยังดีที่มีแผนที่ "คุณอยู่ที่นี่" อย่างรวดเร็วเมื่อเริ่มต้น ฉันวางแผนที่จะอัพเดทโพสต์นี้และหวังว่าจะได้รับความช่วยเหลือในการแก้ไขข้อผิดพลาด ANOVA ทางเดียว: Structure: DV is continuous; IV is ONE FACTOR with different LEVELS. Scenario: miles-per-gal. vs cylinders Note that Income vs Gender (M, F) is a t-test. Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit) Regression: fit …

1
MANOVA เกี่ยวข้องกับ LDA อย่างไร
ในหลาย ๆ ที่ฉันเห็นการกล่าวอ้างว่า MANOVA เป็นเหมือน ANOVA บวกกับการวิเคราะห์จำแนกเชิงเส้น (LDA) แต่มันถูกสร้างขึ้นด้วยวิธีการโบกมือด้วยมือเสมอ ฉันอยากจะรู้ว่ามันควรจะหมายถึงอะไรกันแน่ ผมพบว่าตำราต่างๆที่อธิบายถึงรายละเอียดทั้งหมดของการคำนวณ MANOVA แต่มันดูเหมือนว่าจะเป็นเรื่องยากมากที่จะหาการอภิปรายทั่วไปดี (นับประสาภาพ ) เข้าถึงได้ให้กับคนที่ไม่ได้เป็นสถิติ

2
ฉันจะได้รับ ANOVA โดยรวมที่สำคัญได้อย่างไร
ฉันแสดงด้วย ANOVA R และฉันก็มีความแตกต่างที่สำคัญ อย่างไรก็ตามเมื่อตรวจสอบว่าคู่ไหนมีความแตกต่างอย่างมีนัยสำคัญโดยใช้ขั้นตอนของ Tukey ฉันไม่ได้รับเลย สิ่งนี้จะเป็นไปได้อย่างไร นี่คือรหัส: fit5_snow<- lm(Response ~ Stimulus, data=audio_snow) anova(fit5_snow) > anova(fit5_snow) Analysis of Variance Table Response: Response Df Sum Sq Mean Sq F value Pr(>F) Stimulus 5 73.79 14.7578 2.6308 0.02929 * Residuals 84 471.20 5.6095 --- Signif. codes: 0 '***' 0.001 '**' 0.01 …

1
ฉันคำนวณอัตราส่วนความน่าจะเป็นได้เหล่านี้ถูกต้องหรือไม่
ฉันเป็นผู้เขียนแพ็กเกจ ezสำหรับ R และฉันกำลังดำเนินการอัปเดตเพื่อรวมการคำนวณอัตโนมัติของอัตราส่วนความน่าจะเป็น (LRs) ในผลลัพธ์ของ ANOVAs ความคิดคือการให้ LR สำหรับแต่ละผลที่คล้ายกับการทดสอบของผลกระทบที่ ANOVA ประสบความสำเร็จ ตัวอย่างเช่น LR สำหรับเอฟเฟ็กต์หลักหมายถึงการเปรียบเทียบโมเดลโมฆะกับโมเดลที่มีเอฟเฟกต์หลัก LR สำหรับการโต้ตอบแสดงถึงการเปรียบเทียบของโมเดลที่มีเอฟเฟกต์หลักทั้งสองส่วนประกอบกับโมเดลที่มีเอฟเฟกต์หลักและปฏิสัมพันธ์ของพวกเขา ฯลฯ ตอนนี้ความเข้าใจของฉันเกี่ยวกับการคำนวณ LR มาจากGlover & Dixon ( PDF ) ซึ่งครอบคลุมการคำนวณพื้นฐานรวมถึงการแก้ไขความซับซ้อนและภาคผนวกของBortolussi & Dixon ( ภาคผนวก PDF ) ซึ่งครอบคลุมการคำนวณที่เกี่ยวข้องกับตัวแปรการวัดซ้ำ เพื่อทดสอบความเข้าใจของฉันฉันได้พัฒนาสเปรดชีตนี้ซึ่งใช้ dfs & SS จากตัวอย่าง ANOVA (สร้างจากการออกแบบ 2 * 2 * 3 * 4 โดยใช้ข้อมูลปลอม) และขั้นตอนในการคำนวณ …

1
ตรรกะที่อยู่เบื้องหลังการทดสอบ F-ANOVA ในการถดถอยเชิงเส้นอย่างง่าย
ฉันพยายามที่จะเข้าใจตรรกะที่อยู่เบื้องหลังการทดสอบ ANOVA F ในการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย คำถามที่ฉันมีดังต่อไปนี้ เมื่อค่า F คือ MSR/MSEมีขนาดใหญ่เรายอมรับแบบจำลองเป็นสำคัญ เหตุผลเบื้องหลังนี้คืออะไร?
17 regression  anova 

1
วิธีการเลือกระหว่าง ANOVA และ ANCOVA ในการทดลองออกแบบ?
ฉันกำลังทำการทดลองซึ่งมีสิ่งต่อไปนี้: DV: ปริมาณการใช้ชิ้น (ต่อเนื่องหรืออาจจัดเป็นหมวดหมู่) IV: ข้อความเพื่อสุขภาพ, ข้อความที่ไม่แข็งแรง, ไม่มีข้อความ (กลุ่มควบคุม) (3 กลุ่มที่ผู้คนได้รับมอบหมายแบบสุ่ม - หมวดหมู่) นี่คือข้อความที่จัดการเกี่ยวกับความสมบูรณ์ของชิ้น ตัวแปร IV ต่อไปนี้ถือได้ว่าเป็นตัวแปรที่แตกต่างของแต่ละบุคคล: Impulsivity (ซึ่งอาจเป็นหมวดหมู่เช่น. สูงเทียบกับต่ำหรือต่อเนื่องและวัดโดยขนาด) การตั้งค่ารสหวาน (นอกจากนี้ยังวัดโดยแบบสอบถามซึ่งมี 3 ตัวเลือกให้เลือกสำหรับแต่ละคำถาม) ค่าดัชนีมวลกาย - ผู้เข้าร่วมจะได้รับการชั่งน้ำหนักวัดตาม (ซึ่งอาจพิจารณาได้ทั้งหมวดหมู่หรือต่อเนื่อง) เนื่องจากกลุ่มจะได้รับการสุ่มให้เป็นหนึ่งใน 3 กลุ่มฉันคิดว่าฉันกำลังทำ ANOVA บางประเภทและอาจใช้ Factorial ANOVA เนื่องจากฉันสนใจว่า IV มีผลต่อ DV มากที่สุด แต่ยังมีปฏิสัมพันธ์ระหว่าง IV ด้วยเช่นกัน มีความสัมพันธ์ระหว่างชุดค่าผสมบางอย่าง แต่ฉันไม่แน่ใจในเรื่องนี้อย่างสมบูรณ์เนื่องจากต้องการทราบว่าเป็นการดีที่สุดหรือไม่ที่จะให้ IV มีหมวดหมู่ทั้งหมดหรือต่อเนื่องหรือผสมกัน หรือ ANCOVA เป็นไปได้หรือแม้กระทั่งการถดถอย …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.