สถิติและข้อมูลขนาดใหญ่ anova

3

ความไม่เหมาะสมของ ANOVA หลังจากการวิเคราะห์กลุ่ม k-mean

การแจ้งเตือนหลังจากตาราง ANOVA หลังจากการวิเคราะห์ค่า K บ่งชี้ว่าระดับความสำคัญไม่ควรถูกมองว่าเป็นการทดสอบที่มีความหมายเท่ากันเนื่องจากโซลูชันคลัสเตอร์ได้รับมาจากระยะทางแบบยุคลิดเพื่อเพิ่มระยะทาง ฉันควรใช้การทดสอบแบบใดเพื่อแสดงว่าค่าเฉลี่ยของตัวแปรการจัดกลุ่มแตกต่างกันในกลุ่มหรือไม่ ฉันได้เห็นคำเตือนนี้ในตารางค่า ANOVA ของ k- หมายถึงเอาต์พุต แต่ในการอ้างอิงบางอย่างฉันเห็นว่าการทดสอบ ANOVA หลังการเรียกใช้ ฉันควรละเว้น k-mean ANOVA และรัน one-way ANOVA ด้วยการทดสอบหลังการแปลและตีความมันด้วยวิธีดั้งเดิมหรือไม่? หรือฉันสามารถบอกนัยเกี่ยวกับขนาดของค่า F เท่านั้นและตัวแปรใดที่ทำให้เกิดความแตกต่างมากขึ้น? ความสับสนอีกประการหนึ่งคือตัวแปรการจัดกลุ่มไม่ได้กระจายการละเมิดสมมติฐานของ ANOVA จากนั้นฉันสามารถใช้การทดสอบที่ไม่ใช่พารามิเตอร์ของ Kruskal-Wallis แต่มีข้อสันนิษฐานเกี่ยวกับการแจกแจงแบบเดียวกัน การกระจายระหว่างกลุ่มสำหรับตัวแปรเฉพาะนั้นดูเหมือนจะไม่เหมือนกันบางตัวมีความเบ้เชิงบวกบางตัวมีค่าเป็นลบ ... ฉันมีตัวอย่างขนาดใหญ่ 1275 กลุ่ม 5 กลุ่มตัวแปรการทำคลัสเตอร์ 10 ตัวที่วัดในคะแนน PCA

14 anova k-means

1

ANOVA คำนวณอย่างไรสำหรับการออกแบบการวัดซ้ำ: aov () vs lm () ใน R

ชื่อกล่าวมันทั้งหมดและฉันสับสน ต่อไปนี้ใช้มาตรการ aov () ซ้ำในอาร์และเรียกใช้สิ่งที่ฉันคิดว่าเป็นการเรียก lm () เทียบเท่า แต่พวกเขากลับค่าความผิดพลาดที่แตกต่างกัน (แม้ว่าจำนวนสแควร์สจะเท่ากัน) เห็นได้ชัดว่าค่าตกค้างและค่าติดตั้งจาก aov () เป็นค่าที่ใช้ในแบบจำลองเนื่องจากผลรวมของกำลังสองของพวกเขารวมกันในแต่ละรูปแบบ / ผลรวมที่เหลือของกำลังสองที่รายงานโดยสรุป (my.aov) ดังนั้นโมเดลเชิงเส้นจริงที่ใช้กับการออกแบบการวัดซ้ำคืออะไร set.seed(1) # make data frame, # 5 participants, with 2 experimental factors, each with 2 levels # factor1 is A, B # factor2 is 1, 2 DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), …

14 r anova repeated-measures linear-model

1

วิธีการกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการวัด ANOVA ซ้ำแล้วซ้ำอีก?

ฉันต้องการความช่วยเหลือเกี่ยวกับ ANOVA การวัดซ้ำ เรากำลังตรวจสอบผลของการแทรกแซงเพื่อลดอัตราการติดเชื้อในกระแสเลือด (BSI) ในผู้ป่วยบางราย เราวางแผนที่จะรวบรวมข้อมูลอัตรา BSI เป็นรายเดือน 12 เดือนโดยไม่มีการแทรกแซงก่อนจากนั้น 12 เดือนด้วยการแทรกแซง เรากำลังคิดที่จะทำแบบอนุกรมเวลาหรือการวัด ANOVA ซ้ำ ๆ ฉันชอบอันที่ใหม่กว่าก่อนที่ฉันจะไม่มีความคิดมากที่จะทำในคำถามแรก (คำถามพิเศษ: คะแนนเวลาน้อยเกินไปใช่มั้ย) แต่มาถึงตรงนี้แล้ว ปัญหาอีกประการหนึ่งเราต้องแสดงวอร์ดกี่คนที่มีผลกระทบที่สำคัญทางสถิติของการแทรกแซงอัตรา BSI ฉันคิดว่าฉันจะทำ ANOVA สองอันหนึ่งรายการสำหรับ "ก่อนการแทรกแซง" ส่วนหนึ่งสำหรับ "ระหว่างการแทรกแซง" และฉันคิดว่า ANOVA "ก่อนการแทรกแซง" ไม่ควรมีการทดสอบ F-ratio ที่สำคัญ ฉันพิจารณาคำว่า "ขนาดตัวอย่าง" สองมิติไม่ว่าจะเป็นจำนวนหอผู้ป่วยหรือจำนวนการวัดซ้ำ

14 anova repeated-measures sample-size power

1

ความเท่าเทียมกันของ (0 + ปัจจัย | กลุ่ม) และ (1 | กลุ่ม) + (1 | กลุ่ม: ปัจจัย) ข้อมูลจำเพาะของผลกระทบแบบสุ่มในกรณีที่สัดส่วนสมมาตร

ดักลาสเบตส์กล่าวว่าแบบจำลองต่อไปนี้เทียบเท่ากัน "ถ้าเมทริกซ์ความแปรปรวนร่วมแปรปรวนสำหรับเอฟเฟกต์สุ่ม - ค่าเวกเตอร์มีรูปแบบพิเศษเรียกว่าสมมาตรผสม" ( สไลด์ 91 ในการนำเสนอนี้ ): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) เบตส์เฉพาะใช้ตัวอย่างนี้: library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine …

13 r anova mixed-model repeated-measures lme4-nlme

1

ANOVA นั้นขึ้นอยู่กับวิธีการของช่วงเวลาและไม่ใช่โอกาสสูงสุดหรือไม่?

ฉันเห็นว่ามีการพูดถึงในสถานที่ต่าง ๆ ที่ ANOVA ทำการประมาณโดยใช้วิธีการของช่วงเวลา ฉันสับสนกับคำยืนยันดังกล่าวเพราะแม้ว่าฉันจะไม่คุ้นเคยกับวิธีการของช่วงเวลา แต่ความเข้าใจของฉันคือมันเป็นสิ่งที่แตกต่างจากและไม่เทียบเท่ากับวิธีการของโอกาสสูงสุด; ในอีกทางหนึ่งการวิเคราะห์ความแปรปรวนสามารถถูกมองว่าเป็นการถดถอยเชิงเส้นด้วยตัวพยากรณ์เชิงหมวดหมู่และการประมาณค่า OLS ของพารามิเตอร์การถดถอยเป็นโอกาสสูงสุด ดังนั้น: สิ่งที่มีคุณสมบัติขั้นตอนการวิเคราะห์ความแปรปรวนเป็นวิธีการของช่วงเวลา? ระบุว่า ANOVA นั้นเทียบเท่ากับ OLS ที่มีตัวพยากรณ์หมวดหมู่ไม่ได้หรือไม่? หากทั้งสองวิธีใดที่กลายเป็นสิ่งที่เทียบเท่าในกรณีพิเศษของ ANOVA ปกติจะมีสถานการณ์ ANOVA เฉพาะบางอย่างหรือไม่เมื่อความแตกต่างมีความสำคัญ? การออกแบบที่ไม่สมดุล? มาตรการซ้ำแล้วซ้ำอีก? การออกแบบแบบผสม (ระหว่างวิชา + ภายในวิชา)?

13 anova mixed-model maximum-likelihood method-of-moments

1

เท่าไหร่ขนาดเล็กสามารถ

อินโทร:หลังจากที่สังเกตเห็นความสนใจที่ได้รับในวันนี้จากคำถามนี้ " ANOVA จะมีความสำคัญหรือไม่หากไม่มีการทดสอบแบบ pairwise t? " ฉันคิดว่าฉันอาจสามารถ reframe ในวิธีที่น่าสนใจซึ่งสมควรได้รับคำตอบของตัวเอง . ความหลากหลายของผลไม่ลงรอยกัน (มูลค่าที่ตรา) สามารถเกิดขึ้นเมื่อนัยสำคัญทางสถิติเป็นที่เข้าใจกันว่าเป็นขั้วที่เรียบง่ายและตัดสินบนพื้นฐานเพียงของซึ่งเป็นสูงกว่าpppหรือααα\alpha@ Glen_b คำตอบสำหรับคำถามข้างต้นแสดงตัวอย่างที่มีประโยชน์ของกรณีที่: ANOVA FFFทดสอบสร้างpF<.05pF<.05p_F<.05สำหรับหนึ่งตัวแปรอิสระ (IV) กับสี่ระดับ แต่ pt>.08pt>.08p_t>.08สำหรับทุกสองตัวอย่างttt -tests ที่เปรียบเทียบความแตกต่างในตัวแปรเดียวกัน (DV) ในหมู่สังเกตสอดคล้องกับคู่ของ IV สี่แต่ละระดับ กรณีที่คล้ายกันเกิดขึ้นแม้จะมีการแก้ไข Bonferroni สำหรับการเปรียบเทียบแบบคู่หลังด้วยคำถามนี้: การวัดซ้ำของ Anova มีความสำคัญ แต่การเปรียบเทียบหลาย ๆ ครั้งกับการแก้ไข Bonferroni ไม่ได้เป็นเช่นนั้นหรือ? กรณีที่กล่าวถึงก่อนหน้านี้ที่มีการทดสอบแตกต่างกันเล็กน้อยในการถดถอยหลายครั้งก็มีอยู่: ทำไมจึงเป็นไปได้ที่จะได้รับสถิติ F อย่างมีนัยสำคัญ (p <.001) แต่การทดสอบ t regressor ไม่สำคัญ? : …

13 hypothesis-testing anova statistical-significance t-test multiple-comparisons

3

เหตุใดเราจึงใช้การทดสอบ F-test แบบหางเดียวในการวิเคราะห์ความแปรปรวน (ANOVA)

คุณสามารถให้เหตุผลในการใช้การทดสอบแบบหางเดียวในการวิเคราะห์การทดสอบความแปรปรวนได้หรือไม่? เหตุใดเราจึงใช้การทดสอบแบบหางเดียว - การทดสอบ F - ใน ANOVA

13 anova f-test sums-of-squares f-distribution

3

สถิติ F, ค่า F-critical และ P-value

ฉันใหม่มากในพื้นที่นี้และฉันมีความเข้าใจแนวคิดของการปฏิเสธสมมติฐานว่างตามผลลัพธ์จากตาราง ANOVA F ที่คำนวณได้และค่าวิกฤตมีความสัมพันธ์กับค่า p อย่างไร และถ้า F ที่คำนวณได้มากกว่า 1 นั่นแสดงว่าสมมติฐานว่างควรถูกปฏิเสธเสมอแม้ว่า p-value จะน้อยกว่า alpha หรือไม่? ขออภัยถ้าคำถามเหล่านี้เป็นสัญญาณของความไม่รู้ของฉัน แต่ฉัน 57 และกลับไปโรงเรียนหลังจาก 35 ปีที่ขาดหายไป! ขอบคุณสำหรับความช่วยเหลือ

13 anova

2

จะรับผลการทดสอบ Tukey HSD หลังการทดสอบในตารางที่แสดงคู่ที่จัดกลุ่มได้อย่างไร

ฉันชอบที่จะทำการทดสอบหลัง TukeyHSD หลังจาก Anova สองทางของฉันกับ R เพื่อรับตารางที่มีคู่ที่เรียงลำดับซึ่งจัดกลุ่มตามความแตกต่างที่สำคัญ (ขออภัยเกี่ยวกับถ้อยคำฉันยังใหม่กับสถิติ) ฉันต้องการที่จะมีอะไรเช่นนี้: ดังนั้นจัดกลุ่มด้วยดาวหรือตัวอักษร ความคิดใด ๆ ฉันทดสอบฟังก์ชั่นHSD.test()จากagricolaeแพ็คเกจ แต่ดูเหมือนว่ามันไม่ได้จัดการกับตารางแบบสองทาง

13 r anova multiple-comparisons post-hoc tukey-hsd

2

ตัวแปรตามสายวิวัฒนาการ: ANOVA?

ฉันเข้าใจว่าได้ค่าความแปรปรวนร่วมจากข้อมูลวิวัฒนาการทางพันธุกรรมเพื่อสร้างสำหรับตัวแปรสองตัวที่คุณกำลังทำการถดถอย แต่จะเกิดอะไรขึ้นถ้าคุณมีตัวแปรต่อเนื่องหนึ่งตัวซึ่งก่อนหน้านี้คุณได้แสดงให้เห็นว่าขึ้นอยู่กับไฟโตจีนีและตัวแปรอันดับหนึ่ง ลำดับหลังเป็นลำดับฉันไม่แน่ใจว่าจะเชื่อมโยงสิ่งนี้กับวิธีที่การพึ่งพาอาศัยสายวิวัฒนาการทำให้เกิดสถิติการทดสอบแบบเอนเอียงc o v ( X), วาย) = 0cov(X,Y)=0cov(X,Y) = 0 มันมีความหมายหรือไม่ที่จะคำนวณ Phylogenetic Independent Contrasts อิสระของ Felsenstein กับตัวแปรต่อเนื่องของคุณและใช้สำหรับ ANOVA ของคุณ? ค่า PIC คือ: คฉันเจ= ( Xผม- XJ)dฉันเจ--√Cij=(Xi−Xj)dijC_{ij} = \frac{(X_i - X_j)}{\sqrt{d_{ij}}} โดยที่คือXสำหรับสปีชีส์I , X jคือXสำหรับสปีชีส์j , และd i jคือระยะห่างระหว่างสปีชีส์iและjบนต้นไม้สายวิวัฒนาการXผมXiX_iXXXฉัน, XJi,Xji, X_jXXXJjjdฉันเจdijd_{ij}ผมiiJjj

13 anova phylogeny

3

จะหาคำที่ผิดพลาดใน factorial ANOVA ได้อย่างไร

เป็นคำถามพื้นฐานที่น่าสนใจมากเกี่ยวกับ ANOVA แบบหลายปัจจัย สมมติว่าการออกแบบสองทางที่เราทดสอบทั้งเอฟเฟกต์หลัก A, B และการโต้ตอบ A: B เมื่อทดสอบเอฟเฟกต์หลักสำหรับ A กับ type I SS เอฟเฟกต์ SS จะคำนวณเป็นผลต่างโดยที่R S S ( 1 )เป็นผลรวมข้อผิดพลาดที่เหลือของกำลังสองสำหรับ โมเดลที่มีเพียงจุดตัดและR S S ( A ) RSS สำหรับโมเดลที่มีปัจจัย A เพิ่ม คำถามของฉันเกี่ยวกับตัวเลือกสำหรับคำที่ผิดพลาด:RSS(1)−RSS(A)RSS(1)−RSS(A)RSS(1) - RSS(A)RSS(1)RSS(1)RSS(1)RSS(A)RSS(A)RSS(A) คุณจะแสดงให้เห็นว่าคำว่าข้อผิดพลาดสำหรับการทดสอบนี้มักจะคำนวณจาก RSS ของรุ่นเต็ม A + B + A: B ที่มีทั้งผลกระทบหลักและการมีปฏิสัมพันธ์? FA=(RSS1−RSSA)/(dfRSS1−dfRSSA)RSSA+B+A:B/dfRSSA+B+A:BFA=(RSS1−RSSA)/(dfRSS1−dfRSSA)RSSA+B+A:B/dfRSSA+B+A:B F_{A} = \frac{(RSS_{1} …

13 anova linear-model

4

ใช้ ANOVA กับเปอร์เซ็นต์หรือไม่

ฉันมีตารางที่มีสี่กลุ่ม (4 กลุ่ม BMI) เป็นตัวแปรอิสระ (ตัวคูณ) ฉันมีตัวแปรตามนั่นคือ "ร้อยละแม่สูบบุหรี่ในการตั้งครรภ์" อนุญาตให้ใช้ ANOVA สำหรับสิ่งนี้หรือฉันต้องใช้ไคสแควร์หรือการทดสอบอื่น ๆ

13 anova

4

โพสต์การทดสอบใน ANCOVA

คำถาม: วิธีการที่ดีในการดำเนินการทดสอบหลังความแตกต่างระหว่างกลุ่มหมายถึงหลังจากการปรับผลกระทบของ covariate คืออะไร? ตัวอย่างต้นแบบ: สี่กลุ่มผู้เข้าร่วม 30 คนต่อกลุ่ม (เช่นประชากรจิตวิทยาคลินิกสี่คน) ตัวแปรตามคือตัวเลข (เช่นคะแนนเชาวน์ปัญญา) Covariate เป็นตัวเลข (เช่นดัชนีสถานะทางเศรษฐกิจและสังคม) คำถามวิจัยเกี่ยวข้องว่าคู่ของกลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญกับตัวแปรตามหลังจากการควบคุมสำหรับค่า covariate คำถามที่เกี่ยวข้อง : วิธีการที่ต้องการคืออะไร? มีการนำไปใช้งานอะไรบ้างใน R มีการอ้างอิงทั่วไปเกี่ยวกับวิธีการเปลี่ยนแปลงของโควารีเอตสำหรับการดำเนินการทดสอบโพสต์เฉพาะกิจหรือไม่?

13 anova multiple-comparisons ancova

3

ทางเลือกสำหรับการแปรปรวนแบบทางเดียว ANOVA

ฉันต้องการเปรียบเทียบค่าเฉลี่ยในสามกลุ่มที่มีขนาดเท่ากัน (ขนาดตัวอย่างที่เท่ากันคือเล็ก 21) วิธีการของแต่ละกลุ่มมีการกระจายตามปกติ แต่ความแปรปรวนของพวกเขาไม่เท่ากัน (ผ่านการทดสอบของ Levene) การเปลี่ยนแปลงเป็นเส้นทางที่ดีที่สุดในสถานการณ์นี้หรือไม่? ฉันควรพิจารณาสิ่งอื่นก่อนไหม?

13 anova variance heteroscedasticity

1

บทสรุปของ GAM พอดี

หากเราเหมาะกับ GAM เช่น: gam.fit = gam::gam(Outstate ~ Private + s(Room.Board, df = 2) + s(PhD, df = 2) + s(perc.alumni, df = 2) + s(Expend, df = 5) + s(Grad.Rate, df = 2), data = College) ที่เราใช้ในชุดข้อมูลที่สามารถพบได้ในแพคเกจCollege ตอนนี้ถ้าเราพบบทสรุปของแบบนี้แล้วเราจะเห็นว่า:ISLR > summary(gam.fit) Call: gam(formula = Outstate ~ Private + s(Room.Board, df = …

12 anova gam

คำถามติดแท็ก anova