คำถามติดแท็ก anova

ANOVA ย่อมาจาก Analysis Of VAriance ซึ่งเป็นโมเดลเชิงสถิติและชุดของขั้นตอนสำหรับการเปรียบเทียบค่าเฉลี่ยของหลายกลุ่ม ตัวแปรอิสระในรูปแบบ ANOVA เป็นหมวดหมู่ แต่ตาราง ANOVA สามารถใช้ในการทดสอบตัวแปรต่อเนื่องเช่นกัน

2
สมมาตรแบบผสมในภาษาอังกฤษธรรมดาคืออะไร
ฉันเพิ่งตระหนักว่าโมเดลผสมที่มีหัวเรื่องเป็นปัจจัยสุ่มเท่านั้นและปัจจัยอื่น ๆ ที่เป็นปัจจัยคงที่เทียบเท่ากับ ANOVA เมื่อตั้งค่าโครงสร้างสหสัมพันธ์ของโมเดลผสมกับสมมาตรผสม ดังนั้นฉันอยากจะรู้ว่าสมมาตรผสมหมายถึงอะไรในบริบทของ ANOVA แบบผสม (เช่นการแบ่งส่วนย่อย) ที่อธิบายได้ดีที่สุดในภาษาอังกฤษแบบธรรมดา นอกจากนี้สมมาตรแบบผสมlmeยังมีโครงสร้างความสัมพันธ์ประเภทอื่นเช่น corSymm เมทริกซ์สหสัมพันธ์ทั่วไปที่ไม่มีโครงสร้างเพิ่มเติม หรือความแตกต่างของความสัมพันธ์เชิงพื้นที่ ดังนั้นฉันมีคำถามที่เกี่ยวข้องกับโครงสร้างความสัมพันธ์ประเภทอื่น ๆ ที่อาจจะแนะนำให้ใช้ในบริบทของการทดลองออกแบบ (กับปัจจัยระหว่างและภายในเรื่อง)? มันจะดีถ้าคำตอบสามารถชี้ไปที่การอ้างอิงบางอย่างสำหรับโครงสร้างความสัมพันธ์ที่แตกต่างกัน

3
เหตุใดจึงมีความแตกต่างระหว่างการคำนวณช่วงความเชื่อมั่นแบบโลจิสติก 95% ด้วยตนเองและการใช้ฟังก์ชัน confint () ใน R
เรียนคุณทุกคน - ฉันสังเกตเห็นบางสิ่งแปลก ๆ ที่ไม่สามารถอธิบายได้ไหม โดยสรุป: แนวทางแบบแมนนวลเพื่อคำนวณช่วงความมั่นใจในโมเดลการถดถอยโลจิสติกและฟังก์ชัน R confint()ให้ผลลัพธ์ที่แตกต่างกัน ฉันเคยผ่านการถดถอยโลจิสติกประยุกต์ของ Hosmer & Lemeshow แล้ว (ฉบับที่ 2) ในบทที่ 3 มีตัวอย่างของการคำนวณอัตราส่วนอัตราต่อรองและช่วงความมั่นใจ 95% ด้วย R ฉันสามารถสร้างโมเดลได้อย่างง่ายดาย: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
เปรียบเทียบสองรุ่นโดยใช้ฟังก์ชัน anova () ใน R
จากเอกสารสำหรับanova(): เมื่อได้รับลำดับของวัตถุ 'anova' ทดสอบแบบจำลองกับอีกแบบหนึ่งตามลำดับที่ระบุ ... การทดสอบแบบจำลองเทียบกันหมายความว่าอย่างไร และทำไมคำสั่งซื้อถึงมีความสำคัญ? นี่คือตัวอย่างจากบทช่วยสอน GenABEL : > modelAdd = lm(qt~as.numeric(snp1)) > modelDom = lm(qt~I(as.numeric(snp1)>=2)) > modelRec = lm(qt~I(as.numeric(snp1)>=3)) anova(modelAdd, modelGen, test="Chisq") Analysis of Variance Table Model 1: qt ~ as.numeric(snp1) Model 2: qt ~ snp1 Res.Df RSS Df Sum of Sq Pr(>Chi) 1 2372 2320 2 …
32 r  anova 

4
การวิเคราะห์ความแปรปรวนของข้อมูลทวินาม
ฉันกำลังวิเคราะห์ชุดข้อมูลการทดลอง ข้อมูลประกอบด้วยเวกเตอร์คู่ของประเภทการรักษาและผลลัพธ์ทวินาม: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... ในคอลัมน์ผลลัพธ์ 1 หมายถึงความสำเร็จและ 0 หมายถึงความล้มเหลว ฉันต้องการทราบว่าการรักษาแตกต่างกันอย่างมีนัยสำคัญผลลัพธ์ มีการรักษา 4 แบบที่แตกต่างกันในแต่ละการทดลองซ้ำหลายครั้ง (2000 ครั้งต่อการรักษาแต่ละครั้ง) คำถามของฉันคือฉันสามารถวิเคราะห์ผลลัพธ์ไบนารีโดยใช้ ANOVA ได้หรือไม่ หรือฉันควรใช้การทดสอบไคสแควร์เพื่อตรวจสอบข้อมูลทวินาม? ดูเหมือนว่าไคสแควร์จะถือว่าสัดส่วนจะแบ่งเท่า ๆ กันซึ่งไม่ใช่กรณี อีกแนวคิดหนึ่งคือการสรุปข้อมูลโดยใช้สัดส่วนของความสำเร็จต่อความล้มเหลวสำหรับการรักษาแต่ละครั้งและจากนั้นใช้การทดสอบสัดส่วน ฉันอยากรู้อยากเห็นคำแนะนำของคุณสำหรับการทดสอบที่เหมาะสมสำหรับการทดลองความสำเร็จ / ล้มเหลวแบบทวินามเหล่านี้

4
การวิเคราะห์ด้วยข้อมูลที่ซับซ้อนมีอะไรที่แตกต่างกันอย่างไร
พูดเช่นคุณกำลังทำโมเดลเชิงเส้น แต่ข้อมูลนั้นซับซ้อนYyy Y= x β+ ϵy=xβ+ϵ y = x \beta + \epsilon ชุดข้อมูลของฉันมีความซับซ้อนในขณะที่ตัวเลขทั้งหมดในที่มีรูปแบบBI) มีขั้นตอนใดบ้างที่แตกต่างเมื่อทำงานกับข้อมูลดังกล่าว?Yyy( a + b i )(a+bi)(a + bi) ฉันถามเพราะคุณจะได้รับการฝึกอบรมความแปรปรวนร่วมที่ซับซ้อนและสถิติการทดสอบที่มีมูลค่าซับซ้อน .. คุณจำเป็นต้องใช้การผันแบบคอนจูเกตแทนการแปลงสัญญาณเมื่อทำกำลังสองน้อยที่สุดหรือไม่? ค่าความแปรปรวนร่วมที่ซับซ้อนมีความหมายอะไร?

1
การเปรียบเทียบแบบจำลองเอฟเฟกต์แบบหลากหลาย
ฉันพยายามวิเคราะห์ข้อมูลบางอย่างโดยใช้แบบจำลองเอฟเฟกต์ผสม ข้อมูลที่ฉันรวบรวมนั้นเป็นตัวแทนของน้ำหนักของสัตว์เล็กที่มีจีโนไทป์ต่างกันตามเวลา ฉันใช้แนวทางที่เสนอที่นี่: https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ โดยเฉพาะฉันใช้โซลูชัน # 2 ดังนั้นฉันมีสิ่งที่ชอบ require(nlme) model <- lme(weight ~ time * Genotype, random = ~1|Animal/time, data=weights) av <- anova(model) ตอนนี้ฉันต้องการเปรียบเทียบหลายอย่าง ใช้multcompฉันสามารถทำได้: require(multcomp) comp.geno <- glht(model, linfct=mcp(Genotype="Tukey")) print(summary(comp.geno)) และแน่นอนฉันสามารถทำเช่นเดียวกันกับเวลา ฉันมีสองคำถาม: ฉันจะใช้mcpเพื่อดูปฏิสัมพันธ์ระหว่างเวลาและจีโนไทป์ได้อย่างไร เมื่อฉันวิ่งglhtฉันได้รับคำเตือนนี้: covariate interactions found -- default contrast might be inappropriate มันหมายความว่าอะไร? ฉันสามารถเพิกเฉยได้อย่างปลอดภัยหรือไม่? หรือฉันควรทำอย่างไรเพื่อหลีกเลี่ยง แก้ไข: ฉันพบPDF นี้ที่ระบุว่า: …

1
คำสั่ง anova () ทำอะไรกับวัตถุโมเดล lmer
หวังว่านี่เป็นคำถามที่ใครบางคนที่นี่สามารถตอบสำหรับฉันเกี่ยวกับธรรมชาติของการสลายจำนวนสแควร์สจากรูปแบบเอฟเฟกต์ผสมกับlmer(จากแพ็คเกจ lme4 R) ก่อนอื่นฉันควรจะบอกว่าฉันรู้ถึงความขัดแย้งกับการใช้วิธีการนี้และในทางปฏิบัติฉันมีแนวโน้มที่จะใช้ bootstrapped LRT เพื่อเปรียบเทียบแบบจำลอง (ตามที่ Faraway, 2006 แนะนำ) อย่างไรก็ตามฉันสับสนในวิธีการทำซ้ำผลลัพธ์และเพื่อความมีสติของตัวเองฉันคิดว่าฉันจะถามที่นี่ โดยพื้นฐานแล้วฉันจะได้สัมผัสกับการใช้แบบจำลองเอฟเฟกต์ที่เหมาะสมกับlme4แพ็คเกจ ฉันรู้ว่าคุณสามารถใช้anova()คำสั่งเพื่อให้บทสรุปของการทดสอบผลกระทบคงที่ตามลำดับในรูปแบบ เท่าที่ฉันรู้ว่าสิ่งนี้คือสิ่งที่ Faraway (2006) อ้างถึงเป็นวิธีการ 'คาดหมายถึงกำลังสอง' สิ่งที่ฉันอยากรู้คือการคำนวณจำนวนเงินสแควร์สเป็นอย่างไร? ฉันรู้ว่าฉันสามารถนำค่าประมาณจากโมเดลเฉพาะ (โดยใช้coef()) สมมติว่าได้รับการแก้ไขแล้วทำการทดสอบโดยใช้ผลรวมของกำลังสองของเศษซากโมเดลที่มีและไม่มีปัจจัยที่น่าสนใจ นี่เป็นสิ่งที่ดีสำหรับโมเดลที่มีปัจจัยภายในเรื่องเดียว อย่างไรก็ตามเมื่อใช้การออกแบบการแยกส่วนผลบวกของค่ากำลังสองที่ฉันได้รับจะเท่ากับค่าที่ผลิตโดย R โดยใช้aov()การError()กำหนดที่เหมาะสม อย่างไรก็ตามนี่ไม่เหมือนกับผลบวกของกำลังสองที่สร้างโดยanova()คำสั่งบนวัตถุจำลองแม้ว่าข้อเท็จจริงที่ว่าอัตราส่วน F จะเหมือนกันก็ตาม ของหลักสูตรนี้เหมาะสมอย่างสมบูรณ์เนื่องจากไม่จำเป็นต้องมีError()ชั้นในรูปแบบผสม อย่างไรก็ตามนี่ต้องหมายความว่าผลรวมของกำลังสองจะถูกลงโทษในรูปแบบผสมเพื่อให้ได้อัตราส่วน F ที่เหมาะสม สิ่งนี้สำเร็จได้อย่างไร และรูปแบบอย่างไรแก้ไขผลรวมระหว่างพล็อตของสี่เหลี่ยม แต่ไม่แก้ไขผลรวมภายในพล็อตของสแควร์ เห็นได้ชัดว่านี่เป็นสิ่งที่จำเป็นสำหรับ ANOVA แบบแยกส่วนแบบคลาสสิกที่ทำได้โดยการกำหนดค่าความผิดพลาดต่างกันสำหรับเอฟเฟกต์ต่าง ๆ ดังนั้นโมเดลผสมเอฟเฟกต์จะอนุญาตได้อย่างไร โดยพื้นฐานแล้วฉันต้องการที่จะสามารถจำลองผลลัพธ์ที่ได้จากanova()คำสั่งที่ใช้กับวัตถุโมเดล lmer เพื่อตรวจสอบผลลัพธ์และความเข้าใจของฉันอย่างไรก็ตามในปัจจุบันฉันสามารถทำสิ่งนี้ได้สำหรับการออกแบบภายในเรื่องปกติ แต่ไม่ใช่สำหรับการแยก - พล็อตเรื่องการออกแบบและฉันไม่สามารถหาสาเหตุได้ในกรณีนี้ ตัวอย่างเช่น: library(faraway) …

3
ANOVA จะมีนัยสำคัญหรือไม่เมื่อไม่มีการทดสอบ t-pairwise
มันเป็นไปได้สำหรับทางเดียว (กับกลุ่มหรือ "ระดับ") ANOVA เพื่อรายงานความแตกต่างอย่างมีนัยสำคัญเมื่อไม่มีN ( N - 1 ) / 2คู่เสื้อทดสอบไม่?N>2N>2N>2N(N−1)/2N(N−1)/2N(N-1)/2 ในคำตอบนี้ @whuber เขียนว่า: เป็นที่ทราบกันดีว่าการทดสอบ ANOVA F ทั่วโลกสามารถตรวจจับความแตกต่างของวิธีการได้แม้ในกรณีที่ไม่มีการทดสอบทีละคู่ [ทีไม่ได้รับการปรับแก้คู่] ของวิธีการใดก็ตาม เห็นได้ชัดว่ามันเป็นไปได้ แต่ฉันไม่เข้าใจว่า มันเกิดขึ้นเมื่อใดและสัญชาตญาณที่อยู่เบื้องหลังกรณีเช่นนี้จะเป็นเช่นไร? บางทีใครบางคนสามารถให้ตัวอย่างของเล่นง่ายๆของสถานการณ์เช่นนี้? ข้อสังเกตเพิ่มเติมบางส่วน: ตรงกันข้ามเป็นไปได้อย่างชัดเจน: ANOVA โดยรวมอาจไม่มีนัยสำคัญในขณะที่บางส่วนของการทดสอบ t-pairwise รายงานความแตกต่างที่สำคัญอย่างผิดพลาด (เช่นนั้นจะเป็นผลบวกปลอม) คำถามของฉันเกี่ยวกับมาตรฐานไม่ได้ปรับสำหรับการเปรียบเทียบแบบทดสอบหลายรายการ หากใช้การทดสอบที่ปรับแล้ว (เช่นขั้นตอน HSD ของ Tukey) อาจเป็นไปได้ว่าไม่มีการทดสอบใดที่มีนัยสำคัญแม้ว่า ANOVA โดยรวมจะเป็นเช่นนั้น คำถามนี้ครอบคลุมในหลาย ๆ คำถามเช่นฉันจะได้รับ ANOVA โดยรวมที่สำคัญได้อย่างไร แต่ไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างคู่กับกระบวนการของ Tukey และที่สําคัญ ANOVA …

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

3
วิธีรับค่า p โดยรวมและขนาดเอฟเฟกต์สำหรับปัจจัยเชิงหมวดหมู่ในโมเดลผสม (lme4)
ฉันต้องการรับค่า p และขนาดผลกระทบของตัวแปรเด็ดขาดแบบอิสระ (มีหลายระดับ) - นั่นคือ "โดยรวม" และไม่ใช่สำหรับแต่ละระดับแยกกันเช่นเดียวกับเอาต์พุตปกติจากlme4ในอาร์มันเป็นเหมือน สิ่งที่ผู้คนรายงานเมื่อใช้ ANOVA ฉันจะได้รับสิ่งนี้ได้อย่างไร

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
ความแตกต่างระหว่าง MANOVA และ ANOVA มาตรการซ้ำแล้วซ้ำอีก?
อะไรคือความแตกต่างระหว่างการวัด ANOVA ซ้ำ ๆ กับปัจจัยบางอย่าง (พูดว่าเงื่อนไขการทดลอง) และ MANOVA โดยเฉพาะอย่างยิ่งเว็บไซต์หนึ่งที่ฉันสะดุดพบว่า MANOVA ไม่ได้ทำการสันนิษฐานแบบเดียวกันกับความกลมกลืนของมาตรการ ANOVA ซ้ำ ๆ ว่าเป็นเรื่องจริงหรือไม่? ถ้าใช่ทำไมไม่ใช้ MANOVA เสมอ ฉันพยายามดำเนินการมาตรการ ANOVA ซ้ำ ๆ กับ DV หลาย ๆ ตัววิธีที่เหมาะสมคืออะไร?

7
วิธีการหนึ่งทำ Type-III SS ANOVA ใน R ด้วยรหัสความคมชัด?
โปรดระบุรหัส R ซึ่งอนุญาตให้บุคคลหนึ่งทำการวิเคราะห์ความแปรปรวนระหว่างอาสาสมัครที่มี -3, -1, 1, 3 ตรงกันข้าม ฉันเข้าใจว่ามีการถกเถียงกันเกี่ยวกับประเภทผลรวมของกำลังสอง (SS) ที่เหมาะสมสำหรับการวิเคราะห์ดังกล่าว อย่างไรก็ตามเนื่องจากประเภทเริ่มต้นของ SS ที่ใช้ใน SAS และ SPSS (Type III) ถือเป็นมาตรฐานในพื้นที่ของฉัน ดังนั้นฉันต้องการให้ผลลัพธ์ของการวิเคราะห์นี้ตรงกับสิ่งที่สร้างขึ้นโดยโปรแกรมสถิติเหล่านั้น หากต้องการได้รับคำตอบคำตอบจะต้องโทร aov () โดยตรง แต่คำตอบอื่น ๆ อาจได้รับการโหวต (espeically ถ้าพวกเขาเข้าใจง่าย / ใช้งาน) sample.data <- data.frame(IV=rep(1:4,each=20),DV=rep(c(-3,-3,1,3),each=20)+rnorm(80)) แก้ไข:โปรดทราบความแตกต่างที่ฉันขอไม่ใช่ความคมชัดเชิงเส้นหรือพหุนามที่เรียบง่าย แต่เป็นความแตกต่างที่ได้จากการทำนายเชิงทฤษฎีคือประเภทของความแตกต่างที่กล่าวถึงโดย Rosenthal และ Rosnow

2
การประมาณ Satterthwaite vs. Kenward-Roger สำหรับองศาอิสระในโมเดลผสม
lmerTestแพคเกจให้anova()ฟังก์ชั่นหลากหลายรูปแบบเชิงเส้นที่มีตัวเลือกประมาณ Satterthwaite ของ (เริ่มต้น) หรือ Kenward-Roger ขององศาอิสระ (DF) ความแตกต่างระหว่างสองแนวทางนี้คืออะไร? เลือกได้เมื่อใด

4
ANOVA เทียบกับการถดถอยเชิงเส้นหลายเส้น? ทำไม ANOVA จึงถูกใช้กันอย่างแพร่หลายในการศึกษาทดลอง?
ANOVA เทียบกับการถดถอยเชิงเส้นหลายเส้น? ฉันเข้าใจว่าวิธีการทั้งสองนี้ดูเหมือนจะใช้ตัวแบบสถิติเดียวกัน อย่างไรก็ตามภายใต้สถานการณ์ใดฉันควรใช้วิธีใด อะไรคือข้อดีและข้อเสียของวิธีการเหล่านี้เมื่อเปรียบเทียบ? ทำไม ANOVA จึงถูกนำมาใช้กันอย่างแพร่หลายในการศึกษาทดลองและฉันแทบจะไม่เคยพบการถดถอย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.