คำถามติดแท็ก anova

ANOVA ย่อมาจาก Analysis Of VAriance ซึ่งเป็นโมเดลเชิงสถิติและชุดของขั้นตอนสำหรับการเปรียบเทียบค่าเฉลี่ยของหลายกลุ่ม ตัวแปรอิสระในรูปแบบ ANOVA เป็นหมวดหมู่ แต่ตาราง ANOVA สามารถใช้ในการทดสอบตัวแปรต่อเนื่องเช่นกัน

1
เหตุใดจึงมีการรายงานในเอกสารที่ใช้ผลบวกของรูปสี่เหลี่ยมในผลลัพธ์ Anova บ่อยครั้ง
จากประสบการณ์สั้น ๆ ของฉันในสถิติดูเหมือนว่าชนิดของผลรวมของสแควร์ส (ประเภท I, II, III, IV ... ) ที่ใช้ในการรับผลลัพธ์ ANOVA สามารถสร้างความแตกต่างอย่างมากในผลการทดสอบ (โดยเฉพาะรุ่นที่มีปฏิสัมพันธ์ ข้อมูล). อย่างไรก็ตามฉันยังไม่เห็นกระดาษรายงานเลย เหตุผลที่เป็นเช่นนั้น? ฉันจะขอบคุณจริง ๆ หากมีตัวอย่างกระดาษรายงาน (ไม่ใช่สถิติเอง) ไม่ทางใดก็ทางหนึ่งหรือเหตุผลที่ไม่ธรรมดา

1
วิธีการใช้ anova สำหรับการเปรียบเทียบทั้งสองรุ่น?
ฉันจะเข้าใจanovaผลลัพธ์ได้อย่างไรเมื่อเปรียบเทียบสองรุ่น ตัวอย่าง: Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 54.032 2 7 4.632 2 49.4 37.329 0.0001844 *** สถานะ manpage: "คำนวณการวิเคราะห์ความแปรปรวน (หรือความเบี่ยงเบน) ตารางสำหรับวัตถุจำลองรุ่นหนึ่งหรือมากกว่านั้น" อย่างไรก็ตามศาสตราจารย์บอกว่ามันอาจจะใช้สำหรับการเปรียบเทียบแบบจำลอง - นั่นคือสิ่งที่ฉันตั้งใจจะทำ ดังนั้นฉันคิดว่าฉันสามารถใช้anova(model1, model2)และรับค่า p ซึ่งบอกฉันว่าฉันควรปฏิเสธสมมติฐานว่าง: "แบบจำลองเหมือนกัน" ฉันขอกล่าวว่าถ้าค่า p น้อยกว่า (สมมุติว่า) 0.05 แบบจำลองแตกต่างกันอย่างมีนัยสำคัญหรือไม่
9 r  regression  anova 

1
การทดสอบ anova type III สำหรับ GLMM
ฉันเหมาะสมกับglmerโมเดลในlme4แพ็กเกจ R ฉันกำลังมองหาตารางโนวาที่มีค่า p แสดงอยู่ในนั้น แต่ฉันไม่สามารถหาแพ็คเกจที่เหมาะกับมันได้ เป็นไปได้ไหมที่จะทำใน R? แบบจำลองที่ฉันเหมาะสมอยู่ในรูปแบบ: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))


1
R: Anova และการถดถอยเชิงเส้น
ฉันใหม่สำหรับสถิติและฉันพยายามเข้าใจความแตกต่างระหว่าง ANOVA และการถดถอยเชิงเส้น ฉันใช้ R เพื่อสำรวจสิ่งนี้ ฉันอ่านบทความต่าง ๆ เกี่ยวกับสาเหตุที่ ANOVA และการถดถอยแตกต่างกัน แต่ก็ยังเหมือนเดิมและวิธีที่สามารถมองเห็นได้ ฯลฯ ฉันคิดว่าฉันสวยที่นั่น แต่หายไปหนึ่งบิต ฉันเข้าใจว่า ANOVA เปรียบเทียบความแปรปรวนภายในกลุ่มกับความแปรปรวนระหว่างกลุ่มเพื่อพิจารณาว่ามีหรือไม่มีความแตกต่างระหว่างกลุ่มที่ทดสอบ ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA ) สำหรับการถดถอยเชิงเส้นฉันพบโพสต์ในฟอรัมนี้ซึ่งบอกว่าสามารถทดสอบได้เหมือนกันเมื่อเราทดสอบว่า b (ความชัน) = 0 ( ทำไม ANOVA สอน / ใช้ราวกับว่ามันเป็นวิธีการวิจัยที่แตกต่างเมื่อเทียบกับการถดถอยเชิงเส้น ) สำหรับกลุ่มมากกว่าสองกลุ่มฉันพบเว็บไซต์ที่ระบุ: สมมติฐานว่างคือ: H0:μ1=μ2=μ3H0:µ1=µ2=µ3\text{H}_0: µ_1 = µ_2 = µ_3 รูปแบบการถดถอยเชิงเส้นคือ: Y=ข0+ข1X1+ข2X2+ eY=ข0+ข1X1+ข2X2+อีy = b_0 + b_1X_1 + b_2X_2 …
9 r  regression  anova 

1
ผลรวมของสี่เหลี่ยมจัตุรัส Type III
ผมมีรูปแบบการถดถอยเชิงเส้นกับหนึ่งเด็ดขาดตัวแปร(ชายและหญิง) และเป็นหนึ่งในตัวแปรอย่างต่อเนื่องBAAABBB options(contrasts=c("contr.sum","contr.poly"))ฉันจะตั้งค่ารหัสความแตกต่างในการวิจัยกับ และตอนนี้ผมมีเงินก้อนประเภทที่สามของสี่เหลี่ยมสำหรับ, , และการมีปฏิสัมพันธ์ของพวกเขา (A: B) ด้วยAAABBBdrop1(model, .~., test="F") สิ่งที่ฉันติดอยู่กับเป็นวิธีผลรวมของสี่เหลี่ยมที่มีการคำนวณสำหรับBฉันBBBsum((predicted y of the full model - predicted y of the reduced model)^2)คิดว่ามันเป็น y~A+A:Bลดรูปแบบจะมีลักษณะ แต่เมื่อฉันใช้predict(y~A+A:B)R จะส่งคืนค่าที่คาดการณ์ซึ่งเหมือนกับค่าแบบจำลองที่ทำนายไว้ทั้งหมด ดังนั้นผลบวกของกำลังสองจะเป็น 0 (สำหรับผลบวกของกำลังสองของฉันใช้รูปแบบที่ลดลงของซึ่งเหมือนกับ)AAAy~B+A:By~A:B นี่คือตัวอย่างรหัสสำหรับข้อมูลที่สร้างแบบสุ่ม: A<-as.factor(rep(c("male","female"), each=5)) set.seed(1) B<-runif(10) set.seed(5) y<-runif(10) model<-lm(y~A+B+A:B) options(contrasts = c("contr.sum","contr.poly")) #type3 sums of squares drop1(model, .~., test="F") #or same …

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
ANOVA แบบแยกส่วนที่มีสองปัจจัยเหมือนกับ ANOVA แบบสองทางที่มีการวัดซ้ำในปัจจัยเดียวหรือไม่
ANOVA แบบ "แยกส่วน" ที่มีสองปัจจัยเหมือนกับ ANOVA แบบสองทางที่มีการวัดซ้ำในปัจจัยเดียวหรือไม่ ถ้าไม่ความแตกต่างคืออะไร?

2
ทดสอบความแตกต่างของ quantile-Q ระหว่างกลุ่มหรือไม่?
สำหรับตัวแปร Y บางตัวที่แบ่งออกเป็น 3 กลุ่ม (X) ฉันต้องการเปรียบเทียบกลุ่มและสำหรับสมมติฐานที่ว่าควอนไทล์ 90% นั้นเหมือนกันระหว่างทั้งสามกลุ่ม ฉันสามารถใช้การทดสอบอะไรได้บ้าง ทางเลือกหนึ่งที่ฉันคิดว่าใช้การถดถอยแบบควอไทล์มีทางเลือกอื่น ๆ ฉันคิดว่าถ้าฉันต้องการเปรียบเทียบค่ามัธยฐานฉันสามารถใช้การทดสอบ kruskal วอลลิส (แม้ว่ามันจะขึ้นอยู่กับอันดับ แต่ถ้าฉันจำได้อย่างถูกต้องมันจะให้ผลลัพธ์ที่เหมือนกันเมื่อการกระจายตัวที่เหลือเป็นสมมาตร) ขอบคุณ

2
ทำความเข้าใจกับการวัดสมมติฐาน ANOVA ซ้ำ ๆ เพื่อการตีความที่ถูกต้องของเอาต์พุต SPSS
ฉันกำลังตรวจสอบว่าเงื่อนไขการให้รางวัลที่แตกต่างกันอาจมีผลต่อการปฏิบัติงานหรือไม่ ฉันมีข้อมูลจากการศึกษาขนาดเล็กที่มีสองกลุ่มโดยแต่ละกลุ่มมี n = 20 ฉันรวบรวมข้อมูลเกี่ยวกับงานที่เกี่ยวข้องกับประสิทธิภาพในเงื่อนไข "รางวัล" 3 แบบที่แตกต่างกัน งานเกี่ยวข้องกับการปฏิบัติงานในแต่ละเงื่อนไข 3 ครั้งสองครั้ง แต่สุ่มลำดับ ฉันต้องการดูว่ามีความแตกต่างในการปฏิบัติงานของแต่ละกลุ่มหรือไม่ในแต่ละเงื่อนไข "รางวัล" ที่แตกต่างกัน IV = ประเภทกลุ่ม DV = หมายถึงการวัดประสิทธิภาพการทำงานใน 3 เงื่อนไข ฉันมีผลลัพธ์จากการวัด ANOVA ซ้ำ ๆ และการเข้าถึงชุดข้อมูลดิบใน SPSS แต่ไม่แน่ใจว่าจะดำเนินการอย่างไร ฉันไม่สามารถหาคำแนะนำทีละขั้นตอนสำหรับการตีความนี้เนื่องจากข้อความของ Pallantค่อนข้าง จำกัด ปัญหาเฉพาะของฉันอยู่ในพื้นที่ต่อไปนี้: ฉันจะตรวจสอบความเป็นมาตรฐานของตัวแปรแต่ละตัวของฉันทีละตัวหรือรวมกันในแต่ละระดับของ IV หรือไม่? หากอยู่ในชุดค่าผสมฉันจะตรวจสอบได้อย่างไร ฉันจะตรวจสอบการทดสอบของ Mauchly ก่อนหรือไม่ หากมีการละเมิดหมายความว่าอย่างไร หากไม่ละเมิดหมายความว่าอย่างไร เมื่อไรที่จะดูตารางการทดสอบหลายตัวแปรหรือการทดสอบเอฟเฟกต์ในหัวข้อต่างๆ ฉันไม่แน่ใจว่าเมื่อใดที่เหมาะสมที่จะใช้ (หรือทั้งคู่?) มันจะโอเคที่จะดูการเปรียบเทียบแบบเป็นคู่เสมอหรือไม่? ดูเหมือนว่าใช้ง่ายหากมีผลหลายตัวแปรหรือในหัวข้อไม่ได้บ่งบอกความสำคัญ (เช่น …

1
ความแตกต่างระหว่างการควบคุมและการรักษาควรเป็นแบบอย่างชัดเจนหรือโดยปริยาย?
รับการตั้งค่าการทดลองต่อไปนี้: ตัวอย่างจำนวนมากนำมาจากหัวเรื่องและแต่ละตัวอย่างได้รับการปฏิบัติหลายวิธี (รวมถึงการรักษาควบคุม) สิ่งที่น่าสนใจที่สุดคือความแตกต่างระหว่างการควบคุมและการรักษาแต่ละครั้ง ฉันนึกถึงโมเดลง่าย ๆ สองแบบสำหรับข้อมูลนี้ ด้วยตัวอย่างรักษารักษา 0 ถูกควบคุมให้เป็นข้อมูลเป็นพื้นฐานสำหรับตัวอย่าง ,มีความแตกต่างในการรักษาญโมเดลแรกดูทั้งการควบคุมและความแตกต่าง:ผมiiJjjYฉันเจYijY_{ij}γผมγi\gamma_iผมiiδJδj\delta_jJjj Yฉันเจ=γผม+δJ+εฉันเจYij=γi+δj+ϵij Y_{ij}=\gamma_i+\delta_j+\epsilon_{ij} δ0= 0δ0=0 \delta_0=0 ในขณะที่รุ่นที่สองเท่านั้นที่ดูความแตกต่าง หากเราทำการล่วงหน้าล่วงหน้า ดังนั้น dฉันเจdijd_{ij}dฉันเจ=Yฉันเจ-Yฉัน0dij=Yij−Yi0 d_{ij}=Y_{ij}-Y_{i0} dฉันเจ=δJ+εฉันเจdij=δj+εij d_{ij}=\delta_j+\varepsilon_{ij} คำถามของฉันคืออะไรความแตกต่างพื้นฐานระหว่างการตั้งค่าทั้งสองนี้คืออะไร โดยเฉพาะอย่างยิ่งหากระดับนั้นไร้ความหมายในตัวเองและมีเพียงความแตกต่างเท่านั้นที่เป็นโมเดลแรกที่ทำมากเกินไปและอาจต่ำกว่าความเป็นจริง?

2
การแก้ไขสำหรับการเปรียบเทียบหลายรายการในภายในวิชา / วัดซ้ำ ANOVA; อนุรักษ์นิยมมากเกินไป?
มันทำให้ฉันรู้สึกว่าการแก้ไขที่มีอยู่สำหรับการเปรียบเทียบหลายครั้งในบริบทของมาตรการ ANOVA ซ้ำ ๆ นั้นเป็นเรื่องที่อนุรักษ์เกินไป เป็นกรณีนี้จริงหรือ ถ้าเป็นเช่นนั้นฉันจะใช้การอ้างอิงอะไรบ้างเพื่อสนับสนุนประเด็นนี้และเรียนรู้เพิ่มเติม

2
จับคู่ ANOVA หรือมาตรการผสมซ้ำแล้วซ้ำอีก?
ฉันถูกขอให้วิเคราะห์ข้อมูลบางอย่างจากการทดลองทางคลินิกโดยหาวิธีสองวิธีในการวัดความดันโลหิต ฉันมีข้อมูลจาก 50 วิชาโดยแต่ละรายการมีค่าระหว่าง 2 และ 57 มาตรการโดยใช้แต่ละวิธี ฉันสงสัยว่าจะทำอย่างไรดีที่สุด เห็นได้ชัดว่าฉันต้องการวิธีการแก้ปัญหาที่จะคำนึงถึงความจริงที่ว่าการวัดความดันโลหิตถูกจับคู่ (สองวิธีที่วัดพร้อมกัน) และเวลาที่แปรเปลี่ยนโควาเรียต (มีจำนวนการสังเกตต่อผู้ป่วยที่แตกต่างกัน ความแปรปรวนของผู้ป่วย ฉันกำลังคิดที่จะหยุดเรื่องรองเท้านี้เป็นมาตรการ ANOVA ซ้ำ ๆ แต่ฉันคิดว่ามันอาจจะต้องเป็นแบบจำลองผสม ฉันขอขอบคุณคำแนะนำที่เป็นประโยชน์ที่คุณสามารถให้ได้ ฉันเป็นมือใหม่ R ที่สมบูรณ์ แต่ตื่นเต้นมากที่จะพัฒนาทักษะและฉันมีประสบการณ์ปานกลางใน Stata ดังนั้นก็สามารถถอยกลับไปได้เสมอ
9 r  anova  mixed-model  stata 


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.