คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

2
อนุญาตการเปรียบเทียบโมเดลเอฟเฟกต์แบบผสม (เอฟเฟกต์แบบสุ่มเป็นหลัก)
ฉันได้ดูการสร้างเอฟเฟ็กต์แบบผสมโดยใช้แพ็คเกจ lme4 ในอาร์ฉันใช้lmerคำสั่งเป็นหลักดังนั้นฉันจะถามคำถามของฉันผ่านรหัสที่ใช้ไวยากรณ์นั้น ฉันคิดว่าคำถามง่าย ๆ ทั่วไปอาจจะใช่ไหมที่จะเปรียบเทียบสองโมเดลที่สร้างขึ้นในการlmerใช้อัตราส่วนความน่าจะเป็นตามชุดข้อมูลที่เหมือนกันหรือไม่ ฉันเชื่อว่าคำตอบนั้นต้องเป็น "ไม่" แต่ฉันไม่ถูกต้อง ฉันได้อ่านข้อมูลที่ขัดแย้งกันว่าเอฟเฟกต์แบบสุ่มจะต้องเหมือนกันหรือไม่และองค์ประกอบของเอฟเฟกต์แบบสุ่มนั้นมีความหมายอย่างไร ดังนั้นฉันจะนำเสนอตัวอย่างเล็ก ๆ น้อย ๆ ฉันจะนำพวกเขาจากข้อมูลการวัดซ้ำ ๆ โดยใช้การกระตุ้นคำบางทีบางอย่างเช่นBaayen (2008)น่าจะมีประโยชน์ในการตีความ สมมติว่าฉันมีแบบจำลองที่มีตัวทำนายเอฟเฟกต์คงที่สองตัวเราจะเรียกพวกมันว่า A และ B และเอฟเฟกต์สุ่มบางอย่าง ... คำศัพท์และวิชาที่มองเห็นพวกมัน ฉันอาจสร้างแบบจำลองดังต่อไปนี้ m <- lmer( y ~ A + B + (1|words) + (1|subjects) ) (โปรดทราบว่าฉันตั้งใจออกไปdata =และเราจะถือว่าฉันหมายถึงREML = FALSEเพื่อความชัดเจนเสมอ) ทีนี้จากแบบจำลองต่อไปนี้ซึ่งเป็นสิ่งที่โอเคที่จะเปรียบเทียบกับอัตราส่วนความน่าจะเป็นกับแบบจำลองข้างบนและแบบใด? m1 <- lmer( y ~ A …

3
วิธีการรวมช่วงความมั่นใจสำหรับองค์ประกอบความแปรปรวนของแบบผสมผลกระทบเมื่อใช้การใส่หลายครั้ง
ตรรกะของการใส่หลายครั้ง (MI) คือการกำหนดค่าที่หายไปไม่ใช่ครั้งเดียว แต่หลายครั้ง (โดยทั่วไปคือ M = 5) ส่งผลให้ชุดข้อมูล M สมบูรณ์ ชุดข้อมูลที่เสร็จสมบูรณ์แล้ว M จะถูกวิเคราะห์ด้วยวิธีการข้อมูลที่สมบูรณ์ซึ่งการประเมิน M และข้อผิดพลาดมาตรฐานถูกรวมเข้าด้วยกันโดยใช้สูตรรูบินเพื่อรับการประเมินโดยรวมและข้อผิดพลาดมาตรฐาน เยี่ยมมาก แต่ฉันไม่แน่ใจว่าจะใช้สูตรนี้อย่างไรเมื่อส่วนประกอบต่าง ๆ ของแบบผสมเอฟเฟกต์เกี่ยวข้องกัน การกระจายตัวตัวอย่างขององค์ประกอบความแปรปรวนเป็นแบบอสมมาตรดังนั้นจึงไม่สามารถกำหนดช่วงความเชื่อมั่นที่สอดคล้องกันในรูปแบบ "การประมาณ± 1.96 * se (ประมาณ)" โดยทั่วไป ด้วยเหตุนี้แพ็คเกจ R lme4 และ nlme จึงไม่ได้จัดเตรียมข้อผิดพลาดมาตรฐานของส่วนประกอบความแปรปรวน แต่ให้ช่วงความมั่นใจเท่านั้น ดังนั้นเราสามารถดำเนินการ MI บนชุดข้อมูลจากนั้นรับช่วงความเชื่อมั่น M ต่อองค์ประกอบความแปรปรวนหลังจากปรับโมเดลเอฟเฟกต์แบบเดียวกันบนชุดข้อมูลที่เสร็จสมบูรณ์แล้ว M คำถามคือทำอย่างไรจึงจะรวมช่วง M เหล่านี้เข้ากับช่วงความมั่นใจโดยรวม ฉันเดาว่าน่าจะเป็นไปได้ - ผู้เขียนบทความ (yucel & demirtas (2010) …

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
จับคู่ t-test เป็นกรณีพิเศษของการสร้างแบบจำลองผลกระทบเชิงเส้นแบบผสม
เรารู้ว่าแบบทดสอบt - paired เป็นเพียงกรณีพิเศษของการวัดทางเดียว (หรือในเรื่อง) ANOVA เช่นเดียวกับแบบจำลองผสมเอฟเฟกต์แบบเชิงเส้นซึ่งสามารถแสดงให้เห็นด้วยฟังก์ชัน lme () ในแพ็คเกจ nlme ใน R ดังแสดงด้านล่าง #response data from 10 subjects under two conditions x1<-rnorm(10) x2<-1+rnorm(10) # Now create a dataframe for lme myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2)) names(myDat) <- c("y", "x", "subj") เมื่อฉันรันการทดสอบ t จับคู่ต่อไปนี้: …

2
วิธีการเลือกโครงสร้างแบบสุ่มและแบบคงที่ในโมเดลเชิงเส้นผสม
พิจารณาข้อมูลต่อไปนี้จากการออกแบบสองทางภายในวิชา: df <- "http://personality-project.org/r/datasets/R.appendix4.data" df <- read.table(df,header=T) head(df) Observation Subject Task Valence Recall 1 1 Jim Free Neg 8 2 2 Jim Free Neu 9 3 3 Jim Free Pos 5 4 4 Jim Cued Neg 7 5 5 Jim Cued Neu 9 6 6 Jim Cued Pos 10 ฉันต้องการวิเคราะห์สิ่งนี้โดยใช้แบบจำลองเชิงเส้นผสม …

3
เปรียบเทียบแบบจำลองที่ไม่ซ้อนกับ AIC
สมมติว่าเราต้องใช้ GLMM mod1 <- glmer(y ~ x + A + (1|g), data = dat) mod2 <- glmer(y ~ x + B + (1|g), data = dat) โมเดลเหล่านี้ไม่ซ้อนในความหมายปกติของ: a <- glmer(y ~ x + A + (1|g), data = dat) b <- glmer(y ~ x + A + B + (1|g), …

1
lmer () สามารถใช้ splines เป็นเอฟเฟกต์แบบสุ่มได้หรือไม่?
สมมติว่าเรากำลังทำงานกับโมเดลเอฟเฟกต์สุ่มของข้อมูลนับจำนวนหนึ่งเมื่อเวลาผ่านไปและเราต้องการควบคุมแนวโน้มบางอย่าง โดยปกติคุณจะทำสิ่งที่ชอบ: lmer(counts ~ dependent_variable + (1+t+I(t^2)|ID), family="poisson") tรวมถึงรูปร่างกำลังสองสำหรับ เป็นไปได้ไหมที่จะใช้เทคนิคการทำให้เรียบที่ซับซ้อนยิ่งขึ้นเช่นความนุ่มนวลหรือเส้นโค้งเพื่อสร้างความสัมพันธ์แบบนั้น

3
การตีความ“ รูปแบบผสม” สามรูปแบบ
มีความแตกต่างที่สะดุดฉันกับโมเดลผสมและฉันสงสัยว่าฉันจะได้รับความชัดเจนในนั้น สมมติว่าคุณมีรูปแบบข้อมูลนับรวมกัน มีตัวแปรที่คุณรู้ว่าคุณต้องการเป็นเอฟเฟกต์คงที่ (A) และตัวแปรอีกตัวสำหรับเวลา (T) จัดกลุ่มโดยพูดว่าตัวแปร "ไซต์" ตามที่ฉันเข้าใจ glmer(counts ~ A + T, data=data, family="Poisson") เป็นโมเดลเอฟเฟกต์คงที่ glmer(counts ~ (A + T | Site), data=data, family="Poisson") เป็นโมเดลเอฟเฟกต์แบบสุ่ม คำถามของฉันคือเมื่อคุณมีสิ่งที่ชอบ: glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")T คืออะไร มันเป็นผลแบบสุ่มหรือไม่? ผลคงที่? การทำให้สำเร็จด้วยการใส่ T ในทั้งสองแห่งคืออะไร เมื่อสิ่งที่ควรเท่านั้นที่ปรากฏในส่วนผลกระทบแบบสุ่มของสูตรรูปแบบ?

4
ในทางปฏิบัติเมทริกซ์ความแปรปรวนร่วมแบบสุ่มถูกคำนวณในรูปแบบเอฟเฟกต์ผสมอย่างไร
โดยพื้นฐานสิ่งที่ฉันสงสัยว่าโครงสร้างความแปรปรวนร่วมนั้นมีการบังคับใช้แตกต่างกันอย่างไรและวิธีคำนวณค่าภายในเมทริกซ์เหล่านี้อย่างไร ฟังก์ชั่นเช่น lme () ช่วยให้เราสามารถเลือกโครงสร้างที่เราต้องการได้ แต่ฉันชอบที่จะรู้ว่ามันเป็นอย่างไร พิจารณาผลกระทบเชิงเส้นผสมรุ่นYY= Xβ+ Zคุณ+ ϵY=Xβ+Zยู+εY=X\beta+Zu+\epsilon ที่ไหนและR) นอกจากนี้:ϵ d ∼ N ( 0 , R )คุณ∼dยังไม่มีข้อความ( 0 , D )ยู~dยังไม่มีข้อความ(0,D)u \stackrel{d}{\sim} N(0,D)ϵ ∼dยังไม่มีข้อความ( 0 , R )ε~dยังไม่มีข้อความ(0,R)\epsilon \stackrel{d}{\sim} N(0,R) VR ( Y| X, Z, β, u ) = RVaR(Y|X,Z,β,ยู)=RVar(Y|X,Z,\beta,u)=R VR ( Y| X, β) = Z'D …

2
วัด ANOVA ซ้ำด้วย lme / lmer ใน R สำหรับปัจจัยภายในสองเรื่อง
ฉันพยายามใช้lmeจากnlmeแพ็คเกจเพื่อทำซ้ำผลลัพธ์จากaovมาตรการ ANOVAs ซ้ำ ๆ ฉันได้ทำสิ่งนี้สำหรับการทดสอบซ้ำปัจจัยเดียวและสำหรับการทดสอบสองปัจจัยด้วยปัจจัยหนึ่งระหว่างวิชาและอีกหนึ่งปัจจัยในวิชา แต่ฉันมีปัญหาในการทดลองสองปัจจัยกับสองภายใน - หัวข้อย่อย ตัวอย่างที่แสดงด้านล่าง AและBเป็นปัจจัยที่มีผลคงที่และsubjectเป็นปัจจัยที่มีผลแบบสุ่ม set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = …


6
การถดถอยเบต้าของข้อมูลสัดส่วนรวมถึง 1 และ 0
ฉันพยายามสร้างแบบจำลองที่ฉันมีตัวแปรตอบกลับซึ่งเป็นสัดส่วนระหว่าง 0 และ 1 ซึ่งรวมถึง 0 และ 1 ไม่กี่ แต่ยังมีค่าอีกมาก ฉันกำลังคิดเกี่ยวกับการพยายามถดถอยเบต้า แพ็คเกจที่ฉันพบสำหรับ R (betareg) อนุญาตเฉพาะค่าระหว่าง 0 ถึง 1 แต่ไม่รวม 0 หรือ 1 ตัวพวกเขา ฉันได้อ่านที่อื่นแล้วว่าตามหลักการแล้วการกระจายเบต้าควรจะสามารถจัดการค่า 0 หรือ 1 ได้ แต่ฉันไม่รู้วิธีจัดการกับสิ่งนี้ใน RI ได้เห็นบางคนเพิ่ม 0.001 ลงในศูนย์และรับ 0.001 จากอันที่จริง แต่ฉันไม่ แน่ใจว่านี่เป็นความคิดที่ดีหรือไม่? อีกทางหนึ่งฉันสามารถ logit แปลงตัวแปรการตอบสนองและใช้การถดถอยเชิงเส้น ในกรณีนี้ฉันมีปัญหาเดียวกันกับ 0 และ 1 ซึ่งไม่สามารถแปลงการบันทึกได้

3
ANOVA ควรใช้มาตรการซ้ำ ๆ มากกว่าแบบจำลองเอฟเฟกต์เมื่อใด
ในการตอบคำถามนี้เกี่ยวกับว่าการออกแบบของฉันที่ฉันนำเสนอผู้เข้าร่วมด้วยภาพจากหมวดหมู่ที่แตกต่างกันเป็นตัวอย่างที่ฉันควรใช้มาตรการ ANOVA ซ้ำ ๆ หรือไม่ฉันได้รับคำตอบว่าฉันควรใช้รูปแบบผสมแทนด้วยหนึ่งใน เหตุผลที่ทำให้ฉันมีการพึ่งพาสองรูปแบบ: สำหรับวิชาและสำหรับหมวดหมู่ คำถามของฉันคือตอนนี้: มันไม่ใช่กรณีที่คุณมีสองการพึ่งพาในลักษณะนี้เมื่อทำการออกแบบมาตรการซ้ำ ๆ แบบนี้หรือไม่? นั่นคือภายใต้สถานการณ์ใดที่ ANOVA จะทำซ้ำมาตรการจะดีกว่าวิธีการสร้างแบบจำลองผลกระทบผสมและทำไม?

1
สูตรชีต ANOVA ตัวอักษรซุปและการถดถอยเท่าเทียมกัน
ฉันสามารถขอความช่วยเหลือในการพยายามรับตลับลูกปืนของฉันให้เทียบเท่ากับ ANOVA และ REGRESSION ได้หรือไม่? ฉันพยายามปรับความคิดศัพท์ศัพท์และไวยากรณ์ของวิธีการทั้งสองนี้ มีโพสต์จำนวนมากในไซต์นี้เกี่ยวกับความเหมือนกันของพวกเขาเช่นนี้หรือนี่แต่ก็ยังดีที่มีแผนที่ "คุณอยู่ที่นี่" อย่างรวดเร็วเมื่อเริ่มต้น ฉันวางแผนที่จะอัพเดทโพสต์นี้และหวังว่าจะได้รับความช่วยเหลือในการแก้ไขข้อผิดพลาด ANOVA ทางเดียว: Structure: DV is continuous; IV is ONE FACTOR with different LEVELS. Scenario: miles-per-gal. vs cylinders Note that Income vs Gender (M, F) is a t-test. Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit) Regression: fit …

1
ข้อผิดพลาดมาตรฐานแบบกลุ่มเทียบกับการสร้างแบบจำลองหลายระดับ?
ฉันอ่านผ่านหนังสือหลายเล่ม (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill ฯลฯ ) และอีกหลายบทความ (Gelman, Jusko, Primo & Jacobsmeier ฯลฯ ) และฉันก็ยังไม่ได้คาดหัว ความแตกต่างที่สำคัญระหว่างการใช้ข้อผิดพลาดมาตรฐานแบบกลุ่มการสร้างแบบจำลองหลายระดับ ฉันเข้าใจส่วนต่าง ๆ ที่เกี่ยวข้องกับคำถามการวิจัยในมือ มีคำตอบบางประเภทที่คุณจะได้รับจากการสร้างแบบจำลองหลายระดับเท่านั้น อย่างไรก็ตามตัวอย่างเช่นสำหรับแบบจำลองสองระดับที่ค่าสัมประสิทธิ์ที่คุณสนใจอยู่ที่ระดับที่สองข้อดีของการทำหนึ่งวิธีเหนืออีกวิธีหนึ่งคืออะไร ในกรณีนี้ฉันไม่กังวลเกี่ยวกับการคาดการณ์หรือแยกค่าสัมประสิทธิ์บุคคลสำหรับกลุ่ม ข้อแตกต่างที่สำคัญที่ฉันสามารถพบได้คือข้อผิดพลาดมาตรฐานที่กลุ่มประสบเมื่อกลุ่มมีขนาดตัวอย่างไม่เท่ากันและการสร้างแบบจำลองหลายระดับนั้นอ่อนแอเมื่อพิจารณาว่าเป็นข้อกำหนดของการกระจายสัมประสิทธิ์แบบสุ่ม (ในขณะที่ใช้ข้อผิดพลาดมาตรฐาน . และท้ายที่สุดแล้วทั้งหมดนี้หมายความว่าสำหรับแบบจำลองที่สามารถใช้วิธีใดวิธีหนึ่งอย่างชัดเจนเราควรได้ผลลัพธ์ที่คล้ายคลึงกันในแง่ของค่าสัมประสิทธิ์และข้อผิดพลาดมาตรฐานหรือไม่ คำตอบหรือแหล่งข้อมูลที่เป็นประโยชน์จะได้รับการชื่นชมอย่างมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.