คำถามติดแท็ก lme4-nlme

lme4 และ nlme เป็นแพ็คเกจ R ที่ใช้สำหรับแบบจำลองเชิงเส้นแบบเชิงเส้นแบบเชิงเส้นและแบบไม่เชิงเส้นที่เหมาะสม สำหรับคำถามทั่วไปเกี่ยวกับแบบผสมให้ใช้แท็ก [แบบผสม]

2
lme4 :: lmer เทียบเท่ากับ ANOVA ที่ทำซ้ำสามทางคืออะไร?
คำถามของฉันอยู่บนพื้นฐานของการตอบสนองซึ่งแสดงให้เห็นว่าlme4::lmerรูปแบบใดที่สอดคล้องกับการวัดความแปรปรวนสองทางแบบ ANOVA: require(lme4) set.seed(1234) d <- data.frame( y = rnorm(96), subject = factor(rep(1:12, 4)), a = factor(rep(1:2, each=24)), b = factor(rep(rep(1:2, each=12))), c = factor(rep(rep(1:2, each=48)))) # standard two-way repeated measures ANOVA: summary(aov(y~a*b+Error(subject/(a*b)), d[d$c == "1",])) # corresponding lmer call: anova(lmer(y ~ a*b+(1|subject) + (1|a:subject) + (1|b:subject), d[d$c == "1",])) …

4
น้ำหนักเบต้าแบบมาตรฐานสำหรับการถดถอยหลายระดับ
เราจะได้น้ำหนักที่ถดถอยแบบมาตรฐาน (เอฟเฟกต์คงที่) จากการถดถอยหลายระดับได้อย่างไร และในฐานะ "Add-on": วิธีที่ง่ายที่สุดในการรับน้ำหนักมาตรฐานเหล่านี้จากmer-object คืออะไร (จากlmerฟังก์ชั่นของlme4แพ็คเกจในR)

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
จะทำการเปรียบเทียบโพสต์เฉพาะกิจในคำที่ใช้โต้ตอบกับแบบจำลองเอฟเฟกต์ผสมได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูลเพื่อประเมินผลกระทบของการทำแห้งต่อกิจกรรมของจุลินทรีย์ในตะกอน มีวัตถุประสงค์เพื่อตรวจสอบว่าผลกระทบของการอบแห้งแตกต่างกันไปตามประเภทของตะกอนและ / หรือความลึกภายในตะกอนหรือไม่ การออกแบบการทดลองมีดังนี้: ตะกอนปัจจัยแรกสอดคล้องกับตะกอนสามประเภท (รหัส Sed1, Sed2, Sed3) สำหรับตะกอนแต่ละประเภทการสุ่มตัวอย่างดำเนินการในสามไซต์ (3 ไซต์สำหรับ Sed1, 3 ไซต์สำหรับ Sed2, 3 ไซต์สำหรับ Sed3) มีการเข้ารหัสเว็บไซต์ : ไซต์ 1, ไซต์ 2, ... , ไซต์ 9 ปัจจัยต่อไปคืออุทกวิทยา : ภายในแต่ละไซต์ทำการสุ่มตัวอย่างในพื้นที่แห้งและในแปลงเปียก (แปลงแห้ง / เปียก) ภายในแต่ละพล็อตก่อนหน้าการสุ่มตัวอย่างจะดำเนินการที่สองความลึก (D1, D2) เป็นสามเท่า มีทั้งหมด n = 108 ตัวอย่าง = 3 ตะกอน * 3 …

1
การติดตั้ง GLOM แบบทวินาม (glmer) กับตัวแปรตอบกลับที่เป็นสัดส่วนหรือเศษส่วน
ฉันหวังว่าใครบางคนสามารถช่วยในสิ่งที่ฉันคิดว่าเป็นคำถามที่ค่อนข้างง่ายและฉันคิดว่าฉันรู้คำตอบ แต่ไม่มีการยืนยันมันกลายเป็นสิ่งที่ฉันไม่แน่ใจ ฉันมีข้อมูลการนับเป็นตัวแปรตอบกลับและฉันต้องการวัดว่าตัวแปรนั้นเปลี่ยนแปลงไปอย่างไรด้วยการมีสัดส่วนของบางสิ่งบางอย่าง ในรายละเอียดเพิ่มเติมตัวแปรตอบสนองจะนับการมีอยู่ของสปีชีส์ของแมลงในหลาย ๆ ไซต์ดังนั้นตัวอย่างจะถูกสุ่มตัวอย่าง 10 ครั้งและสปีชีส์นี้อาจเกิดขึ้น 4 ครั้ง ฉันต้องการที่จะดูว่าสิ่งนี้มีความสัมพันธ์กับการปรากฏตัวตามสัดส่วนของกลุ่มพันธุ์พืชใน commmunity โดยรวมของพืชที่เว็บไซต์เหล่านี้ ซึ่งหมายความว่าข้อมูลของฉันมีลักษณะดังนี้ (นี่เป็นเพียงตัวอย่าง) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 ข้อมูลยังรวมถึงเอฟเฟกต์แบบสุ่มสำหรับตำแหน่ง ฉันคิดว่าสองวิธีหนึ่งจะเป็นแบบจำลองเชิงเส้น ( lmer) กับแมลงที่แปลงเป็นสัดส่วนเช่น lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) ครั้งที่สองจะเป็นแบบทวินาม GLMM ( glmer) เช่น glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ …

1
มาตรการซ้ำ anova: lm vs lmer
ฉันพยายามสร้างการทดสอบการโต้ตอบหลายครั้งระหว่างมาตรการทั้งสองlmและlmerมาตรการซ้ำ (2x2x2) เหตุผลที่ฉันต้องการเปรียบเทียบทั้งสองวิธีนี้เป็นเพราะ GLM ของ SPSS สำหรับการวัดซ้ำ ๆ ทำให้ได้ผลลัพธ์ที่เหมือนกันกับlmวิธีที่นำเสนอที่นี่ดังนั้นในตอนท้ายฉันต้องการเปรียบเทียบ SPSS กับ R-lmer จนถึงตอนนี้ฉันทำได้แค่ทำซ้ำ (อย่างใกล้ชิด) ปฏิสัมพันธ์บางอย่าง คุณจะพบสคริปต์ด้านล่างเพื่อแสดงจุดของฉันให้ดีขึ้น: library(data.table) library(tidyr) library(lmerTest) library(MASS) set.seed(1) N <- 100 # number of subjects sigma <- 1 # popuplation sd rho <- .6 # correlation between variables # X1: a a a a b b b …

1
คำนวณการทำนายผลแบบสุ่มด้วยตนเองสำหรับโมเดลเชิงเส้นผสม
ฉันกำลังพยายามคำนวณการทำนายผลแบบสุ่มจากแบบจำลองเชิงเส้นผสมด้วยมือและการใช้สัญกรณ์ของ Wood ในแบบจำลองการเติมทั่วไป: การแนะนำด้วย R (pg 294 / pg 307 ของ pdf) ฉันสับสนกับสิ่งที่แต่ละพารามิเตอร์ หมายถึง ด้านล่างนี้เป็นบทสรุปจากไม้ กำหนดรูปแบบผสมเชิงเส้น Y=Xβ+Zb+ϵY=Xβ+Zb+ϵ Y = X\beta + Zb + \epsilon โดยที่ b N (0, ψ ) และϵ ∼ N (0, σ 2 )∼∼\simψψ\psiϵ∼ϵ∼\epsilon \simσ2σ2\sigma^{2} ถ้า b และ y เป็นตัวแปรสุ่มที่มีการแจกแจงปกติร่วม [by]∼N[[0Xβ],[ψΣybΣbyΣθσ2]][by]∼N[[0Xβ],[ψΣbyΣybΣθσ2]]\begin{align*} \begin{bmatrix} b\\ y \end{bmatrix} &\sim N …

2
วิธีการจำลองข้อมูลเพื่อแสดงเอฟเฟกต์แบบผสมด้วย R (lme4)
ในฐานะที่เป็นคู่ของโพสต์นี้ฉันทำงานเกี่ยวกับการจำลองข้อมูลที่มีตัวแปรต่อเนื่องให้ยืมตัวเองเพื่อดักความสัมพันธ์และความลาดชัน แม้ว่าจะมีโพสต์ที่ยอดเยี่ยมเกี่ยวกับหัวข้อนี้ในเว็บไซต์และนอกไซต์แต่ฉันมีปัญหาในการหาตัวอย่างตั้งแต่ต้นจนจบด้วยข้อมูลจำลองที่ขนานกับสถานการณ์ในชีวิตจริงที่เรียบง่าย ดังนั้นคำถามคือวิธีการจำลองข้อมูลเหล่านี้และการทดสอบ "" lmerมันด้วย ไม่มีอะไรใหม่สำหรับหลาย ๆ คน แต่อาจเป็นประโยชน์สำหรับคนอื่น ๆ ที่ค้นหาเพื่อทำความเข้าใจกับโมเดลที่หลากหลาย

1
โมเดลเมทริกซ์สำหรับโมเดลเอฟเฟกต์ผสม
ในlmerฟังก์ชั่นภายในlme4ในRมีการเรียกร้องให้สร้างเมทริกซ์รูปแบบของผลกระทบสุ่มตามที่อธิบายไว้ที่นี่ , หน้า 7-9ZZZ คำนวณ entails KhatriRao และ / หรือผลิตภัณฑ์ Kronecker สองเมทริกซ์และx_i J i X iZZZJผมJผมJ_iXผมXผมX_i เมทริกซ์เป็นคำหนึ่ง: "เมทริกซ์ตัวบ่งชี้ของดัชนีปัจจัยการจัดกลุ่ม" แต่ดูเหมือนว่าจะเป็นเมทริกซ์เบาบางที่มีการเข้ารหัสแบบดัมมี่เพื่อเลือกหน่วย (ตัวอย่างเช่นอาสาสมัครในการวัดซ้ำ) ที่สอดคล้องกับระดับลำดับขั้นสูง การสังเกตใด ๆ เมทริกซ์ที่ดูเหมือนว่าจะทำหน้าที่เป็นตัวเลือกของการวัดในระดับที่ต่ำกว่าลำดับชั้นเพื่อให้การรวมกันของทั้งสอง "เตอร์" จะให้ผลผลิตเมทริกซ์,ของแบบฟอร์มแสดงในกระดาษผ่านตัวอย่างต่อไปนี้:X i Z iJผมJผมJ_iXผมXผมX_iZผมZผมZ_i (f<-gl(3,2)) [1] 1 1 2 2 3 3 Levels: 1 2 3 (Ji<-t(as(f,Class="sparseMatrix"))) 6 x 3 sparse Matrix of class "dgCMatrix" …

1
การทดสอบหลังเลิกเรียนใน multcomp :: glht สำหรับโมเดลเอฟเฟกต์แบบผสม (lme4) พร้อมการโต้ตอบ
ฉันกำลังทำการทดสอบแบบโพสต์เฉพาะกิจในโมเดลผสมผลกระทบเชิงเส้นในR( lme4แพ็คเกจ) ฉันใช้multcompแพคเกจ ( glht()ฟังก์ชั่น) เพื่อทำการทดสอบหลังการทำงาน การออกแบบการทดลองของฉันคือการวัดซ้ำพร้อมเอฟเฟกต์บล็อกแบบสุ่ม รูปแบบที่ระบุไว้เป็น: mymod <- lmer(variable ~ treatment * time + (1|block), data = mydata, REML = TRUE) แทนที่จะแนบข้อมูลของฉันที่นี่ฉันกำลังทำงานของข้อมูลที่เรียกว่าwarpbreaksภายในmultcompแพ็คเกจ data <- warpbreaks warpbreaks$rand <- NA ฉันได้เพิ่มตัวแปรสุ่มพิเศษเพื่อเลียนแบบเอฟเฟกต์ "บล็อก" ของฉัน: warpbreaks$rand <- rep(c("foo", "bar", "bee"), nrow(warpbreaks)/3) นี่เป็นการเลียนแบบโมเดลของฉัน: mod <- lmer(breaks ~ tension * wool + (1|rand), data …

1
เปรียบเทียบแบบผสมเอฟเฟกต์และเอฟเฟกต์คงที่ (การทดสอบความสำคัญของเอฟเฟกต์แบบสุ่ม)
ให้สามตัวแปรyและxซึ่งเป็นบวกอย่างต่อเนื่องและzซึ่งเป็นเด็ดขาดฉันมีสองรูปแบบผู้สมัครที่กำหนดโดย: fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) และ fit.fe <- lm( y ~ 1 + x ) ฉันหวังว่าจะเปรียบเทียบแบบจำลองเหล่านี้เพื่อพิจารณาว่าแบบจำลองใดเหมาะสมกว่า ดูเหมือนว่าผมว่าในความรู้สึกบางอย่างฝังอยู่ในfit.fe fit.meโดยทั่วไปเมื่อสถานการณ์ทั่วไปนี้มีการทดสอบแบบไคสแควร์สามารถทำได้ ในRเราสามารถทำการทดสอบนี้ด้วยคำสั่งดังต่อไปนี้ anova(fit.fe,fit.me) เมื่อทั้งสองรุ่นมีเอฟเฟกต์แบบสุ่ม (สร้างโดยlmerจากlme4แพ็คเกจ) anova()คำสั่งทำงานได้ดี เนื่องจากโดยทั่วไปแล้วจะแนะนำให้ทดสอบสถิติ Chi-Square ผ่านการจำลองอย่างไรก็ตามเรายังสามารถใช้สถิติในขั้นตอนการจำลองได้ เมื่อทั้งสองรุ่นมีเอฟเฟกต์ถาวรเท่านั้นวิธีการนี้ --- และanova()คำสั่งที่เกี่ยวข้อง--- ทำงานได้ดี แต่เมื่อรุ่นหนึ่งที่มีผลกระทบสุ่มและรูปแบบที่ลดลงมีเพียงผลกระทบคงที่ในขณะที่สถานการณ์ข้างต้นanova()คำสั่งไม่ทำงาน โดยเฉพาะอย่างยิ่งฉันได้รับข้อผิดพลาดต่อไปนี้: > anova(fit.fe, fit.me) Error: $ …

1
ค่าสัมประสิทธิ์สหสัมพันธ์ในแบบจำลองผสมกับความลาดชันแบบสุ่ม
ฉันมีโมเดลต่อไปนี้ที่m_plotมีเอlme4::lmerฟเฟ็กต์แบบสุ่มข้ามสำหรับผู้เข้าร่วม ( lfdn) และรายการ ( content): Random effects: Groups Name Variance Std.Dev. Corr lfdn (Intercept) 172.173 13.121 role1 62.351 7.896 0.03 inference1 24.640 4.964 0.08 -0.30 inference2 52.366 7.236 -0.05 0.17 -0.83 inference3 21.295 4.615 -0.03 0.22 0.86 -0.77 content (Intercept) 23.872 4.886 role1 2.497 1.580 -1.00 inference1 18.929 4.351 …

1
สัญกรณ์สำหรับการสร้างแบบจำลองหลายระดับ
สูตรหนึ่งต้องระบุสำหรับการฝึกอบรมรูปแบบหลายระดับ (ใช้lmerจากlme4 Rห้องสมุด) ทำให้ฉันได้รับเสมอ ฉันได้อ่านหนังสือและแบบฝึกหัดที่นับไม่ถ้วน แต่ไม่เข้าใจเลย นี่คือตัวอย่างจากบทช่วยสอนนี้ที่ฉันต้องการดูสูตรในสมการ เราพยายามจำลองความถี่เสียงเป็นหน้าที่ของเพศ (เพศหญิงมีระดับเสียงสูงกว่าเพศชายโดยทั่วไป) และทัศนคติของบุคคล (ไม่ว่าเขา / เธอจะตอบด้วยวิธีสุภาพหรือไม่เป็นทางการ) ในสถานการณ์ต่าง ๆ นอกจากนี้อย่างที่คุณเห็นจากsubjectคอลัมน์แต่ละคนจะถูกวัดหลายครั้ง > head(politeness, n=20) subject gender scenario attitude frequency 1 F1 F 1 pol 213.3 2 F1 F 1 inf 204.5 3 F1 F 2 pol 285.1 4 F1 F 2 inf 259.7 5 F1 …

2
องศาอิสระใน lmerTest :: anova ถูกต้องหรือไม่? พวกเขาแตกต่างจาก RM-ANOVA มาก
ฉันกำลังวิเคราะห์ผลลัพธ์ของการทดสอบเวลาตอบสนองใน R ฉันใช้มาตรการ ANOVA ซ้ำหลายครั้ง (1 ปัจจัยภายในเรื่องที่มี 2 ระดับและ 1 ระหว่างปัจจัยหัวเรื่องกับ 2 ระดับ) ฉันวิ่งคล้ายรูปแบบผสมเชิงเส้นและผมอยากจะสรุปผลการ lmer lmerTest::anovaในรูปแบบของตารางโดยใช้การวิเคราะห์ความแปรปรวน อย่าเข้าใจฉันผิด: ฉันไม่ได้คาดหวังผลลัพธ์ที่เหมือนกัน แต่ฉันไม่แน่ใจเกี่ยวกับระดับของเสรีภาพในlmerTest::anovaผลลัพธ์ สำหรับฉันแล้วมันค่อนข้างสะท้อนถึง ANOVA ที่ไม่มีการรวมกลุ่มวิชา ผมตระหนักถึงความจริงที่ว่าการคำนวณองศาอิสระในรูปแบบผสมผลเป็นเรื่องยุ่งยาก แต่lmerTest::anovaเป็นที่กล่าวถึงเป็นวิธีแก้ปัญหาที่เป็นไปได้ในการปรับปรุง?pvaluesหัวข้อ ( lme4แพคเกจ) การคำนวณนี้ถูกต้องหรือไม่ ผลลัพธ์ของการlmerTest::anovaสะท้อนรุ่นที่ระบุถูกต้องหรือไม่ ปรับปรุง:ฉันทำให้ความแตกต่างของแต่ละบุคคลมีขนาดใหญ่ขึ้น องศาความอิสระlmerTest::anovaนั้นแตกต่างจากโนวาแบบง่าย ๆ แต่ฉันก็ยังไม่แน่ใจว่าทำไมพวกเขาถึงมีขนาดใหญ่มากสำหรับปัจจัย / การโต้ตอบภายใน # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA …

3
วิธีรับช่วงความมั่นใจในการเปลี่ยนแปลงประชากร r-square
ตัวอย่างง่ายๆสมมติว่ามีตัวแบบถดถอยเชิงเส้นสองแบบ รุ่นที่ 1 มีสามทำนาย, x1a, x2bและx2c แบบจำลอง 2 มีตัวทำนายสามตัวจากแบบจำลอง 1 และสองตัวทำนายเพิ่มเติมx2aและx2b มีสมการถดถอยที่ประชากรประชากรแปรปรวนอธิบายคือเป็น สำหรับรุ่นที่ 1 และρ 2 ( 2 )สำหรับรุ่น 2. แปรปรวนเพิ่มขึ้นอธิบายโดยรุ่น 2 ในประชากรที่อยู่Δ ρ 2 = ρ 2 ( 2 ) - ρ 2 ( 1 )ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δρ2=ρ2(2)−ρ2(1)Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} ฉันสนใจในการได้รับข้อผิดพลาดมาตรฐานและช่วงความเชื่อมั่นสำหรับประมาณการของ 2 ในขณะที่ตัวอย่างเกี่ยวข้องกับตัวทำนาย 3 และ 2 ตามลำดับความสนใจงานวิจัยของฉันเกี่ยวข้องกับตัวทำนายจำนวนต่าง ๆ (เช่น …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.