คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

1
การสร้างแบบจำลองผลกระทบเชิงเส้นผสมกับข้อมูลการศึกษาคู่
สมมติว่าฉันมีตัวแปรตอบสนองบางอย่างที่วัดจากพี่น้องคนที่ในครอบครัวที่นอกจากนี้ข้อมูลพฤติกรรมบางอย่างถูกรวบรวมในเวลาเดียวกันจากแต่ละเรื่อง ฉันพยายามวิเคราะห์สถานการณ์ด้วยโมเดลผสมผลกระทบเชิงเส้นต่อไปนี้: j ฉันx ฉันjyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} โดยที่และเป็นจุดตัดและความชันคงที่ตามลำดับ คือความชันแบบสุ่มและคือส่วนที่เหลือα 1 δ 1 i ε i jα0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} สมมติฐานสำหรับผลกระทบแบบสุ่มและส่วนที่เหลือคือ (สมมติว่ามีพี่น้องเพียงสองคนเท่านั้นในแต่ละครอบครัว) ε ฉันjδ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} δ1 ฉัน( εฉัน1, εฉัน2)T~dยังไม่มีข้อความ( 0 , τ2)~dยังไม่มีข้อความ( ( 0 , 0 )T, R )δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T …

4
การประมาณจุดพักในตัวแบบเชิงเส้นแท่ง / เศษชิ้นส่วนที่มีเอฟเฟกต์แบบสุ่มใน R [รวมรหัสและเอาท์พุท]
ใครช่วยบอกฉันหน่อยได้ไหมว่าจะให้ R ประมาณจุดแตกหักในแบบจำลองเชิงเส้นแบบต่อเนื่อง (เป็นพารามิเตอร์คงที่หรือแบบสุ่ม) เมื่อฉันต้องประมาณผลกระทบแบบสุ่มอื่น ๆ ด้วยหรือไม่ ฉันได้รวมตัวอย่างของเล่นด้านล่างที่เหมาะกับไม้ฮอกกี้ / การถดถอยแบบแท่งหักด้วยความแปรปรวนแบบสุ่มและความแปรปรวนแบบสุ่มตัดแกน y สำหรับจุดพักที่ 4 ฉันต้องการประเมินจุดพักแทนการระบุ มันอาจเป็นผลแบบสุ่ม (ดีกว่า) หรือผลคงที่ library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with …

3
ความแตกต่างระหว่างการใช้ aov () และ lme () ในการวิเคราะห์ชุดข้อมูลระยะยาวคืออะไร?
ใครสามารถบอกฉันถึงความแตกต่างระหว่างการใช้aov()และlme()การวิเคราะห์ข้อมูลระยะยาวและวิธีการตีความผลลัพธ์จากทั้งสองวิธีได้หรือไม่ ด้านล่างผมวิเคราะห์ชุดข้อมูลเดียวกันโดยใช้aov()และlme()และได้ผลที่แตกต่างกัน 2 ด้วยaov()ฉันได้รับผลอย่างมีนัยสำคัญในเวลาโดยการโต้ตอบการรักษา แต่เหมาะสมกับรูปแบบการผสมเชิงเส้นเวลาโดยการโต้ตอบการรักษาไม่สำคัญ > UOP.kg.aov <- aov(UOP.kg~time*treat+Error(id), raw3.42) > summary(UOP.kg.aov) Error: id Df Sum Sq Mean Sq F value Pr(>F) treat 1 0.142 0.1421 0.0377 0.8471 Residuals 39 147.129 3.7725 Error: Within Df Sum Sq Mean Sq F value Pr(>F) time 1 194.087 194.087 534.3542 < 2e-16 *** …

1
ความเท่าเทียมกันของ (0 + ปัจจัย | กลุ่ม) และ (1 | กลุ่ม) + (1 | กลุ่ม: ปัจจัย) ข้อมูลจำเพาะของผลกระทบแบบสุ่มในกรณีที่สัดส่วนสมมาตร
ดักลาสเบตส์กล่าวว่าแบบจำลองต่อไปนี้เทียบเท่ากัน "ถ้าเมทริกซ์ความแปรปรวนร่วมแปรปรวนสำหรับเอฟเฟกต์สุ่ม - ค่าเวกเตอร์มีรูปแบบพิเศษเรียกว่าสมมาตรผสม" ( สไลด์ 91 ในการนำเสนอนี้ ): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) เบตส์เฉพาะใช้ตัวอย่างนี้: library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine …

1
ANOVA นั้นขึ้นอยู่กับวิธีการของช่วงเวลาและไม่ใช่โอกาสสูงสุดหรือไม่?
ฉันเห็นว่ามีการพูดถึงในสถานที่ต่าง ๆ ที่ ANOVA ทำการประมาณโดยใช้วิธีการของช่วงเวลา ฉันสับสนกับคำยืนยันดังกล่าวเพราะแม้ว่าฉันจะไม่คุ้นเคยกับวิธีการของช่วงเวลา แต่ความเข้าใจของฉันคือมันเป็นสิ่งที่แตกต่างจากและไม่เทียบเท่ากับวิธีการของโอกาสสูงสุด; ในอีกทางหนึ่งการวิเคราะห์ความแปรปรวนสามารถถูกมองว่าเป็นการถดถอยเชิงเส้นด้วยตัวพยากรณ์เชิงหมวดหมู่และการประมาณค่า OLS ของพารามิเตอร์การถดถอยเป็นโอกาสสูงสุด ดังนั้น: สิ่งที่มีคุณสมบัติขั้นตอนการวิเคราะห์ความแปรปรวนเป็นวิธีการของช่วงเวลา? ระบุว่า ANOVA นั้นเทียบเท่ากับ OLS ที่มีตัวพยากรณ์หมวดหมู่ไม่ได้หรือไม่? หากทั้งสองวิธีใดที่กลายเป็นสิ่งที่เทียบเท่าในกรณีพิเศษของ ANOVA ปกติจะมีสถานการณ์ ANOVA เฉพาะบางอย่างหรือไม่เมื่อความแตกต่างมีความสำคัญ? การออกแบบที่ไม่สมดุล? มาตรการซ้ำแล้วซ้ำอีก? การออกแบบแบบผสม (ระหว่างวิชา + ภายในวิชา)?

1
การอนุมานไม่ถูกต้องเมื่อการสังเกตไม่เป็นอิสระ
ฉันเรียนรู้ในสถิติเบื้องต้นว่าด้วยโมเดลเชิงเส้นทั่วไปเพื่อให้การอนุมานมีเหตุผลการสังเกตต้องเป็นอิสระ เมื่อการรวมกลุ่มเกิดขึ้นความเป็นอิสระอาจไม่ได้นำไปสู่การอนุมานที่ไม่ถูกต้องอีกต่อไปหากไม่นับรวม วิธีหนึ่งในการทำบัญชีสำหรับการทำคลัสเตอร์ดังกล่าวคือการใช้ตัวแบบผสม ฉันต้องการค้นหาชุดข้อมูลตัวอย่างจำลองหรือไม่ซึ่งแสดงให้เห็นอย่างชัดเจน ฉันพยายามใช้หนึ่งในชุดข้อมูลตัวอย่างบนไซต์ UCLA สำหรับการวิเคราะห์ข้อมูลคลัสเตอร์ > require(foreign) > require(lme4) > dt <- read.dta("http://www.ats.ucla.edu/stat/stata/seminars/svy_stata_intro/srs.dta") > m1 <- lm(api00~growth+emer+yr_rnd, data=dt) > summary(m1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 740.3981 11.5522 64.092 <2e-16 *** growth -0.1027 0.2112 -0.486 0.6271 emer -5.4449 0.5395 -10.092 <2e-16 *** yr_rnd -51.0757 19.9136 -2.565 …

1
การทำนายเกี่ยวกับโมเดลเอฟเฟกต์ผสม: จะทำอย่างไรกับเอฟเฟกต์แบบสุ่ม?
ลองพิจารณาชุดข้อมูลสมมุตินี้: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) เราสามารถใช้lmeเพื่อจำลองการตอบสนองด้วยโมเดลเอฟเฟกต์แบบสุ่ม: require(nlme) model <- lme(response ~ dose + group + dose*group, random = ~1|subject, df) ฉันต้องการใช้predictกับผลลัพธ์ของโมเดลนี้เพื่อรับการตอบสนองของหัวเรื่องทั่วไปของกลุ่ม 1 ถึงปริมาณ …

2
ค่าสัมประสิทธิ์สหสัมพันธ์สหสัมพันธ์ (ICC) ที่มีหลายตัวแปร
สมมติว่าฉันได้วัดตัวแปรบางอย่างในพี่น้องซึ่งซ้อนกันภายในครอบครัว โครงสร้างข้อมูลมีลักษณะดังนี้: คุณค่าของครอบครัวพี่น้อง ------ ------- ----- 1 1 y_11 1 2 y_12 2 1 y_21 2 2 y_22 2 3 y_23 ... ... ... ฉันต้องการทราบความสัมพันธ์ระหว่างการวัดกับพี่น้องในครอบครัวเดียวกัน วิธีปกติในการทำเช่นนั้นคือการคำนวณ ICC ตามรูปแบบการสกัดกั้นแบบสุ่ม: res <- lme(yij ~ 1, random = ~ 1 | family, data=dat) getVarCov(res)[[1]] / (getVarCov(res)[[1]] + res$s^2) สิ่งนี้จะเทียบเท่ากับ: res <- gls(yij ~ …

3
แบบจำลองเชิงเส้นผสม
ฉันเคยได้ยินมาว่าแบบจำลอง LME นั้นฟังดูดีกว่าในการวิเคราะห์ข้อมูลความถูกต้อง (เช่นในการทดลองทางจิตวิทยา) ซึ่งพวกเขาสามารถทำงานกับการแจกแจงทวินามและการแจกแจงแบบไม่ปกติอื่น ๆ ที่วิธีการแบบดั้งเดิม (เช่น ANOVA) อะไรคือพื้นฐานทางคณิตศาสตร์ของโมเดล LME ที่อนุญาตให้รวมการแจกแจงอื่น ๆ เหล่านี้และอะไรคือเอกสารทางเทคนิคที่ไม่อธิบายมากเกินไป?

1
การแตกความลาดเอียงสำหรับเคสจากโมเดลเอฟเฟกต์ผสม (lme4)
ฉันต้องการแยกความลาดชันสำหรับแต่ละคนในรูปแบบเอฟเฟกต์ผสมตามที่ระบุไว้ในวรรคต่อไปนี้ แบบจำลองเอฟเฟกต์แบบผสมถูกนำมาใช้เพื่ออธิบายลักษณะการเปลี่ยนแปลงของแต่ละบุคคลในมาตรการสรุปทางปัญญาซึ่งรวมถึงข้อกำหนดสำหรับอายุเพศและปีการศึกษาซึ่งเป็นผลกระทบคงที่ (Laird and Ware, 1982; Wilson et al., 2000, 2002c) ... ส่วนที่เหลือเงื่อนไขความลาดชันการลดลงของความรู้ความเข้าใจของแต่ละบุคคลถูกดึงออกมาจากแบบจำลองผสมหลังจากปรับผลกระทบของอายุเพศและการศึกษา จากนั้นนำมาใช้เป็นข้อมูลเชิงปริมาณสำหรับการวิเคราะห์ความสัมพันธ์ทางพันธุกรรม การประมาณการเหล่านี้เปรียบเสมือนความแตกต่างระหว่างความชันของแต่ละบุคคลกับความชันที่คาดการณ์ของบุคคลที่มีอายุเพศและระดับการศึกษาเดียวกัน De Jager, PL, Shulman, JM, Chibnik, LB, Keenan, BT, Raj, T. , Wilson, RS, et al. (2012) จีโนมกว้างสแกนทั่วไปสายพันธุ์ที่มีผลต่ออัตราการที่เกี่ยวข้องกับอายุการลดลงของความรู้ความเข้าใจ ชีววิทยาของวัย, 33 (5), 1017.e1–1017.e15 ฉันดูที่การใช้coefฟังก์ชั่นเพื่อดึงค่าสัมประสิทธิ์สำหรับแต่ละบุคคล แต่ฉันไม่แน่ใจว่านี่เป็นวิธีการที่ถูกต้องที่จะใช้หรือไม่ ใครสามารถให้คำแนะนำเกี่ยวกับวิธีการทำเช่นนี้? #example R code library(lme4) attach(sleepstudy) fml <- lmer(Reaction ~ Days …
13 r  mixed-model 

2
การคำนวณ
ผมได้อ่านเกี่ยวกับการคำนวณR2R2R^2ค่าในรูปแบบผสมและหลังจากที่ได้อ่านคำถามที่พบบ่อย R-sig โพสต์อื่น ๆ ในฟอรั่มนี้ (ฉันจะเชื่อมโยงไม่กี่ แต่ฉันไม่ได้มีชื่อเสียงพอ) และอีกหลายอ้างอิงอื่น ๆ ผมเข้าใจว่าการใช้R2R2R^2ค่าในบริบทของตัวแบบผสมนั้นซับซ้อน อย่างไรก็ตามเมื่อเร็ว ๆ นี้ฉันได้พบกับสองเอกสารด้านล่าง ในขณะที่วิธีการเหล่านี้ดูมีแนวโน้ม (สำหรับฉัน) ฉันไม่ใช่นักสถิติและฉันก็สงสัยว่าถ้ามีใครอีกคนที่มีข้อมูลเชิงลึกเกี่ยวกับวิธีที่พวกเขาเสนอและวิธีเปรียบเทียบกับวิธีอื่น ๆ ที่ได้รับการเสนอ Nakagawa, Shinichi และ Holger Schielzeth "วิธีการทั่วไปและง่าย ๆ สำหรับรับ R2 จากโมเดลเอฟเฟกต์การผสมเชิงเส้นทั่วไป" วิธีการทางนิเวศวิทยาและวิวัฒนาการ 4.2 (2013): 133-142 จอห์นสันพอลซีดี "การขยาย R2GLMM ของ Nakagawa & Schielzeth ไปเป็นแบบจำลองเชิงลาดแบบสุ่ม" วิธีการในนิเวศวิทยาและวิวัฒนาการ (2014) วิธีนี้ยังสามารถนำมาใช้โดยใช้ฟังก์ชั่น r.squaredGLMM ในแพ็คเกจ MuMInซึ่งให้คำอธิบายวิธีการดังต่อไปนี้ R2R2R^2R2R2R^2RGLMM(m)2=σ2fσ2f+∑(σ2l)+σ2e+σ2dRGLMM(m)2=σf2σf2+∑(σl2)+σe2+σd2R_{GLMM}(m)^2 = \frac{σ_f^2}{σ_f^2 + …

1
พล็อตเพื่อแสดงผลลัพธ์ของโมเดลเอฟเฟกต์เชิงเส้นผสม
ฉันกำลังวิเคราะห์ข้อมูลบางอย่างโดยใช้การสร้างแบบจำลองเอฟเฟกต์แบบผสมเชิงเส้นในอาร์ฉันวางแผนที่จะสร้างโปสเตอร์ที่มีผลลัพธ์และฉันก็สงสัยว่าถ้าใครมีประสบการณ์กับโมเดลเอฟเฟกต์ผสมสามารถแนะนำแผนการที่จะใช้ แบบ ฉันกำลังคิดเกี่ยวกับพล็อตที่เหลือพล็อตของค่าติดตั้งกับค่าเดิม ฯลฯ ฉันรู้ว่าสิ่งนี้จะขึ้นอยู่กับข้อมูลของฉันเป็นอย่างมาก แต่ฉันแค่พยายามทำความเข้าใจถึงวิธีที่ดีที่สุดในการอธิบายผลลัพธ์ของตัวแบบผสมเอฟเฟกต์เชิงเส้น ฉันใช้แพ็คเกจ nlme ใน R ขอบคุณ

1
ช่วงความเชื่อมั่นในการทำนายสำหรับตัวแบบผสมที่ไม่ใช่เชิงเส้น (nlme)
ฉันต้องการได้รับช่วงความเชื่อมั่น 95% จากการทำนายของตัวแบบผสมnlmeแบบไม่เป็นเชิงเส้น ในขณะที่ไม่มีมาตรฐานใดให้ทำเช่นนี้ภายในnlmeฉันสงสัยว่ามันถูกต้องหรือไม่ที่จะใช้วิธีการของ "ช่วงการทำนายประชากร" ตามที่ระบุไว้ในบทหนังสือของ Ben Bolker ในบริบทของแบบจำลองที่เหมาะสมกับโอกาสสูงสุดตามแนวคิด resampling พารามิเตอร์ผลกระทบคงที่ตามเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมของแบบจำลองที่ติดตั้งใหม่, การจำลองการทำนายตามนี้แล้วนำ 95% เปอร์เซ็นไทล์ของการทำนายเหล่านี้เพื่อให้ได้ช่วงความมั่นใจ 95%? รหัสการทำเช่นนี้มีลักษณะดังนี้: (ฉันที่นี่ใช้ข้อมูล 'Loblolly' จากnlmeไฟล์ช่วยเหลือ) library(effects) library(nlme) library(MASS) fm1 <- nlme(height ~ SSasymp(age, Asym, R0, lrc), data = Loblolly, fixed = Asym + R0 + lrc ~ 1, random = Asym ~ 1, start …

2
ICC ตามความคาดหวังความสัมพันธ์ระหว่างหน่วยสุ่มสองหน่วยที่อยู่ในกลุ่มเดียวกัน
ในการสร้างแบบจำลองหลายระดับความสัมพันธ์ intraclass มักจะได้รับการคำนวณจากการสุ่มผลกระทบ ANOVA yij=γ00+uj+eijyij=γ00+uj+eij y_{ij} = \gamma_{00} + u_j + e_{ij} โดยที่เป็นค่าระดับ 2 และเป็นค่าระดับ 1 จากนั้นเราจะได้รับการประมาณและสำหรับความแปรปรวนของและตามลำดับและเสียบเข้ากับสมการต่อไปนี้:ujuju_jeijeije_{ij}σ^2uσ^u2\hat{\sigma}_u^2σ^2eσ^e2\hat{\sigma}_e^2ujuju_jeijeije_{ij} ρ=σ^2uσ^2u+σ^2eρ=σ^u2σ^u2+σ^e2 ρ = \frac{\hat{\sigma}_u^2}{\hat{\sigma}_u^2 +\hat{\sigma}_e^2} Hox (2002) เขียนบน p15ที่ ความสัมพันธ์ภายใน intraclass ρยังสามารถตีความได้ว่าเป็นความสัมพันธ์ที่คาดหวังระหว่างหน่วยสุ่มสองหน่วยที่อยู่ในกลุ่มเดียวกัน มีคำถามอยู่ที่นี่ซึ่งถามคำถามขั้นสูง (เพราะเหตุใดมันจึงมีค่าเท่ากับนี้แทนที่จะเท่ากับโดยประมาณ) และได้รับคำตอบขั้นสูง อย่างไรก็ตามฉันต้องการถามคำถามที่ง่ายกว่านี้มาก คำถาม:การพูดคุยเกี่ยวกับความสัมพันธ์ระหว่างหน่วยสุ่มสองหน่วยที่อยู่ในกลุ่มเดียวกันหมายความว่าอย่างไร ฉันมีความเข้าใจพื้นฐานเกี่ยวกับความจริงที่ว่าความสัมพันธ์ภายในอินทราเน็ตทำงานในกลุ่มและไม่ได้อยู่ในข้อมูลที่จับคู่ อย่างไรก็ตามฉันยังไม่เข้าใจว่าสามารถคำนวณความสัมพันธ์ได้อย่างไรหากเรามีหน่วยสุ่มสองกลุ่มจากกลุ่มเดียวกัน ถ้าฉันดูจุดแปลงในหน้า Wikipedia สำหรับ ICCเช่นเรามีหลายกลุ่มและหลายจุดภายในแต่ละกลุ่ม

1
เครื่องมือเพิ่มประสิทธิภาพ lme4 เริ่มต้นต้องการการวนซ้ำจำนวนมากสำหรับข้อมูลมิติสูง
TL; DR: lme4การเพิ่มประสิทธิภาพที่ดูเหมือนจะเป็นเชิงเส้นในจำนวนของพารามิเตอร์แบบโดยค่าเริ่มต้นและเป็นวิธีที่ช้ากว่าเทียบเท่าglmรุ่นด้วยตัวแปรดัมมี่สำหรับกลุ่ม มีอะไรที่ฉันสามารถทำได้เพื่อเร่งความเร็วหรือไม่ ฉันพยายามจัดวางโมเดล logit แบบลำดับชั้นที่ค่อนข้างใหญ่ (ประมาณ 50k แถว, 100 คอลัมน์, 50 กลุ่ม) การปรับโมเดล logit ปกติให้เข้ากับข้อมูล (ด้วยตัวแปรดัมมี่สำหรับกลุ่ม) ทำงานได้ดี แต่โมเดลลำดับชั้นดูเหมือนจะติดขัด: ขั้นตอนการปรับให้เหมาะสมครั้งแรกจะเสร็จสมบูรณ์ดี แต่ครั้งที่สองผ่านการทำซ้ำจำนวนมาก . แก้ไข:ฉันสงสัยว่าปัญหาส่วนใหญ่คือฉันมีพารามิเตอร์มากมายเพราะเมื่อฉันพยายามตั้งค่าmaxfnที่ต่ำกว่าจะให้คำเตือน: Warning message: In commonArgs(par, fn, control, environment()) : maxfun < 10 * length(par)^2 is not recommended. อย่างไรก็ตามการประมาณพารามิเตอร์ไม่ได้เปลี่ยนแปลงตลอดเวลาของการปรับให้เหมาะสมดังนั้นฉันยังคงสับสนเกี่ยวกับสิ่งที่ต้องทำ เมื่อฉันพยายามตั้งค่าmaxfnในตัวควบคุมเครื่องมือเพิ่มประสิทธิภาพ (แม้จะมีคำเตือน) ดูเหมือนว่าจะหยุดทำงานหลังจากการปรับให้เหมาะสมเสร็จแล้ว นี่คือรหัสบางส่วนที่สร้างปัญหาให้กับข้อมูลสุ่ม: library(lme4) set.seed(1) SIZE <- 50000 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.