คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
ในโมเดลหลายระดับความหมายเชิงปฏิบัติของการประเมินเปรียบเทียบกับพารามิเตอร์สหสัมพันธ์แบบสุ่มที่ไม่ประมาณค่าคืออะไร
ในโมเดลหลายระดับสิ่งที่เกี่ยวข้องกับการตีความและการตีความของการประมาณค่ากับความสัมพันธ์ของผลกระทบแบบสุ่มที่ไม่ประมาณค่าคืออะไร เหตุผลในทางปฏิบัติสำหรับการถามสิ่งนี้คือในกรอบ lmer ใน R ไม่มีวิธีการดำเนินการสำหรับการประเมินค่า p ผ่านเทคนิค MCMC เมื่อมีการประมาณการในรูปแบบของความสัมพันธ์ระหว่างพารามิเตอร์ ตัวอย่างเช่นเมื่อดูตัวอย่างนี้ (ส่วนที่ยกมาด้านล่าง) อะไรคือความหมายเชิงปฏิบัติของ M2 กับ M3 เห็นได้ชัดว่าในกรณีหนึ่ง P5 จะไม่ถูกประมาณและอีกอันจะเป็นเช่นนั้น คำถาม ด้วยเหตุผลเชิงปฏิบัติ (ความปรารถนาที่จะได้รับค่า p ผ่านเทคนิค MCMC) เราอาจต้องการแบบจำลองที่ไม่มีความสัมพันธ์ระหว่างเอฟเฟกต์แบบสุ่มแม้ว่า P5 นั้นจะไม่ใช่ศูนย์ก็ตาม หากมีสิ่งนี้แล้วประมาณค่า p ผ่านเทคนิค MCMC ผลลัพธ์ที่ตีความได้คืออะไร? (ฉันรู้ @ Ben Bolker ได้กล่าวถึงก่อนหน้านี้ว่า"การรวมการทดสอบอย่างมีนัยสำคัญกับ MCMC เป็นไม่ต่อเนื่องกันนิด ๆ หน่อย ๆ สถิติแม้ว่าผมเข้าใจกระตุ้นที่จะทำเช่นนั้น (รับช่วงความเชื่อมั่นเป็นที่ค้ำเพิ่มเติม)"ดังนั้นถ้ามันจะทำให้คุณนอนหลับดีขึ้น ในตอนกลางคืนแกล้งทำเป็นว่าฉันมั่นใจช่วงเวลา) หากไม่สามารถประมาณ P5 นั่นคือสิ่งเดียวกันกับที่ยืนยันว่าเป็น 0 …

5
ตัวอย่างรายงานการวิเคราะห์แบบผสมโดยใช้ lmer ในชีววิทยาจิตวิทยาและการแพทย์?
เนื่องจากฉันทามติทั่วไปดูเหมือนว่าจะใช้ตัวแบบผสมผ่านทางlmer()ใน R แทน ANOVA แบบคลาสสิก (ด้วยเหตุผลที่อ้างถึงบ่อยครั้งเช่นการออกแบบที่ไม่สมดุลการข้ามเอฟเฟกต์แบบสุ่มเป็นต้น) ฉันต้องการลองกับข้อมูลของฉัน อย่างไรก็ตามฉันกังวลว่าฉันจะสามารถ "ขาย" วิธีการนี้ให้กับหัวหน้างานของฉัน (ซึ่งคาดว่าการวิเคราะห์แบบดั้งเดิมด้วยค่า p ในท้ายที่สุด) หรือในภายหลังกับผู้ตรวจสอบ คุณสามารถแนะนำตัวอย่างที่ดีของบทความที่ตีพิมพ์ที่ใช้แบบจำลองผสมหรือlmer()สำหรับการออกแบบที่แตกต่างกันเช่นมาตรการซ้ำ ๆ หรือหลายแบบภายในและระหว่างเรื่องสำหรับชีววิทยาภาคสนามจิตวิทยาการแพทย์

1
ทำนาย () ฟังก์ชั่นสำหรับ lmer Mixed Effects Models
ปัญหา: ฉันได้อ่านในโพสต์อื่น ๆซึ่งpredictไม่สามารถใช้ได้กับเอ็ฟเฟ็กต์แบบผสมlmer{lme4} ใน [R] ฉันพยายามสำรวจเรื่องนี้ด้วยชุดของเล่น ... พื้นหลัง: ชุดข้อมูลถูกดัดแปลงจากแหล่งที่มานี้และมีให้ในรูปแบบ ... require(gsheet) data <- read.csv(text = gsheet2text('https://docs.google.com/spreadsheets/d/1QgtDcGJebyfW7TJsB8n6rAmsyAnlz1xkT3RuPFICTdk/edit?usp=sharing', format ='csv')) นี่คือแถวและส่วนหัวแรก: > head(data) Subject Auditorium Education Time Emotion Caffeine Recall 1 Jim A HS 0 Negative 95 125.80 2 Jim A HS 0 Neutral 86 123.60 3 Jim A HS 0 Positive …

1
ความแตกต่างระหว่างสมการการประมาณทั่วไปกับ GLMM คืออะไร
ฉันใช้ GEE กับข้อมูลที่ไม่สมดุล 3 ระดับโดยใช้ลิงก์ logit สิ่งนี้แตกต่างกันอย่างไร (ในแง่ของข้อสรุปที่ฉันสามารถวาดและความหมายของสัมประสิทธิ์) จาก GLM ที่มีเอฟเฟกต์ผสม (GLMM) และลิงก์ logit ได้อย่างไร รายละเอียดเพิ่มเติม: ข้อสังเกตคือการทดลอง bernoulli เดี่ยว พวกเขาถูกจัดกลุ่มเป็นห้องเรียนและโรงเรียน ใช้การละเว้น R. Casewise ของ NAs 6 ทำนายยังมีเงื่อนไขการโต้ตอบ (ฉันไม่พลิกเด็ก ๆ เพื่อดูว่าพวกเขาขึ้นหัว) ฉันอยากจะอธิบายค่าสัมประสิทธิ์ของอัตราต่อรอง สิ่งนี้มีความหมายเหมือนกันทั้งสองอย่างหรือไม่? มีบางสิ่งที่ซุ่มซ่อนอยู่ในใจของฉันเกี่ยวกับ "ความหมายส่วนเพิ่ม" ในรุ่น GEE ฉันต้องการบิตนั้นอธิบายให้ฉัน ขอบคุณ

3
ฉันจะตีความ 'ความสัมพันธ์ของเอฟเฟกต์คงที่' ในผลลัพธ์ของ Glmer ได้อย่างไร
ฉันมีผลลัพธ์ต่อไปนี้: Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) AIC BIC logLik deviance 4062 4093 -2022 4044 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) 0.82453 0.90804 Number of obs: 239, groups: landscape, 45 Fixed effects: Estimate Std. Error …

7
จำนวนกลุ่มขั้นต่ำที่แนะนำสำหรับปัจจัยสุ่มคือเท่าใด
ฉันกำลังใช้โมเดลผสมในR( lme4) เพื่อวิเคราะห์ข้อมูลการวัดซ้ำหลายครั้ง ฉันมีตัวแปรตอบสนอง (เนื้อหาเส้นใยของอุจจาระ) และ 3 ผลกระทบคงที่ (มวลกาย ฯลฯ ) การศึกษาของฉันมีผู้เข้าร่วม 6 คนโดยวัดซ้ำ 16 ครั้งสำหรับแต่ละคน (แม้ว่าสองคนมีเพียง 12 ครั้งเท่านั้น) อาสาสมัครเป็นกิ้งก่าที่ได้รับการผสมผสานอาหารที่แตกต่างกันใน 'การรักษา' ที่แตกต่างกัน คำถามของฉันคือ: ฉันสามารถใช้หัวเรื่องเป็นเอฟเฟกต์แบบสุ่มได้หรือไม่ ฉันรู้ว่านี่เป็นวิธีการปฏิบัติตามปกติในโมเดลเอฟเฟกต์ผสมตามยาวเพื่อพิจารณาลักษณะของกลุ่มตัวอย่างแบบสุ่มและความจริงที่ว่าการสังเกตในกลุ่มตัวอย่างนั้นมีความสัมพันธ์กันอย่างใกล้ชิดกว่ากลุ่มที่อยู่ระหว่างกลุ่ม แต่การรักษา ID หัวเรื่องเป็นผลแบบสุ่มนั้นเกี่ยวข้องกับการประเมินค่าเฉลี่ยและความแปรปรวนสำหรับตัวแปรนี้ เนื่องจากฉันมีเพียง 6 วิชา (6 ระดับของปัจจัยนี้) นี่เพียงพอที่จะทำให้ได้ลักษณะที่ถูกต้องของค่าเฉลี่ยและความแปรปรวนหรือไม่? ความจริงที่ว่าฉันมีการวัดซ้ำหลายครั้งสำหรับความช่วยเหลือในแต่ละเรื่องในเรื่องนี้ (ฉันไม่เห็นว่ามันสำคัญ) ท้ายที่สุดถ้าฉันไม่สามารถใช้ subject ID เป็นเอฟเฟกต์แบบสุ่มได้การรวมไว้เป็นเอฟเฟกต์แบบคงที่จะช่วยให้ฉันสามารถควบคุมความจริงที่ว่าฉันมีมาตรการซ้ำแล้วซ้ำอีกหรือไม่ แก้ไข:ฉันแค่ต้องการชี้แจงว่าเมื่อฉันพูดว่า "ฉันสามารถ" ใช้หัวเรื่อง ID เป็นเอฟเฟกต์แบบสุ่มได้ฉันหมายถึง "เป็นความคิดที่ดีหรือไม่" ฉันรู้ว่าฉันสามารถจัดวางโมเดลด้วยปัจจัยที่มีเพียง 2 ระดับ แต่แน่นอนว่านี่จะป้องกันได้หรือไม่ …

2
ฉันระบุโมเดลของฉันอย่างถูกต้องหรือไม่?
ฉันได้กำจัดเว็บไซต์ช่วยเหลือจำนวนมากและยังคงสับสนเกี่ยวกับวิธีระบุคำซ้อนที่ซับซ้อนมากขึ้นในรูปแบบผสมเช่นกัน นอกจากนี้ผมยังสับสนกับการใช้งานของ:และ/และ|ในการระบุการมีปฏิสัมพันธ์และทำรังที่มีปัจจัยสุ่มใช้lmer()ในแพคเกจในlme4R สำหรับจุดประสงค์ของคำถามนี้สมมติว่าฉันได้แสดงข้อมูลของฉันอย่างถูกต้องด้วยโมเดลสถิติมาตรฐานนี้: ได้รับการแก้ไขและเป็นแบบสุ่ม เป็น (โดยปริยาย) ซ้อนกันภายในYฉันj k= u + สถานีผม+ พ่วงj ( i )+ วันk+ ( สถานี× วัน)ฉันk+ ( พ่วง× วัน)j ( i ) kYผมJk=ยู+สถานีผม+พ่วงJ(ผม)+วันk+(สถานี×วัน)ผมk+(พ่วง×วัน)J(ผม)k Y_{ijk} = u + \text{station}_i + \text{tow}_{j(i)} + \text{day}_k + (\text{station}\times \text{day})_{ik} + (\text{tow}\times\text{day})_{j(i)k} stationtowdayTowstation ฉันหวังว่าแบบจำลองของฉันจะรวม Station (i, fixed), Tow (j, random, ซ้อนกันโดยนัยภายใน Station), …

5
ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร
ฉันพบมากบนอินเทอร์เน็ตเกี่ยวกับการตีความแบบสุ่มและแบบคงที่ อย่างไรก็ตามฉันไม่สามารถดึงแหล่งที่มาได้ดังต่อไปนี้: ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร โดยที่ฉันหมายถึงสูตรทางคณิตศาสตร์ของแบบจำลองและวิธีการประมาณค่าพารามิเตอร์

1
เมื่อใดที่โมเดลเชิงผสมแบบ zero-correlation จะได้ยินทฤษฎี
ใบเสนอราคาบล็อกด้านล่างจากผู้นำในฟิลด์ของการสร้างแบบจำลองเอฟเฟกต์แบบผสมอ้างว่าประสานงานการเปลี่ยนแปลงในแบบจำลองโดยไม่มีสหสัมพันธ์ระหว่างผลแบบสุ่ม (โมเดล 'ZCP') เปลี่ยนการทำนายแบบจำลอง แต่ใครบางคนสามารถอธิบายรายละเอียดเพิ่มเติมหรือปรับการเรียกร้องของพวกเขา? งบในคำถามจากเบตส์ et al, ของ 2015 กระดาษlme4, ฟิตติ้งเชิงเส้นผสมผลกระทบรุ่นใช้ lme4 , หน้า 7 วรรคสอง ( ลิงค์ดาวน์โหลด ) \newcommand{\slope}{\text{slope}} \newcommand{\int}{\text{int}} \newcommand{\intercept}{\text{intercept}} นี่คือการถอดความสิ่งที่พวกเขาเขียน: แม้ว่าตัวแบบพารามิเตอร์ความสัมพันธ์แบบศูนย์จะใช้ในการลดความซับซ้อนของแบบจำลองความชันแบบสุ่ม แบบจำลองที่ความลาดชันและจุดตัดขวางได้รับอนุญาตให้มีความสัมพันธ์ที่ไม่เป็นศูนย์นั้นไม่แปรเปลี่ยนไปจากการเปลี่ยนแปลงแบบเสริมของตัวทำนายอย่างต่อเนื่อง ความไม่แปรเปลี่ยนนี้จะหยุดลงเมื่อความสัมพันธ์ถูก จำกัด ให้เป็นศูนย์ การเปลี่ยนแปลงใด ๆ ในตัวทำนายจะจำเป็นต้องนำไปสู่การเปลี่ยนแปลงในความสัมพันธ์โดยประมาณและในโอกาสและการทำนายของแบบจำลอง 1ตัวอย่างเช่นเราสามารถขจัดความสัมพันธ์ในFM1เพียงโดยการขยับวัน [ทำนายที่มาพร้อมกับslopeslope\slope ] ตามจำนวนเงินที่เท่ากับอัตราส่วนของประมาณการหมู่-เรื่องค่าเบี่ยงเบนมาตรฐานคูณด้วยความสัมพันธ์โดยประมาณคือ2 , ρslope:intercept×σslopeσinterceptρslope:intercept×σslopeσintercept\rho_{\slope:\intercept}\times\frac{\sigma_{\slope}}{\sigma_{\intercept}} การใช้แบบจำลองดังกล่าวควรถูก จำกัด ในกรณีที่ตัวทำนายถูกวัดในอัตราส่วนสเกล (กล่าวคือจุดศูนย์บนสเกลนั้นมีความหมายไม่ใช่เฉพาะตำแหน่งที่กำหนดโดยความสะดวกสบายหรือแบบแผน) คำถาม: หมายเลขตามตัวยกด้านบน ... ฉันสามารถเห็นได้ว่าการเปลี่ยนแปลงใด ๆ ในระบบพิกัดซึ่งตัวทำนายถูกวัดจะนำไปสู่การเปลี่ยนแปลงของความสัมพันธ์โดยประมาณซึ่งนำไปสู่ความสัมพันธ์ที่ไม่เป็นศูนย์ สิ่งนี้สนับสนุนคำแถลงว่าแบบจำลองพารามิเตอร์ศูนย์ความสัมพันธ์ไม่คงที่ภายใต้การเปลี่ยนแปลงในระบบพิกัดทำนายและดังนั้นรูปแบบใด ๆ …

2
การประมาณ Satterthwaite vs. Kenward-Roger สำหรับองศาอิสระในโมเดลผสม
lmerTestแพคเกจให้anova()ฟังก์ชั่นหลากหลายรูปแบบเชิงเส้นที่มีตัวเลือกประมาณ Satterthwaite ของ (เริ่มต้น) หรือ Kenward-Roger ขององศาอิสระ (DF) ความแตกต่างระหว่างสองแนวทางนี้คืออะไร? เลือกได้เมื่อใด

5
วิธีการทดสอบและหลีกเลี่ยงความหลากสีในโมเดลเชิงเส้นผสม?
ฉันกำลังใช้โมเดลเชิงเส้นเชิงเส้นผสม ฉันใช้แพ็คเกจ "lme4" ใน R แบบจำลองของฉันอยู่ในรูปแบบ: model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) ก่อนใช้แบบจำลองของฉันฉันตรวจสอบความเป็นไปได้หลายทางระหว่างตัวทำนาย ฉันทำสิ่งนี้โดย: ทำดาต้าเฟรมของเครื่องทำนาย dummy_df <- data.frame(predictor1, predictor2) ใช้ฟังก์ชัน "cor" เพื่อคำนวณความสัมพันธ์ของ Pearson ระหว่างตัวทำนาย correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2) หาก "correl_dummy_df" มากกว่า 0.80 แล้วฉันตัดสินใจว่าตัวทำนาย 1 และทำนาย 2 มีความสัมพันธ์สูงเกินไปและไม่รวมอยู่ในแบบจำลองของฉัน ในการอ่านหนังสือบางส่วนจะมีวิธีที่เป็นไปได้มากกว่าในการตรวจสอบความหลากหลายของสี ใครมีคำแนะนำเกี่ยวกับเรื่องนี้หรือไม่? "Variance Inflation …

4
การตรวจสอบสมมติฐาน lmer / lme แบบผสมใน R
ฉันวิ่งออกแบบซ้ำโดยที่ฉันทดสอบชาย 30 คนและหญิง 30 คนในภารกิจที่แตกต่างกันสามงาน ฉันต้องการที่จะเข้าใจว่าพฤติกรรมของชายและหญิงนั้นแตกต่างกันอย่างไรและขึ้นอยู่กับงานนั้นอย่างไร ฉันใช้ทั้งแพคเกจ lmer และ lme4 เพื่อตรวจสอบเรื่องนี้อย่างไรก็ตามฉันพยายามตรวจสอบสมมติฐานของทั้งสองวิธี รหัสที่ฉันเรียกใช้คือ lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat) lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat) ฉันตรวจสอบว่าการโต้ตอบเป็นแบบจำลองที่ดีที่สุดโดยเปรียบเทียบกับแบบจำลองที่ง่ายกว่าโดยไม่มีการโต้ตอบและเรียกใช้ anova หรือไม่: lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat) lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat) …

2
แบบผสมมีประโยชน์เหมือนแบบจำลองทำนายหรือไม่
ฉันสับสนเล็กน้อยเกี่ยวกับข้อดีของแบบจำลองผสมในเรื่องการสร้างแบบจำลองการทำนาย เนื่องจากแบบจำลองการทำนายมักจะหมายถึงการคาดการณ์ค่าของการสังเกตที่ไม่ทราบมาก่อนหน้านี้ดูเหมือนว่าชัดเจนว่าวิธีเดียวที่แบบจำลองผสมอาจมีประโยชน์ก็คือความสามารถในการทำนายระดับประชากร (นั่นคือไม่เพิ่มผลกระทบแบบสุ่ม) อย่างไรก็ตามปัญหาคือในประสบการณ์ของฉันการคาดการณ์ระดับประชากรที่ใช้แบบจำลองแบบผสมนั้นแย่กว่าการคาดการณ์ตามแบบจำลองการถดถอยมาตรฐานที่มีผลกระทบคงที่เท่านั้น ดังนั้นโมเดลของแบบผสมที่เกี่ยวข้องกับปัญหาการทำนายคืออะไร แก้ไข ปัญหามีดังต่อไปนี้: ฉันติดตั้งโมเดลผสม (ทั้งเอฟเฟกต์คงที่และสุ่ม) และโมเดลเชิงเส้นมาตรฐานที่มีเอฟเฟกต์คงที่เท่านั้น เมื่อฉันทำการตรวจสอบข้ามฉันได้รับลำดับชั้นของความแม่นยำในการทำนายต่อไปนี้: 1) แบบจำลองผสมเมื่อทำนายโดยใช้เอฟเฟกต์แบบคงที่และแบบสุ่ม (แต่งานนี้แน่นอนสำหรับการสังเกตด้วยระดับเอฟเฟ็กต์ตัวแปรแบบสุ่มเท่านั้น) เหมาะสำหรับแอปพลิเคชั่นทำนายผลจริง!); 2) โมเดลเชิงเส้นมาตรฐาน 3) รูปแบบผสมเมื่อใช้การคาดคะเนระดับประชากร (เพื่อให้มีเอฟเฟกต์แบบสุ่มโยนออกมา) ดังนั้นความแตกต่างเพียงอย่างเดียวระหว่างแบบจำลองเชิงเส้นมาตรฐานและแบบจำลองผสมจึงมีค่าที่แตกต่างกันของค่าสัมประสิทธิ์เนื่องจากวิธีการประมาณค่าที่แตกต่างกัน (เช่นมีผลกระทบ / ตัวทำนายแบบเดียวกันในทั้งสองแบบ แต่มีสัมประสิทธิ์สัมพันธ์ต่างกัน) ดังนั้นความสับสนของฉันจึงเพิ่มขึ้นเป็นคำถามทำไมฉันถึงเคยใช้แบบจำลองผสมเป็นแบบจำลองการทำนายเนื่องจากการใช้แบบจำลองผสมเพื่อสร้างการทำนายระดับประชากรดูเหมือนว่าเป็นกลยุทธ์ที่ด้อยกว่าเมื่อเทียบกับแบบจำลองเชิงเส้นมาตรฐาน

5
ข้อดีของการรักษาแบบสุ่มในแบบผสมคืออะไร
ฉันมีปัญหาในการใช้ประโยชน์จากการติดฉลากแบบจำลองด้วยเหตุผลแบบสุ่มด้วยเหตุผลบางประการ สำหรับฉันดูเหมือนว่าในเกือบทุกกรณีทางออกที่ดีที่สุดคือการรักษาปัจจัยทั้งหมดตามที่ได้รับการแก้ไข ครั้งแรกความแตกต่างของการจับคู่เทียบกับการสุ่มค่อนข้างสุ่ม คำอธิบายมาตรฐานคือหากมีใครสนใจในหน่วยทดลองเฉพาะต่อหนึ่งคนก็ควรใช้เอฟเฟกต์คงที่และหากใครสนใจประชากรที่เป็นตัวแทนของหน่วยทดลองก็ควรใช้เอฟเฟกต์แบบสุ่ม สิ่งนี้ไม่ได้ช่วยอะไรมากเพราะมันบอกเป็นนัย ๆ ว่าสามารถสลับกันระหว่างมุมมองแบบคงที่และแบบสุ่มแม้ว่าข้อมูลและการออกแบบการทดลองยังคงเหมือนเดิม นอกจากนี้คำจำกัดความนี้ส่งเสริมภาพลวงตาว่าหากปัจจัยถูกระบุว่าเป็นแบบสุ่มการอนุมานที่ดึงมาจากตัวแบบนั้นมีความเหมาะสมกับประชากรมากกว่าในกรณีที่ตัวประกอบถูกระบุว่าเป็นแบบคงที่ ในที่สุดGelman แสดงให้เห็นว่าความแตกต่างแบบสุ่มคงที่ทำให้เกิดความสับสน แม้ในระดับคำจำกัดความเนื่องจากมีคำจำกัดความเพิ่มเติมอีกสี่คำของเอฟเฟกต์แบบคงที่และแบบสุ่ม ประการที่สองการประมาณค่าของตัวแบบผสมค่อนข้างซับซ้อน ซึ่งแตกต่างจากโมเดล "คงที่หมดจด" มีมากกว่าสองสามวิธีในการรับค่า p ศาสตราจารย์ Prof. Bates ที่ใช้การประมาณค่า REML ในแพ็คเกจ lme4 ใน R ไปไกลจนปฏิเสธที่จะรายงานค่า p ทั้งหมด . ประการที่สามมีปัญหาที่มืดของจำนวนพารามิเตอร์โดยนัยที่นำมาใช้โดยปัจจัยสุ่ม ตัวอย่างต่อไปนี้คือการปรับตัวของฉันที่อยู่ในอัม & Anderson, รุ่นการคัดเลือกและมีหลายรุ่นอนุมาน: วิธีการข้อมูลตามทฤษฎีปฏิบัติ จากมุมมองการแลกเปลี่ยนความแปรปรวนแบบอคติบทบาทของเอฟเฟกต์แบบสุ่มสามารถแสดงได้ดังนี้ พิจารณาการวิเคราะห์ความแปรปรวนแบบทางเดียวกับรีทเม้นต์และKปัจจัยหลักซึ่งK - 1สามารถประมาณได้ คำผิดพลาดมีN ( 0 , σ 2 )เพิ่มขึ้น สมมติว่าเราบอกว่าKผลกระทบหลักมาจากN (KKKKKKK−1K−1K - 1N(0,σ2)N(0,σ2)\mathcal …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.