คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

2
ฉันจะสร้างแบบจำลองการโต้ตอบระหว่างตัวแปรอธิบายได้อย่างไรเมื่อหนึ่งในนั้นอาจมีสมการกำลังสองและลูกบาศก์?
ฉันหวังเป็นอย่างยิ่งว่าฉันจะได้ใช้คำถามนี้ในลักษณะที่สามารถตอบได้อย่างชัดเจน - หากไม่ได้โปรดแจ้งให้เราทราบและฉันจะลองอีกครั้ง! ฉันควรเดาด้วยว่าฉันจะใช้ R สำหรับการวิเคราะห์เหล่านี้ ฉันมีหลายมาตรการplant performance (Ys)ที่ฉันสงสัยว่าได้รับอิทธิพลจากสี่รักษาผม imposed-- และflower thinning (X1), fertilization (X2), leaf clipping (X3) biased flower thinning (X4)สำหรับ Ys ที่เป็นไปได้ทั้งหมด N มีอย่างน้อย 242 ดังนั้นขนาดตัวอย่างของฉันจึงใหญ่ แผนการทั้งหมดถูกทำให้ผอมบางหรือไม่ แต่แต่ละแปลงก็ต้องมีหนึ่ง (และเพียงหนึ่ง) ของการรักษาอีกสาม (หรือไม่ - มีแผนการควบคุมด้วย) แนวคิดของการออกแบบนี้คือการทดสอบว่าอีกสามวิธีการรักษามีความสามารถในการ "กำบัง" หรือ "การเสริมสร้าง" ผลของการทำให้ผอมบาง ดังนั้นด้วยการออกแบบการรักษาทั้งสามหลัง (X2-X4) จึงไม่สามารถโต้ตอบกันได้เพราะพวกเขาไม่ได้ถูกข้าม แต่พวกเขาแต่ละคนสามารถโต้ตอบกับการทำให้ผอมบางของดอกไม้ - และพวกเขาอาจทำ สมมติฐานที่ชัดเจนของฉันคือ 1) การทำให้ผอมบางดอกจะมีนัยสำคัญและ 2) …

2
ค่า P สำหรับเงื่อนไขการโต้ตอบในโมเดลเอฟเฟกต์แบบผสมโดยใช้ lme4
ผมวิเคราะห์ข้อมูลพฤติกรรมบางอย่างที่ใช้lme4ในRส่วนใหญ่ต่อไปนี้บทเรียนที่ดีเยี่ยมในโบเดอฤดูหนาวแต่ผมไม่เข้าใจว่าถ้าฉันจัดการการโต้ตอบอย่างถูกต้อง ที่แย่ไปกว่านั้นไม่มีใครที่เกี่ยวข้องในการวิจัยนี้ใช้แบบจำลองต่าง ๆ ดังนั้นฉันจึงไม่ค่อยมั่นใจเมื่อต้องแน่ใจว่าสิ่งต่าง ๆ ถูกต้อง แทนที่จะส่งเสียงร้องเพื่อขอความช่วยเหลือฉันคิดว่าฉันควรใช้ความพยายามอย่างเต็มที่เพื่อตีความปัญหาแล้วขอการแก้ไขโดยรวมของคุณ อีกสองสามคนคือผู้ช่วยคนอื่น ๆ : ในขณะที่เขียนผมพบคำถามนี้แสดงให้เห็นว่าnlmeขึ้นโดยตรงให้ค่า P สำหรับคำปฏิสัมพันธ์ lme4แต่ฉันคิดว่ามันยังคงถูกต้องที่จะขอให้มีความสัมพันธ์กับ Livius'คำตอบสำหรับคำถามนี้ให้ลิงก์ไปยังการอ่านเพิ่มเติมจำนวนมากซึ่งฉันจะพยายามผ่านในอีกไม่กี่วันข้างหน้าดังนั้นฉันจะแสดงความคิดเห็นกับความคืบหน้าใด ๆ ที่เกิดขึ้น ในข้อมูลของฉันฉันมีตัวแปรขึ้นอยู่กับdvการconditionจัดการ (0 = ควบคุม 1 = สภาพการทดลองซึ่งจะส่งผลให้สูงขึ้นdv) และยังจำเป็นป้ายappropriate: ทดลองรหัส1สำหรับการนี้ควรจะแสดงผล แต่การทดลองรหัส0ยุทธ ไม่ใช่เพราะปัจจัยสำคัญขาดหายไป ฉันยังได้รวมการสกัดแบบสุ่มสองรายการสำหรับsubjectและเพื่อtargetสะท้อนถึงdvค่าที่สัมพันธ์กันในแต่ละวิชาและภายใน 14 ปัญหาที่แก้ไข (ผู้เข้าร่วมแต่ละคนแก้ไขทั้งตัวควบคุมและเวอร์ชันทดลองของปัญหาแต่ละข้อ) library(lme4) data = read.csv("data.csv") null_model = lmer(dv ~ (1 | subject) + (1 | target), data = data) …

2
โครงสร้างความแปรปรวนร่วม - ความแปรปรวนร่วมสำหรับผลสุ่มใน lme4
โครงสร้างความแปรปรวนร่วมแปรปรวนเริ่มต้นสำหรับผลแบบสุ่มในglmerหรือlmerในlme4แพคเกจคืออะไร? หนึ่งจะระบุโครงสร้างความแปรปรวนร่วมแปรปรวนอื่นสำหรับผลสุ่มในรหัสได้อย่างไร ฉันไม่พบข้อมูลใด ๆ เกี่ยวกับสิ่งนี้ในlme4เอกสารประกอบ

3
โมเดลผสมเชิงเส้นทั่วไป: การเลือกรูปแบบ
คำถาม / หัวข้อนี้เกิดขึ้นในการสนทนากับเพื่อนร่วมงานและฉันกำลังมองหาความคิดเห็นเกี่ยวกับเรื่องนี้: ฉันกำลังสร้างแบบจำลองข้อมูลบางอย่างโดยใช้การถดถอยโลจิสติกเอฟเฟกต์แบบสุ่มแม่นยำกว่าการถดถอยโลจิสติกแบบตัดขวางที่แม่นยำ สำหรับผลกระทบคงที่ฉันมี 9 ตัวแปรที่น่าสนใจและเข้ามาพิจารณา ฉันต้องการเลือกรูปแบบบางอย่างเพื่อค้นหาตัวแปรที่มีความสำคัญและให้รูปแบบ "ดีที่สุด" (เอฟเฟกต์หลักเท่านั้น) ความคิดแรกของฉันคือการใช้ AIC เพื่อเปรียบเทียบแบบจำลองที่แตกต่างกัน แต่ด้วย 9 ตัวแปรฉันไม่ตื่นเต้นเกินไปที่จะเปรียบเทียบ 2 ^ 9 = 512 รุ่นที่แตกต่างกัน (คำหลัก: การขุดลอกข้อมูล) ฉันพูดคุยเรื่องนี้กับเพื่อนร่วมงานและเขาบอกฉันว่าเขาจำได้ว่าอ่านเกี่ยวกับการใช้การเลือกแบบจำลองแบบขั้นตอน (หรือไปข้างหน้า) กับ GLMM แต่แทนที่จะใช้ p-value (เช่นจากการทดสอบอัตราส่วนความน่าจะเป็นสำหรับ GLMM) เราควรใช้ AIC เป็นเกณฑ์ในการเข้า / ออก ฉันพบความคิดนี้ที่น่าสนใจมาก แต่ฉันไม่พบการอ้างอิงใด ๆ ที่กล่าวถึงเรื่องนี้เพิ่มเติมและเพื่อนร่วมงานของฉันจำไม่ได้ว่าเขาอ่านที่ไหน หนังสือหลายเล่มแนะนำให้ใช้ AIC เพื่อเปรียบเทียบแบบจำลอง แต่ฉันไม่พบการสนทนาใด ๆ เกี่ยวกับการใช้สิ่งนี้พร้อมกับขั้นตอนการเลือกรุ่นแบบขั้นตอนหรือแบบส่งต่อ ดังนั้นฉันมีสองคำถามโดยทั่วไป: มีอะไรผิดปกติหรือไม่หากใช้ AIC …

2
AIC, ข้อผิดพลาด anova: โมเดลไม่ได้ติดตั้งทั้งหมดกับจำนวนการสังเกตเท่ากันทุกรุ่นไม่ได้พอดีกับชุดข้อมูลขนาดเดียวกันทั้งหมด
ฉันมีโมเดลเช่นนี้: require(nlme) set.seed(123) n <- 100 k <- 5 cat <- as.factor(rep(1:k, n)) cat_i <- 1:k # intercept per kategorie x <- rep(1:n, each = k) sigma <- 0.2 alpha <- 0.001 y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma) plot(x, y) m1 <- lm(y ~ x) …
10 r  mixed-model  aic 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
แบบจำลองเอฟเฟกต์แบบสุ่มที่จัดการความซ้ำซ้อน
ฉันกำลังพยายามจัดการกับการวิเคราะห์แบบเวลาต่อเหตุการณ์โดยใช้ผลลัพธ์ไบนารีซ้ำ ๆ สมมติว่าเวลาต่อเหตุการณ์ถูกวัดเป็นวัน แต่สำหรับช่วงเวลาที่เราแยกเวลาเป็นสัปดาห์ ฉันต้องการประมาณค่าประมาณของ Kaplan-Meier (แต่อนุญาตให้ covariates) โดยใช้ผลลัพธ์ไบนารีซ้ำ นี่จะดูเหมือนเป็นวงเวียนที่จะไป แต่ฉันกำลังสำรวจว่าสิ่งนี้ขยายไปสู่ผลลัพธ์ตามลำดับและเหตุการณ์ที่เกิดขึ้นซ้ำ ๆ หากคุณสร้างลำดับเลขฐานสองที่ดูเหมือนว่า 000 สำหรับคนที่ถูกเซ็นเซอร์ใน 3 สัปดาห์, 0000 สำหรับคนที่ถูกเซ็นเซอร์ที่ 4w และ 0000111111111111 .... สำหรับผู้ที่ล้มเหลวที่ 5w (1s ขยายไปถึงประเด็นที่เรื่องสุดท้ายเป็น ตามมาในการศึกษา) เมื่อคุณคำนวณสัดส่วนเฉพาะสัปดาห์ของ 1s คุณจะได้รับอุบัติการณ์สะสมตามปกติ (จนกว่าคุณจะได้รับเวลาตรวจสอบตัวแปรที่ซึ่งจะประมาณได้เฉพาะ แต่ไม่เท่ากับการประมาณอุบัติการณ์สะสมของ Kaplan-Meier) ฉันสามารถใส่การสังเกตแบบไบนารี่ซ้ำ ๆ กับแบบจำลองโลจิสติกไบนารีโดยใช้ GEE แทนที่จะทำให้เวลาไม่ต่อเนื่องเหมือนด้านบน แต่แทนที่จะใช้ spline ในเวลา ตัวประมาณความแปรปรวนร่วมของคลัสเตอร์แซนด์วิชทำงานได้ดีพอสมควร แต่ฉันต้องการได้ข้อสรุปที่แน่นอนมากขึ้นโดยใช้โมเดลเอฟเฟกต์แบบผสม ปัญหาคือว่า 1 หลังจาก 1 แรกซ้ำซ้อน ไม่มีใครรู้วิธีระบุเอฟเฟกต์แบบสุ่มหรือระบุรุ่นที่คำนึงถึงความซ้ำซ้อนเพื่อให้ข้อผิดพลาดมาตรฐานจะไม่ย่นหรือไม่ …

3
จะทำอย่างไรกับสหสัมพันธ์แบบสุ่มที่มีค่าเท่ากับ 1 หรือ -1
ไม่ใช่เรื่องแปลกที่เกิดขึ้นเมื่อต้องรับมือกับตัวแบบผสมที่ซับซ้อนสูงสุด (การประมาณค่าเอฟเฟกต์แบบสุ่มที่เป็นไปได้ทั้งหมดสำหรับข้อมูลและตัวแบบที่กำหนด) นั้นสมบูรณ์แบบ (+1 หรือ -1) หรือสัมพันธ์ที่สมบูรณ์แบบ สำหรับวัตถุประสงค์ของการสนทนาเรามาดูรูปแบบและสรุปแบบจำลองต่อไปนี้ Model: Y ~ X*Cond + (X*Cond|subj) # Y = logit variable # X = continuous variable # Condition = values A and B, dummy coded; the design is repeated # so all participants go through both Conditions # subject = random effects …

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
วิธีที่ดีที่สุดในการประเมินผลการรักษาโดยเฉลี่ยในการศึกษาระยะยาวคืออะไร?
ในการศึกษาระยะยาวผลลัพธ์ของหน่วยที่ถูกวัดซ้ำ ๆ ณ จุดเวลาโดยมีโอกาสในการวัดคงที่ทั้งหมด (คงที่ = วัดที่หน่วยในเวลาเดียวกัน)YฉันทีYผมเสื้อY_{it}ผมผมiเสื้อเสื้อtม.ม.m หน่วยที่ได้รับมอบหมายสุ่มทั้งการรักษา,หรือกลุ่มควบคุม, 0 ฉันต้องการประเมินและทดสอบผลการรักษาโดยเฉลี่ยเช่นที่ความคาดหวังนั้นเกิดขึ้นข้ามเวลาและส่วนบุคคล ฉันพิจารณาใช้แบบจำลองหลายระดับ (เอฟเฟกต์ผสม) ในโอกาสคงที่เพื่อวัตถุประสงค์นี้G = 1G=1G=1G = 0G=0G=0TE= E( Y| G=1)-E( Y| G=0),ATE=E(Y|G=1)-E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yฉันที= α + βGผม+ยู0 ฉัน+อีฉันทีYผมเสื้อ=α+βGผม+ยู0ผม+อีผมเสื้อY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} ด้วย the intercept the ,จะถูกสกัดกั้นแบบสุ่มทั่วทั้งหน่วยและส่วนที่เหลือαα\alphaββ\betaTEATEATEยูยูuอีอีe ตอนนี้ฉันกำลังพิจารณารูปแบบทางเลือก Yฉันที=β~Gผม+Σj = …

1
การทดสอบ anova type III สำหรับ GLMM
ฉันเหมาะสมกับglmerโมเดลในlme4แพ็กเกจ R ฉันกำลังมองหาตารางโนวาที่มีค่า p แสดงอยู่ในนั้น แต่ฉันไม่สามารถหาแพ็คเกจที่เหมาะกับมันได้ เป็นไปได้ไหมที่จะทำใน R? แบบจำลองที่ฉันเหมาะสมอยู่ในรูปแบบ: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))

1
ทำไมการแนะนำของเอฟเฟกต์ความชันแบบสุ่มทำให้ SE ของความชันเพิ่มขึ้น
ฉันพยายามวิเคราะห์ผลกระทบของปีต่อตัวแปร logInd สำหรับกลุ่มบุคคลโดยเฉพาะ (ฉันมี 3 กลุ่ม) โมเดลที่ง่ายที่สุด: > fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata) > summary(fix1) Call: lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata) Residuals: Min 1Q Median 3Q Max -5.5835 -0.3543 -0.0024 0.3944 4.7294 Coefficients: Estimate Std. Error …

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
ติดตั้งโมเดลพัวซอง GLM ผสมกับความชันและจุดตัดแบบสุ่ม
ขณะนี้ฉันกำลังทำงานกับแบบจำลองอนุกรมเวลาของปัวซองที่พยายามประเมินผลของการเปลี่ยนแปลงวิธีการนับจำนวนที่ได้รับ (เปลี่ยนจากการทดสอบการวินิจฉัยหนึ่งไปสู่อีกการทดสอบหนึ่ง) ในขณะที่ควบคุมแนวโน้มอื่น ๆ ในช่วงเวลาหนึ่ง อุบัติการณ์ของโรค) ฉันมีข้อมูลสำหรับไซต์ต่าง ๆ จำนวนมาก ในขณะที่ฉันกำลังซ่อมบำรุงเกมด้วยเช่นกันฉันพอดีกับ GLM พื้นฐานที่เหมาะสมกับแนวโน้มเวลาในพวกเขาจากนั้นจึงรวมผลลัพธ์ รหัสสำหรับสิ่งนี้จะมีลักษณะเช่นนี้ใน SAS: PROC GENMOD data=work.data descending; model counts = dependent_variable time time*time / link=log dist = poisson; run; หรือนี่ใน R: glm(counts ~ dependent_variable + time + time*time, family="poisson") จากนั้นนำค่าประมาณเหล่านั้นมารวมกันในหลาย ๆ ไซต์ มันก็ถูกแนะนำด้วยว่าให้ฉันลองใช้แบบจำลองปัวซองผสมกับความชันแบบสุ่มและจุดตัดสำหรับแต่ละไซต์แทนที่จะรวมกัน ดังนั้นโดยพื้นฐานแล้วคุณต้องมีเอฟเฟกต์คงที่ของ dependent_variable จากนั้นจะมีเอฟเฟกต์แบบสุ่มสำหรับการสกัดกั้นและเวลา (หรือเวลาและเวลาที่ดีเลิศ ^ 2 …

1
รูปแบบใดสำหรับชุดข้อมูลที่ท้าทาย (ซีรีย์หลายร้อยครั้งพร้อมการซ้อนจำนวนมาก)
ฉันมีชุดข้อมูลที่ค่อนข้างซับซ้อนในการวิเคราะห์และฉันไม่สามารถหาวิธีแก้ปัญหาที่ดีได้ นี่คือสิ่งที่: 1.ข้อมูลดิบเป็นแมลงบันทึกเพลงเป็นหลัก เพลงแต่ละเพลงทำจากระเบิดหลายครั้งและแต่ละเพลงทำจากชุดย่อย บุคคลทั้งหมดได้รับการบันทึกเป็นเวลา 5 นาที จำนวนระเบิดและตำแหน่งในการบันทึกอาจแตกต่างกันมากระหว่างบุคคลเช่นเดียวกับจำนวนหน่วยย่อยต่อการระเบิด 2.ฉันมีความถี่ผู้ให้บริการ (ความถี่พื้นฐาน) ของแต่ละหน่วยย่อยและนั่นคือสิ่งที่ฉันต้องการวิเคราะห์ ปัญหาของฉัน: 1.ความถี่ภายในการระเบิดไม่ชัดเจน (แม้ว่าจะค่อนข้างเสถียร แต่ความถี่ของหน่วยย่อย n-1 จะมีผลกับหน่วยย่อย n) 2.การระเบิดยังไม่ขึ้นอยู่กับการบันทึก 3.พวกเขามีความอิสระน้อยลงเมื่อความถี่ลดลงตามเวลา (แต่ละคนเบื่อที่จะร้องเพลงดังนั้นความถี่ของเพลงจึงลดลงและลดลง) หยดดูเหมือนจะเป็นเส้นตรง 4. การทำรัง = ฉันมีประชากรซ้ำกัน 3 แห่งสำหรับสองแห่งคือ A และ B ดังนั้นฉันจึงมี A1, A2, A3 และ B1, B2, B3 สิ่งที่ฉันต้องการจะทำ: 1.อธิบายความแตกต่างของความถี่ระหว่างสถานที่สองแห่งของฉัน (ทดสอบทางสถิติ) 2.ระบุความถี่ที่ลดลงระหว่างสองตำแหน่ง (ดูว่ามันลดลงเร็วกว่าหนึ่งในนั้นหรือไม่) ทำอย่างไร: นั่นคือเหตุผลที่ฉันต้องการความช่วยเหลือ: ฉันไม่รู้ ดูเหมือนว่ากรณีของฉันรวมปัญหาที่มักไม่เห็นด้วยกัน ฉันได้อ่านเกี่ยวกับโมเดลผสม, เกี่ยวกับ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.