คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

2
เหตุใด lme และ aov จึงให้ผลลัพธ์ที่แตกต่างกันสำหรับมาตรการ ANOVA ใน R ซ้ำ ๆ
ฉันกำลังพยายามเปลี่ยนจากการใช้ezแพคเกจเป็นlmeมาตรการ ANOVA ซ้ำ ๆ (เพราะฉันหวังว่าฉันจะสามารถใช้ความแตกต่างที่กำหนดเองได้ด้วยlme) ตามคำแนะนำจากบล็อกนี้โพสต์ก็สามารถที่จะตั้งค่ารูปแบบเดียวกันโดยใช้ทั้งaov(เช่นเดียวกับezเมื่อมีการร้องขอ) lmeและ อย่างไรก็ตามในตัวอย่างที่ให้ไว้ในโพสต์ค่าFเห็นด้วยอย่างสมบูรณ์ระหว่างaovและlme(ฉันตรวจสอบและพวกเขาทำ) นี่ไม่ใช่กรณีของข้อมูลของฉัน ถึงแม้ว่าค่าFจะใกล้เคียงกัน แต่ก็ไม่เหมือนกัน aovส่งคืนค่า f ที่ 1.3399, lmeส่งคืน 1.36264 ฉันยินดีที่จะยอมรับaovผลลัพธ์ว่า "ถูกต้อง" เนื่องจากนี่คือสิ่งที่ SPSS ส่งคืน (และนี่คือสิ่งที่นับให้กับฟิลด์ / หัวหน้างานของฉัน) คำถาม: มันจะดีถ้ามีคนอธิบายได้ว่าทำไมความแตกต่างนี้จึงมีอยู่และฉันจะใช้lmeเพื่อให้ผลลัพธ์ที่น่าเชื่อถือ (ฉันก็ยินดีที่จะใช้lmerแทนlmeสิ่งประเภทนี้ถ้ามันให้ผลลัพธ์ "ถูกต้อง" อย่างไรก็ตามฉันยังไม่ได้ใช้จนถึงตอนนี้) หลังจากแก้ปัญหานี้แล้วฉันต้องการเรียกใช้การวิเคราะห์ความเปรียบต่าง โดยเฉพาะฉันจะสนใจความแตกต่างของการรวมสองระดับแรกของปัจจัย (เช่นc("MP", "MT")) และเปรียบเทียบสิ่งนี้กับระดับที่สามของปัจจัย (เช่น"AC") นอกจากนี้การทดสอบระดับที่สามกับระดับที่สี่ของปัจจัย (เช่น"AC"กับ"DA") ข้อมูล: tau.base <- structure(list(id = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 7L, …

2
มันสมเหตุสมผลหรือไม่ที่เอฟเฟกต์คงที่จะถูกซ้อนภายในแบบสุ่มหรือวิธีการกำหนดมาตรการซ้ำ ๆ ใน R (aov และ lmer)
ฉันได้ดูภาพรวมของสูตร lm / lmer R โดย @conjugatepriorและสับสนโดยรายการต่อไปนี้: ทีนี้สมมติว่า A สุ่ม แต่ B ได้รับการแก้ไขและ B ถูกซ้อนภายใน A aov(Y ~ B + Error(A/B), data=d) ด้านล่างสูตรโมเดลผสมแบบอะนาล็อกlmer(Y ~ B + (1 | A:B), data=d) มีไว้สำหรับกรณีเดียวกัน ฉันไม่เข้าใจความหมายของมัน ในการทดลองที่วิชาถูกแบ่งออกเป็นหลายกลุ่มเราจะมีปัจจัยสุ่ม (วิชา) ซ้อนอยู่ภายในปัจจัยคงที่ (กลุ่ม) แต่ปัจจัยคงที่สามารถซ้อนภายในปัจจัยสุ่มได้อย่างไร มีการแก้ไขบางอย่างซ้อนกันภายในวิชาแบบสุ่มหรือไม่ เป็นไปได้ไหม หากเป็นไปไม่ได้สูตร R เหล่านี้มีเหตุผลหรือไม่ ภาพรวมนี้เป็นที่กล่าวถึงให้เป็นไปตามบางส่วนบนหน้าบุคลิกภาพของโครงการในการทำ ANOVA ใน Rตามตัวเองเกี่ยวกับเรื่องนี้สอนเกี่ยวกับวัดซ้ำใน R มีตัวอย่างต่อไปนี้สำหรับการวัดซ้ำ ANOVA ที่ได้รับ: …

2
การคำนวณขนาดตัวอย่างสำหรับแบบผสม
ฉันสงสัยว่ามีวิธีใดในการคำนวณขนาดตัวอย่างในโมเดลผสมหรือไม่ ฉันใช้lmerใน R เพื่อให้พอดีกับโมเดล (ฉันมีความลาดชันและจุดตัดแบบสุ่ม)

2
ควรเปรียบเทียบแบบจำลองเอฟเฟกต์ผสมและหรือตรวจสอบความถูกต้องอย่างไร
รุ่นเอฟเฟกต์ผสม (เชิงเส้น) เป็นอย่างไรเมื่อเปรียบเทียบกับแบบอื่น ฉันรู้ว่าสามารถใช้การทดสอบอัตราส่วนความน่าจะเป็นได้ แต่วิธีนี้ไม่ได้ผลหากแบบจำลองหนึ่งไม่ใช่ 'ส่วนย่อย' ของแบบจำลองอื่นที่ถูกต้องหรือไม่ การประมาณของตัวแบบ df นั้นตรงไปตรงมาเสมอหรือไม่? จำนวนผลกระทบคงที่ + จำนวนองค์ประกอบความแปรปรวนโดยประมาณ? เราเพิกเฉยต่อการประมาณผลกระทบแบบสุ่มหรือไม่? สิ่งที่เกี่ยวกับการตรวจสอบ? ความคิดแรกของฉันคือการตรวจสอบข้าม แต่การพับแบบสุ่มอาจไม่ทำงานเนื่องจากโครงสร้างของข้อมูล วิธีการของ 'ปล่อยให้หนึ่งวิชา / กลุ่มออก' เหมาะสมหรือไม่? สิ่งที่เกี่ยวกับการออกจากการสังเกตหนึ่ง Mallows Cp สามารถตีความได้ว่าเป็นการประมาณการข้อผิดพลาดในการทำนายแบบจำลอง การเลือกแบบจำลองผ่าน AIC พยายามลดข้อผิดพลาดในการคาดการณ์ให้น้อยที่สุด (ดังนั้น Cp และ AIC ควรเลือกแบบจำลองเดียวกันหากข้อผิดพลาดคือ Gaussian ฉันเชื่อ) นี่หมายความว่า AIC หรือ Cp สามารถใช้เพื่อเลือกโมเดลเอฟเฟกต์เชิงเส้น 'ที่ดีที่สุด' จากการรวบรวมโมเดลที่ไม่ซ้อนกันบางส่วนในแง่ของการคาดการณ์ข้อผิดพลาดหรือไม่? (หากพวกเขาสอดคล้องกับข้อมูลเดียวกัน) BIC ยังคงมีแนวโน้มที่จะเลือกรูปแบบ 'ของจริง' ในบรรดาผู้สมัครหรือไม่? ฉันยังอยู่ภายใต้ความประทับใจว่าเมื่อเปรียบเทียบโมเดลเอฟเฟกต์ผสมผ่าน AIC …

2
ทำไมฉันถึงได้รับผลต่างแบบไม่มีศูนย์ของเอฟเฟกต์แบบสุ่มในโมเดลผสมของฉันแม้ว่าข้อมูลจะมีการเปลี่ยนแปลงบ้าง
เราได้เรียกใช้การถดถอยโลจิสติกเอฟเฟ็กต์แบบผสมโดยใช้ไวยากรณ์ต่อไปนี้ # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) หัวเรื่องและรายการเป็นเอฟเฟกต์แบบสุ่ม เราได้ผลลัพธ์ที่แปลกซึ่งมีค่าสัมประสิทธิ์และความเบี่ยงเบนมาตรฐานสำหรับเทอมที่เป็นทั้งคู่ Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: GoalEncoding ~ 1 + Group + (1 | …

1
แสดงให้เห็นว่าการวัด 100 ครั้งสำหรับ 5 วัตถุให้ข้อมูลน้อยกว่าการวัด 5 ครั้งสำหรับ 100 วัตถุ
ในการประชุมฉันได้ยินคำสั่งต่อไปนี้: การวัด 100 ครั้งสำหรับ 5 วิชาให้ข้อมูลน้อยกว่าการวัด 5 รายการสำหรับ 100 วิชา เห็นได้ชัดว่ามันเป็นเรื่องจริง แต่ฉันสงสัยว่าจะพิสูจน์ได้ในเชิงคณิตศาสตร์อย่างไร ... ฉันคิดว่าแบบจำลองเชิงเส้นผสมสามารถใช้งานได้ อย่างไรก็ตามฉันไม่รู้อะไรมากเกี่ยวกับคณิตศาสตร์ที่ใช้ในการประมาณค่า (ฉันเพิ่งเรียกใช้lmer4สำหรับ LMM และbmrsสำหรับ GLMMs) คุณช่วยแสดงตัวอย่างของสิ่งที่เป็นจริงได้ไหม ฉันต้องการคำตอบกับสูตรบางอย่างมากกว่าแค่บางโค้ดใน R. รู้สึกอิสระที่จะตั้งค่าอย่างง่ายเช่นตัวแบบผสมแบบเชิงเส้นที่มีการสกัดแบบสุ่มและการลาดชันแบบกระจายตามปกติ ป.ล. คำตอบทางคณิตศาสตร์ที่ไม่เกี่ยวข้องกับ LMM ก็ถือว่าใช้ได้เช่นกัน ฉันคิดถึง LMM เพราะพวกเขาดูเหมือนจะเป็นเครื่องมือตามธรรมชาติที่จะอธิบายว่าทำไมการวัดน้อยลงจากวิชาเพิ่มเติมนั้นดีกว่าการวัดเพิ่มเติมจากบางวิชา แต่ฉันอาจผิด

2
วิธีการใช้ binomial GLMM (glmer) กับเปอร์เซ็นต์แทนที่จะเป็นจำนวนใช่หรือไม่?
ฉันมีการทดสอบซ้ำหลายครั้งโดยที่ตัวแปรตามคือร้อยละและฉันมีหลายปัจจัยเป็นตัวแปรอิสระ ฉันต้องการใช้glmerจากแพ็คเกจ R lme4เพื่อจัดการกับปัญหาการถดถอยโลจิสติก (โดยระบุfamily=binomial) เนื่องจากดูเหมือนว่าจะรองรับการตั้งค่านี้โดยตรง ข้อมูลของฉันมีลักษณะเช่นนี้: > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 …

1
การวินิจฉัยที่เหลือในรูปแบบการถดถอยแบบ MCMC
ฉันเพิ่งลงมือเมื่อไม่นานมานี้ในแบบผสมการถดถอยที่เหมาะสมในกรอบ Bayesian โดยใช้อัลกอริทึม MCMC (ฟังก์ชั่น MCMCglmm ใน R จริง) ฉันเชื่อว่าฉันเข้าใจวิธีการวินิจฉัยลู่เข้าของกระบวนการประมาณ (ติดตาม, พล็อต geweke, autocorrelation, การกระจายหลัง ... ) สิ่งหนึ่งที่ทำให้ฉันตกอยู่ในกรอบการทำงานของ Bayesian คือความพยายามอย่างมากที่จะอุทิศให้กับการวินิจฉัยเหล่านั้นในขณะที่ดูเหมือนว่าจะทำได้น้อยมากในแง่ของการตรวจสอบชิ้นส่วนที่เหลือของแบบจำลองที่ติดตั้ง ยกตัวอย่างเช่นใน MCMCglmm ส่วนฟังก์ชั่น residual.mcmc () นั้นยังมีอยู่ แต่ยังไม่ได้นำไปใช้จริง (เช่นส่งกลับ: "ส่วนที่เหลือยังไม่ได้นำไปใช้กับวัตถุ MCMCglmm"; เรื่องเดียวกันสำหรับทำนาย. ดูเหมือนว่าจะขาดจากแพ็คเกจอื่น ๆ เช่นกันและโดยทั่วไปแล้วจะมีการพูดคุยกันเล็กน้อยในวรรณคดีที่ฉันพบ ใครช่วยชี้ให้ฉันถึงการอ้างอิงที่มีประโยชน์และรหัส R ที่ฉันสามารถเล่นหรือแก้ไขได้ ขอบคุณมาก.

3
จะตีความผลกระทบหลักได้อย่างไรเมื่อเอฟเฟกต์ปฏิสัมพันธ์ไม่สำคัญ
ฉันใช้โมเดลผสมแบบเส้นตรงทั่วไปใน R และรวมเอฟเฟกต์การโต้ตอบระหว่างตัวทำนายสองตัว ปฏิสัมพันธ์ไม่สำคัญ แต่ผลหลัก (ทั้งสองทำนาย) ทั้งสอง ตอนนี้ตัวอย่างหนังสือหลายเล่มบอกฉันว่าหากมีผลกระทบอย่างมีนัยสำคัญของการโต้ตอบผลกระทบหลักไม่สามารถตีความได้ แต่ถ้าการปฏิสัมพันธ์ของคุณไม่สำคัญ ฉันสามารถสรุปได้ว่าตัวทำนายสองตัวมีผลต่อการตอบสนองหรือไม่? หรือมันจะดีกว่าที่จะใช้รูปแบบใหม่ที่ฉันออกจากการมีปฏิสัมพันธ์? ฉันไม่ต้องการทำเช่นนั้นเพราะฉันจะต้องควบคุมการทดสอบหลายรายการ

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
คำเตือน“ แบบจำลองล้มเหลวในการรวมตัวกัน” ใน lmer ()
ด้วยชุดข้อมูลต่อไปนี้ฉันต้องการดูว่าการตอบสนอง (ผล) เปลี่ยนแปลงเกี่ยวกับเว็บไซต์ฤดูกาลระยะเวลาและการโต้ตอบของพวกเขาหรือไม่ ฟอรัมออนไลน์บางแห่งเกี่ยวกับสถิติแนะนำให้ฉันไปใช้โมเดลตัวผสมผลกระทบเชิงเส้น แต่ปัญหาคือเนื่องจากการจำลองแบบถูกสุ่มภายในแต่ละสถานีฉันมีโอกาสน้อยที่จะรวบรวมตัวอย่างจากจุดเดียวกันในฤดูกาลที่ต่อเนื่องกัน (ตัวอย่างเช่น repl-1 ของ s1 ของ post-monsoon อาจไม่เหมือนกับของ monsoon) มันแตกต่างจากการทดลองทางคลินิก (ด้วยการออกแบบภายในเรื่อง) ที่คุณวัดหัวเรื่องเดียวกันซ้ำ ๆ ตลอดฤดูกาล อย่างไรก็ตามการพิจารณาไซต์และซีซันเป็นปัจจัยสุ่มฉันรันคำสั่งต่อไปนี้และได้รับข้อความเตือน: Warning messages: 1: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : unable to evaluate scaled gradient 2: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : Model failed to converge: degenerate Hessian with 1 negative eigenvalues ใครช่วยฉันแก้ปัญหาได้บ้าง รหัสได้รับด้านล่าง: …

1
lme () และ lmer () ให้ผลลัพธ์ที่ขัดแย้งกัน
ฉันทำงานกับข้อมูลบางอย่างที่มีปัญหากับการวัดซ้ำ ๆ ในการทำเช่นนั้นฉันสังเกตเห็นพฤติกรรมที่แตกต่างกันมากระหว่างlme()และlmer()ใช้ข้อมูลทดสอบของฉันและต้องการทราบสาเหตุ ชุดข้อมูลปลอมที่ฉันสร้างขึ้นนั้นมีการวัดส่วนสูงและน้ำหนักสำหรับ 10 วิชาถ่ายสองครั้ง ฉันตั้งค่าข้อมูลเพื่อให้ระหว่างวิชาจะมีความสัมพันธ์เชิงบวกระหว่างความสูงและน้ำหนัก แต่ความสัมพันธ์เชิงลบระหว่างการวัดซ้ำภายในแต่ละบุคคล set.seed(21) Height=1:10; Height=Height+runif(10,min=0,max=3) #First height measurement Weight=1:10; Weight=Weight+runif(10,min=0,max=3) #First weight measurement Height2=Height+runif(10,min=0,max=1) #second height measurement Weight2=Weight-runif(10,min=0,max=1) #second weight measurement Height=c(Height,Height2) #combine height and wight measurements Weight=c(Weight,Weight2) DF=data.frame(Height,Weight) #generate data frame DF$ID=as.factor(rep(1:10,2)) #add subject ID DF$Number=as.factor(c(rep(1,10),rep(2,10))) #differentiate between first and second measurement นี่คือพล็อตของข้อมูลที่มีเส้นเชื่อมต่อการวัดทั้งสองจากแต่ละบุคคล …

1
ทำไมค่าโดยประมาณจากตัวทำนายเชิงเส้นที่เป็นกลางที่สุด (BLUP) จึงแตกต่างจากตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงเชิงเส้น (BLUE)
ฉันเข้าใจว่าความแตกต่างระหว่างพวกเขาเกี่ยวข้องกับว่าตัวแปรการจัดกลุ่มในแบบจำลองนั้นประมาณว่าเป็นเอฟเฟกต์แบบคงที่หรือแบบสุ่ม แต่ไม่ชัดเจนสำหรับฉันว่าทำไมพวกเขาถึงไม่เหมือนกัน (ถ้าไม่เหมือนกัน) ฉันสนใจเป็นพิเศษในการทำงานเมื่อใช้การประมาณพื้นที่ขนาดเล็กถ้ามันเกี่ยวข้อง แต่ฉันสงสัยว่าคำถามนั้นเกี่ยวข้องกับการใช้เอฟเฟกต์แบบคงที่และแบบสุ่มใด ๆ

4
การแจกแจงปัวซงทำงานอย่างไรเมื่อสร้างแบบจำลองข้อมูลต่อเนื่องและทำให้ข้อมูลสูญหาย
เพื่อนร่วมงานกำลังวิเคราะห์ข้อมูลทางชีววิทยาบางอย่างเพื่อทำวิทยานิพนธ์ของเธอด้วย Heteroscedasticity ที่น่ารังเกียจ (ดังรูปด้านล่าง) เธอวิเคราะห์ด้วยโมเดลผสม แต่ยังคงมีปัญหากับส่วนที่เหลือ การเปลี่ยนบันทึกการตอบสนองตัวแปรการทำความสะอาดสิ่งต่าง ๆ ขึ้นอยู่กับความคิดเห็นของคำถามนี้ดูเหมือนจะเป็นวิธีการที่เหมาะสม อย่างไรก็ตามในขั้นต้นเราคิดว่ามีปัญหาในการใช้ตัวแปรที่แปลงแล้วกับตัวแบบผสม ปรากฎว่าเราตีความคำแถลงผิด ๆ ในSASของ Littell & Milliken (2006) สำหรับแบบจำลองผสมซึ่งชี้ให้เห็นว่าเหตุใดจึงไม่เหมาะสมในการแปลงข้อมูลการนับและวิเคราะห์ด้วยแบบจำลองเชิงเส้นเชิงเส้นปกติ(ใบเสนอราคาเต็มด้านล่าง) . วิธีการที่ปรับปรุงส่วนที่เหลือคือการใช้โมเดลเชิงเส้นทั่วไปกับการแจกแจงปัวซอง ฉันได้อ่านแล้วว่าการแจกแจงปัวซงสามารถใช้สำหรับการสร้างแบบจำลองข้อมูลต่อเนื่อง (เช่นที่กล่าวถึงในโพสต์นี้) และแพคเกจสถิติอนุญาต แต่ฉันไม่เข้าใจว่าเกิดอะไรขึ้นเมื่อแบบจำลองนั้นพอดี เพื่อจุดประสงค์ในการทำความเข้าใจวิธีการคำนวณที่แฝงอยู่คำถามของฉันคือ: เมื่อคุณใส่การแจกแจงแบบปัวซงเป็นข้อมูลแบบต่อเนื่อง1)ข้อมูลจะถูกปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุด2) หรือไม่3)เมื่อใดควรใช้แบบจำลองปัวซองสำหรับข้อมูลต่อเนื่องหรือไม่ Littel & Milliken 2006, pg 529 "การแปลงข้อมูล [count] อาจเป็นการต่อต้านตัวอย่างเช่นการแปลงสามารถบิดเบือนการแจกแจงของเอฟเฟกต์แบบสุ่มหรือความเป็นเชิงเส้นของโมเดลที่สำคัญกว่าการแปลงข้อมูลยังคงเปิดโอกาส ของจำนวนที่คาดการณ์เชิงลบดังนั้นการอนุมานจากตัวแบบผสมที่ใช้ข้อมูลที่แปลงแล้วเป็นที่น่าสงสัยอย่างมาก "

2
ฉันจะรวบรวมวิธีการหลังและช่วงเวลาที่น่าเชื่อถือหลังจากการใส่ร้ายหลายครั้งได้อย่างไร
ฉันใช้การใส่หลายชุดเพื่อรับชุดข้อมูลที่สมบูรณ์จำนวนหนึ่ง ฉันได้ใช้วิธีการแบบเบย์ในชุดข้อมูลแต่ละชุดที่เสร็จสมบูรณ์เพื่อรับการแจกแจงด้านหลังสำหรับพารามิเตอร์ (เอฟเฟกต์แบบสุ่ม) ฉันจะรวม / รวมผลลัพธ์สำหรับพารามิเตอร์นี้ได้อย่างไร บริบทเพิ่มเติม: แบบจำลองของฉันเป็นแบบลำดับชั้นในแง่ของนักเรียนแต่ละคน (หนึ่งการสังเกตต่อนักเรียนหนึ่งคน) จัดเป็นกลุ่มในโรงเรียน ฉันได้ทำการใส่หลาย ๆ ครั้ง (ใช้MICEใน R) กับข้อมูลของฉันซึ่งฉันรวมไว้schoolเป็นหนึ่งในตัวทำนายสำหรับข้อมูลที่หายไป - เพื่อพยายามรวมลำดับชั้นของข้อมูลเข้ากับการใส่ข้อมูล ฉันได้ติดตั้งโมเดลความชันสุ่มแบบง่ายกับชุดข้อมูลที่สมบูรณ์แต่ละชุด (ใช้MCMCglmmใน R) ผลลัพธ์ที่ได้คือไบนารี ฉันได้พบว่าความหนาแน่นด้านหลังของความแปรปรวนแบบสุ่มเป็น "พฤติกรรมที่ดี" ในแง่ที่ว่าพวกเขามีลักษณะเช่นนี้: ฉันจะรวม / รวมหมายถึงหลังและช่วงเวลาที่น่าเชื่อถือจากชุดข้อมูลแต่ละอันที่มีการกำหนดไว้สำหรับเอฟเฟกต์แบบสุ่มนี้ได้อย่างไร อัปเดต 1 : จากสิ่งที่ฉันเข้าใจจนถึงตอนนี้ฉันสามารถนำกฎของรูบินไปใช้กับค่าเฉลี่ยหลังเพื่อให้ค่าเฉลี่ยหลังซึ่งมีการโต้แย้งกันหลายครั้ง - มีปัญหาอะไรไหมกับการทำเช่นนี้? แต่ฉันไม่รู้ว่าจะรวมช่วงเวลาที่น่าเชื่อถือได้ 95% อย่างไร นอกจากนี้เนื่องจากฉันมีตัวอย่างความหนาแน่นด้านหลังที่แท้จริงสำหรับการใส่ร้ายแต่ละครั้ง - ฉันสามารถรวมสิ่งเหล่านี้ได้หรือไม่ อัปเดต 2 : ตามคำแนะนำของ @ cyan ในความคิดเห็นฉันชอบความคิดที่จะรวมตัวอย่างจากการแจกแจงหลังที่ได้จากชุดข้อมูลแต่ละชุดจากการใส่หลายครั้ง อย่างไรก็ตามฉันควรจะรู้เหตุผลทางทฤษฎีสำหรับการทำเช่นนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.