คำถามติดแท็ก multilevel-analysis

การวิเคราะห์ทางสถิติของชุดข้อมูลประกอบด้วยหลายระดับของลำดับชั้น (เช่นนักเรียนซ้อนในชั้นเรียนที่ซ้อนกันในโรงเรียนหรือการคาดการณ์ลำดับชั้น) สำหรับคำถามเกี่ยวกับแบบผสมให้ใช้แท็ก [แบบผสม] สำหรับเอฟเฟ็กต์แบบซ้อนซ้อนกันให้ใช้ [ซ้อนข้อมูล]

1
ขาดระหว่าง PET-PEESE และวิธีการหลายระดับในการวิเคราะห์อภิมาน: มีความสุขหรือไม่?
ขณะนี้ฉันกำลังทำงานกับการวิเคราะห์เมตาดาต้าซึ่งฉันจำเป็นต้องวิเคราะห์ขนาดของเอฟเฟกต์หลายขนาดซ้อนกันภายในกลุ่มตัวอย่าง ฉันเป็นส่วนหนึ่งของวิธีการวิเคราะห์อภิมานสามระดับของ Cheung (2014) เพื่อการวิเคราะห์อภิมานขนาดต่างกันเมื่อเทียบกับกลยุทธ์อื่น ๆ ที่เป็นไปได้ (เช่นการไม่สนใจการพึ่งพาขนาดเฉลี่ยของผลกระทบภายในการศึกษาเลือกขนาดผลหนึ่งขนาดหรือ เปลี่ยนหน่วยของการวิเคราะห์) ขนาดของเอฟเฟ็กต์ขึ้นอยู่กับฉันมีความสัมพันธ์เกี่ยวข้องกับตัวแปรที่ค่อนข้างโดดเด่น (แต่เกี่ยวข้องกับ topically) ดังนั้นค่าเฉลี่ยของพวกมันจึงไม่สมเหตุสมผลทางความคิดและถึงแม้ว่ามันจะเป็นเช่นนั้น อย่างไรก็ตามในเวลาเดียวกันฉันก็สนใจที่จะใช้วิธีของ Stanley & Doucouliagos (2014) ในการจัดการกับอคติการตีพิมพ์ในหลักสูตรการประมาณผลกระทบจากการวิเคราะห์ สรุปอย่างใดอย่างหนึ่งอย่างใดอย่างหนึ่งเหมาะกับรูปแบบการถดถอยเมตาทำนายขนาดผลการศึกษาโดยความแปรปรวนตามลำดับของพวกเขา (การทดสอบผลกระทบที่มีความแม่นยำหรือ PET) หรือข้อผิดพลาดมาตรฐานตามลำดับของพวกเขา ขึ้นอยู่กับความสำคัญของการสกัดกั้นในแบบจำลอง PET หนึ่งอาจใช้การสกัดกั้นจากแบบจำลอง PET (ถ้าการสกัดกั้น PET p > .05) หรือแบบจำลอง PEESE (ถ้าการสกัดกั้น PET p <.05) เป็นสิ่งพิมพ์โดยประมาณ - ขนาดเอฟเฟ็กต์เฉลี่ยที่ปราศจากอคติ อย่างไรก็ตามปัญหาของฉันเกิดจากข้อความที่ตัดตอนมาจาก Stanley & Doucouliagos (2014): ในการจำลองของเรารวมความหลากหลายที่ไม่ได้อธิบายไว้รวมอยู่เสมอ; ดังนั้นโดยทั่วไปแล้วควรใช้ REE [ตัวประมาณผลกระทบแบบสุ่ม] …

2
ฉันควรบูตที่ระดับคลัสเตอร์หรือระดับบุคคลหรือไม่
ฉันมีแบบจำลองการเอาชีวิตรอดกับผู้ป่วยที่ซ้อนอยู่ในโรงพยาบาลซึ่งรวมถึงผลกระทบแบบสุ่มสำหรับโรงพยาบาล เอฟเฟกต์แบบสุ่มคือการแจกแจงแกมม่าและฉันพยายามรายงาน 'ความเกี่ยวข้อง' ของคำนี้ในระดับที่เข้าใจได้ง่าย ฉันได้พบข้อมูลอ้างอิงต่อไปนี้ซึ่งใช้อัตราส่วนค่ามัธยฐานอันตราย (bit เช่น Median Odds Ratio) และคำนวณค่านี้ Bengtsson T, Dribe M: วิธีการทางประวัติศาสตร์ 43:15, 2010 อย่างไรก็ตามตอนนี้ฉันต้องการรายงานความไม่แน่นอนที่เกี่ยวข้องกับการประเมินนี้โดยใช้ bootstrap ข้อมูลนี้เป็นข้อมูลการอยู่รอดและด้วยเหตุนี้จึงมีการสังเกตหลายครั้งต่อผู้ป่วยและผู้ป่วยหลายรายต่อโรงพยาบาล ดูเหมือนชัดเจนว่าฉันต้องจัดกลุ่มการสังเกตผู้ป่วยเมื่อทำการสุ่มตัวอย่างใหม่ แต่ฉันไม่รู้ว่าฉันควรจัดกลุ่มโรงพยาบาลด้วยหรือไม่ ฉันสงสัยว่าคำตอบนั้นขึ้นอยู่กับพารามิเตอร์ที่น่าสนใจหรือไม่และจะแตกต่างกันอย่างไรหากเป้าหมายเป็นสิ่งที่เกี่ยวข้องในระดับผู้ป่วยมากกว่าระดับโรงพยาบาล ฉันระบุรหัส stata ด้านล่างในกรณีที่ช่วยได้ cap program drop est_mhr program define est_mhr, rclass stcox patient_var1 patient_var2 /// , shared(hospital) /// noshow local twoinvtheta2 = 2 / (e(theta)^2) local …

1
สัญกรณ์สำหรับการสร้างแบบจำลองหลายระดับ
สูตรหนึ่งต้องระบุสำหรับการฝึกอบรมรูปแบบหลายระดับ (ใช้lmerจากlme4 Rห้องสมุด) ทำให้ฉันได้รับเสมอ ฉันได้อ่านหนังสือและแบบฝึกหัดที่นับไม่ถ้วน แต่ไม่เข้าใจเลย นี่คือตัวอย่างจากบทช่วยสอนนี้ที่ฉันต้องการดูสูตรในสมการ เราพยายามจำลองความถี่เสียงเป็นหน้าที่ของเพศ (เพศหญิงมีระดับเสียงสูงกว่าเพศชายโดยทั่วไป) และทัศนคติของบุคคล (ไม่ว่าเขา / เธอจะตอบด้วยวิธีสุภาพหรือไม่เป็นทางการ) ในสถานการณ์ต่าง ๆ นอกจากนี้อย่างที่คุณเห็นจากsubjectคอลัมน์แต่ละคนจะถูกวัดหลายครั้ง > head(politeness, n=20) subject gender scenario attitude frequency 1 F1 F 1 pol 213.3 2 F1 F 1 inf 204.5 3 F1 F 2 pol 285.1 4 F1 F 2 inf 259.7 5 F1 …

3
แบบหลายระดับกับรุ่นที่แยกต่างหากสำหรับแต่ละระดับ
อะไรคือข้อดีและข้อเสียของการใช้ตัวแบบแยกกับแบบจำลองหลายระดับ? โดยเฉพาะอย่างยิ่งสมมติว่าการศึกษาตรวจสอบผู้ป่วยที่ซ้อนกันภายในการปฏิบัติของแพทย์ที่ซ้อนอยู่ภายในประเทศ ข้อดี / ข้อเสียของการใช้โมเดลแยกกันสำหรับแต่ละประเทศเทียบกับแบบจำลองซ้อนสามระดับคืออะไร

2
โมเดลลำดับชั้นสำหรับการเปรียบเทียบหลายรายการ - บริบทผลลัพธ์หลายรายการ
ฉันเพิ่งได้รับการอ่านของเจลแมนทำไมเรา (ปกติ) ไม่ต้องกังวลกับการเปรียบเทียบหลาย ๆครั้ง โดยเฉพาะอย่างยิ่งในส่วน "ผลลัพธ์ที่หลากหลายและความท้าทายอื่น ๆ "กล่าวถึงการใช้แบบจำลองลำดับชั้นสำหรับสถานการณ์เมื่อมีมาตรการที่เกี่ยวข้องหลายรายการจากบุคคล / หน่วยเดียวกันในเวลาและเงื่อนไขที่แตกต่างกัน ดูเหมือนว่าจะมีคุณสมบัติที่ต้องการจำนวนมาก ฉันเข้าใจว่านี่ไม่จำเป็นต้องเป็นสิ่งที่เบย์ ใครบางคนสามารถแสดงให้ฉันเห็นวิธีการสร้างโมเดลหลายตัวแปรหลายระดับอย่างถูกต้องโดยใช้ rjags และ / หรือ lmer (JAGS และ BUGS ปกติควรจะดีเช่นกัน ผลลัพธ์ที่ตรงกันข้าม ประเภทของสถานการณ์ที่ฉันต้องการให้แบบจำลองนั้นสะท้อนให้เห็นในข้อมูลของเล่นด้านล่าง (หลายตัวแปร, การวัดซ้ำ): set.seed(69) id <- factor(rep(1:20, 2)) # subject identifier dv1 <- c(rnorm(20), rnorm(20, 0.8, 0.3)) # dependent variable 1 data for 2 conditions dv2 <- …

2
อนุกรมเวลาที่ผิดปกติอย่างมาก
ฉันมีข้อมูลสำหรับประชากรปลาจำนวนหนึ่งที่สุ่มตัวอย่างในช่วงเวลาประมาณ 5 ปี แต่ในรูปแบบที่ผิดปกติมาก บางครั้งมีเดือนระหว่างตัวอย่างบางครั้งมีหลายตัวอย่างในหนึ่งเดือน นอกจากนี้ยังมีจำนวน 0 จำนวน วิธีจัดการกับข้อมูลดังกล่าว? ฉันสามารถวาดกราฟได้อย่างง่ายดายใน R แต่กราฟไม่สว่างโดยเฉพาะเพราะมันเป็นหลุมเป็นบ่อมาก ในแง่ของการสร้างแบบจำลอง - ด้วยสปีชีส์ที่จำลองเป็นฟังก์ชั่นของสิ่งต่าง ๆ - อาจเป็นโมเดลผสม ยินดีต้อนรับการอ้างอิงหรือความคิดใด ๆ รายละเอียดบางอย่างในการตอบสนองต่อความคิดเห็น มีประมาณ 15 ชนิด ฉันกำลังพยายามที่จะรับความคิดเกี่ยวกับแนวโน้มหรือฤดูกาลของปลาแต่ละตัวและดูว่าสปีชีส์สัมพันธ์กันอย่างไร (ลูกค้าของฉันต้องการตารางที่มีความสัมพันธ์อย่างง่าย ๆ ) เป้าหมายคือการอธิบายและการวิเคราะห์ไม่ใช่การทำนาย การแก้ไขเพิ่มเติม: ฉันพบบทความนี้โดย K. Rehfield และคณะซึ่งแนะนำให้ใช้เมล็ดเกาส์เซียนเพื่อประเมิน ACF สำหรับอนุกรมเวลาที่ผิดปกติอย่างมาก http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

2
"พารามิเตอร์ส่วนประกอบความแปรปรวน" ในรูปแบบเอฟเฟกต์ผสมคืออะไร
ในหน้า 12 ของหนังสือของBates เกี่ยวกับตัวแบบผสมเอฟเฟกต์เขาอธิบายแบบจำลองดังต่อไปนี้: ใกล้ถึงจุดสิ้นสุดของภาพหน้าจอเขากล่าวถึง ปัจจัยความแปรปรวนร่วม ΛθΛθ\Lambda_{\theta}ทั้งนี้ขึ้นอยู่กับพารามิเตอร์แปรปรวนองค์ประกอบ ,θθ\theta โดยไม่อธิบายว่าความสัมพันธ์คืออะไร พูดว่าเราได้รับแล้วเราจะได้มาได้อย่างไรθθ\thetaΛθΛθ\Lambda_{\theta} ในบันทึกที่เกี่ยวข้องนี่เป็นหนึ่งในหลาย ๆ ตัวอย่างที่ฉันพบว่าการจัดแสดงของเบตส์มีรายละเอียดเล็กน้อย มีข้อความที่ดีกว่าที่จริงแล้วผ่านกระบวนการปรับให้เหมาะสมของการประมาณค่าพารามิเตอร์และหลักฐานสำหรับการแจกแจงสถิติการทดสอบหรือไม่?

2
วิธีที่ดีที่สุดในการประเมินผลการรักษาโดยเฉลี่ยในการศึกษาระยะยาวคืออะไร?
ในการศึกษาระยะยาวผลลัพธ์ของหน่วยที่ถูกวัดซ้ำ ๆ ณ จุดเวลาโดยมีโอกาสในการวัดคงที่ทั้งหมด (คงที่ = วัดที่หน่วยในเวลาเดียวกัน)YฉันทีYผมเสื้อY_{it}ผมผมiเสื้อเสื้อtม.ม.m หน่วยที่ได้รับมอบหมายสุ่มทั้งการรักษา,หรือกลุ่มควบคุม, 0 ฉันต้องการประเมินและทดสอบผลการรักษาโดยเฉลี่ยเช่นที่ความคาดหวังนั้นเกิดขึ้นข้ามเวลาและส่วนบุคคล ฉันพิจารณาใช้แบบจำลองหลายระดับ (เอฟเฟกต์ผสม) ในโอกาสคงที่เพื่อวัตถุประสงค์นี้G = 1G=1G=1G = 0G=0G=0TE= E( Y| G=1)-E( Y| G=0),ATE=E(Y|G=1)-E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yฉันที= α + βGผม+ยู0 ฉัน+อีฉันทีYผมเสื้อ=α+βGผม+ยู0ผม+อีผมเสื้อY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} ด้วย the intercept the ,จะถูกสกัดกั้นแบบสุ่มทั่วทั้งหน่วยและส่วนที่เหลือαα\alphaββ\betaTEATEATEยูยูuอีอีe ตอนนี้ฉันกำลังพิจารณารูปแบบทางเลือก Yฉันที=β~Gผม+Σj = …

1
การประมาณแบบจำลองการถดถอยโลจิสติกหลายระดับ
โมเดลโลจิสติกหลายระดับต่อไปนี้ที่มีตัวแปรอธิบายหนึ่งตัวที่ระดับ 1 (ระดับบุคคล) และตัวแปรอธิบายหนึ่งตัวที่ระดับ 2 (ระดับกลุ่ม): logit(pij)=π0j+π1jxij…(1)logit(pij)=π0j+π1jxij…(1)\text{logit}(p_{ij})=\pi_{0j}+\pi_{1j}x_{ij}\ldots (1) π0j=γ00+γ01zj+u0j…(2)π0j=γ00+γ01zj+u0j…(2)\pi_{0j}=\gamma_{00}+\gamma_{01}z_j+u_{0j}\ldots (2) π1j=γ10+γ11zj+u1j…(3)π1j=γ10+γ11zj+u1j…(3)\pi_{1j}=\gamma_{10}+\gamma_{11}z_j+u_{1j}\ldots (3) โดยที่ค่าคงที่ระดับกลุ่มและถูกสันนิษฐานว่ามีการแจกแจงปกติหลายตัวแปรที่มีค่าความคาดหวังเป็นศูนย์ ความแปรปรวนของข้อผิดพลาดที่เหลือ ถูกระบุเป็นและความแปรปรวนของข้อผิดพลาดที่เหลือ ถูกระบุเป็น\u0ju0ju_{0j}u1ju1ju_{1j}u0ju0ju_{0j}σ20σ02\sigma^2_0u1ju1ju_{1j}σ21σ12\sigma^2_1 ฉันต้องการที่จะประเมินค่าพารามิเตอร์ของรูปแบบและฉันชอบที่จะใช้ คำสั่งRglmmPQL สมการแทน (2) และ (3) ในสมการ (1) ผลตอบแทน logit(pij)=γ00+γ10xij+γ01zj+γ11xijzj+u0j+u1jxij…(4)logit(pij)=γ00+γ10xij+γ01zj+γ11xijzj+u0j+u1jxij…(4)\text{logit}(p_{ij})=\gamma_{00}+\gamma_{10}x_{ij}+\gamma_{01}z_j+\gamma_{11}x_{ij}z_j+u_{0j}+u_{1j}x_{ij}\ldots (4) มี 30 กลุ่มและ 5 คนในแต่ละกลุ่ม(j=1,...,30)(j=1,...,30)(j=1,...,30) รหัส R: #Simulating data from multilevel logistic distribution library(mvtnorm) set.seed(1234) J <- 30 ## number of groups n_j …

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

4
อัลกอริธึมมาตรฐานสำหรับการทำการถดถอยเชิงเส้นแบบลำดับชั้น?
มีอัลกอริธึมมาตรฐาน (ตรงข้ามกับโปรแกรม) สำหรับการถดถอยเชิงเส้นแบบลำดับชั้นหรือไม่? คนมักจะทำเพียงแค่ MCMC หรือมีความเชี่ยวชาญมากขึ้นบางทีอาจจะเป็นรูปแบบปิดอัลกอริทึมบางส่วน?

2
ระยะทางจะต้องเป็น "ตัวชี้วัด" เพื่อให้การจัดกลุ่มแบบลำดับชั้นมีความถูกต้องหรือไม่
ให้เราบอกว่าเรากำหนดระยะทางซึ่งไม่ใช่ตัวชี้วัดระหว่างรายการ N ขึ้นอยู่กับระยะทางนี้เราก็ใช้การจัดกลุ่มตามลำดับชั้น Agglomerative เราสามารถใช้อัลกอริทึมที่รู้จักกัน (ลิงค์เดี่ยว / สูงสุด / avaerage ฯลฯ ) เพื่อให้ได้ผลลัพธ์ที่มีความหมายได้หรือไม่ หรือวางแตกต่างกันสิ่งที่เป็นปัญหากับการใช้พวกเขาหากระยะทางไม่ได้เป็นตัวชี้วัด?

3
ทำไมความสามารถในการแลกเปลี่ยนของตัวแปรสุ่มจึงมีความสำคัญในตัวแบบเบย์เซียนแบบลำดับชั้น?
ทำไมความสามารถในการแลกเปลี่ยนของตัวแปรสุ่มจึงจำเป็นสำหรับการสร้างแบบจำลองแบบเบย์แบบลำดับชั้น?

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
ฉันสามารถใส่โมเดลผสมกับวัตถุที่มีเพียงการสังเกต 1 ข้อเท่านั้นหรือไม่
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากซึ่งฉันได้ทำการวัดซ้ำหลายครั้งในแต่ละสถานที่ บางตำแหน่งอาจมีจุดข้อมูล 10 จุดและบางตำแหน่งมีเพียงจุดข้อมูล 1 จุด ฉันพอดีกับโมเดลผสมและใช้ตำแหน่งเป็นเอฟเฟกต์แบบสุ่ม คำถามของฉันคือฉันยังสามารถใช้ตำแหน่งที่มีเพียง 1 จุดข้อมูล (เนื่องจากคุณไม่สามารถสร้างบรรทัดการถดถอยด้วยข้อมูลเพียง 1) หรือฉันควรยกเว้นสถานที่เหล่านั้นหรือไม่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.