คำถามติดแท็ก multilevel-analysis

การวิเคราะห์ทางสถิติของชุดข้อมูลประกอบด้วยหลายระดับของลำดับชั้น (เช่นนักเรียนซ้อนในชั้นเรียนที่ซ้อนกันในโรงเรียนหรือการคาดการณ์ลำดับชั้น) สำหรับคำถามเกี่ยวกับแบบผสมให้ใช้แท็ก [แบบผสม] สำหรับเอฟเฟ็กต์แบบซ้อนซ้อนกันให้ใช้ [ซ้อนข้อมูล]

1
การเขียนสมการทางคณิตศาสตร์สำหรับแบบจำลองเอฟเฟกต์หลายระดับ
คำถาม CV ฉันกำลังพยายามให้รายละเอียดทางคณิตศาสตร์ที่ละเอียดและรัดกุมกับโมเดลเอฟเฟกต์ผสม ฉันใช้lme4แพ็กเกจใน R การแสดงทางคณิตศาสตร์ที่ถูกต้องสำหรับโมเดลของฉันคืออะไร ข้อมูลคำถามวิทยาศาสตร์และรหัส R ชุดข้อมูลของฉันประกอบด้วยสปีชีส์ในภูมิภาคต่างๆ ฉันกำลังทดสอบว่าความชุกของเผ่าพันธุ์เปลี่ยนแปลงในเวลาที่นำไปสู่การสูญพันธุ์หรือไม่ (การสูญพันธุ์ไม่จำเป็นต้องเป็นการถาวรมันสามารถเรียกคืน) หรือตามการล่าอาณานิคม lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp)) ความชุกเป็นสัดส่วนของชั้นที่ถูกสปีชีส์ครอบครองในภูมิภาคหนึ่งปี เวลาเป็นตัวแปรต่อเนื่องที่บ่งบอกเวลาในการสูญพันธุ์หรือการล่าอาณานิคม มันเป็นบวกเสมอ Typeเป็นตัวแปรเด็ดขาดที่มีสองระดับ สองระดับนี้คือ "-" และ "+" เมื่อประเภทคือ - มันคือการตั้งอาณานิคม (ระดับเริ่มต้น) เมื่อชนิดคือ + จะเป็นการสูญพันธุ์ Regเป็นตัวแปรเด็ดขาดที่มีเก้าระดับซึ่งบ่งชี้ภูมิภาค Sppเป็นตัวแปรเด็ดขาด …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
วิธีตอบสนองต่อผู้ตรวจสอบที่ขอค่า p ในโมเดลหลายระดับแบบเบย์?
เราถูกผู้ตรวจสอบขอให้จัดทำค่า p เพื่อทำความเข้าใจกับการประมาณการแบบจำลองในแบบจำลองหลายระดับแบบเบย์ของเรา แบบจำลองเป็นแบบอย่างของการสังเกตหลายครั้งต่อผู้เข้าร่วมในการทดสอบ เราประเมินโมเดลด้วยสแตนเพื่อให้เราสามารถคำนวณสถิติหลังเพิ่มเติมได้อย่างง่ายดาย ขณะนี้เรากำลังรายงาน (ภาพและในตาราง) การประมาณค่าเฉลี่ยและปริมาณ 0.025 และ 0.975 การตอบสนองของฉันจนถึงขณะนี้จะรวมถึง: ค่า P ไม่สอดคล้องกับตัวแบบเบย์เช่นP( X| θ)≠P( θ | X) .P(X|θ)≠P(θ|X).P(X|\theta) \neq P(\theta|X). จากหลังเราสามารถคำนวณความน่าจะเป็นของพารามิเตอร์ที่มีขนาดใหญ่กว่า (เล็กกว่า) ได้มากกว่า 0 ซึ่งดูเหมือนเป็นค่า p แบบดั้งเดิมเล็กน้อย คำถามของฉันคือว่านี่คือการตอบสนองที่สามารถตอบสนองผู้ตรวจสอบหรือมันจะทำให้เกิดความสับสนมากขึ้น? อัปเดต 10 ตุลาคม: เราเขียนบทความใหม่พร้อมคำแนะนำในใจ กระดาษได้รับการยอมรับดังนั้นฉันจะย้ำความคิดเห็นก่อนหน้าของฉันว่านี่เป็นคำแนะนำที่เป็นประโยชน์จริงๆ!

2
ARMA / ARIMA เกี่ยวข้องกับการสร้างแบบจำลองเอฟเฟกต์ผสมอย่างไร?
ในการวิเคราะห์ข้อมูลแบบพาเนลฉันใช้โมเดลหลายระดับพร้อมเอฟเฟ็กต์แบบสุ่ม / ผสมเพื่อจัดการกับปัญหาความสัมพันธ์อัตโนมัติ (เช่นการสังเกตมีการรวมกลุ่มภายในบุคคลเมื่อเวลาผ่านไป) ด้วยพารามิเตอร์อื่น ๆ ที่เพิ่มเข้ามาเพื่อปรับตามเวลาและแรงกระแทก . ดูเหมือน ARMA / ARIMA ออกแบบมาเพื่อแก้ไขปัญหาที่คล้ายกัน ทรัพยากรที่ฉันพบออนไลน์สนทนาทั้งชุด (ARMA / ARIMA) หรือโมเดลเอฟเฟกต์แบบผสม แต่นอกเหนือจากการสร้างความถดถอยฉันไม่เข้าใจความสัมพันธ์ระหว่างทั้งสอง มีใครต้องการใช้ ARMA / ARIMA จากภายในรุ่นหลายระดับหรือไม่ มีความรู้สึกในสิ่งที่ทั้งสองจะเทียบเท่าหรือซ้ำซ้อน? คำตอบหรือตัวชี้ไปยังแหล่งข้อมูลที่กล่าวถึงเรื่องนี้จะดีมาก

3
ฟอเรสต์แบบสุ่มในข้อมูลที่มีโครงสร้างหลายระดับ / ลำดับชั้น
ฉันค่อนข้างใหม่กับการเรียนรู้ด้วยเครื่องจักรเทคนิคของ CART และสิ่งที่คล้ายกันและฉันหวังว่าไร้เดียงสาของฉันจะไม่ชัดเจนเกินไป Random Forest จัดการโครงสร้างข้อมูลหลายระดับ / ลำดับชั้นได้อย่างไร (ตัวอย่างเช่นเมื่อการโต้ตอบข้ามระดับเป็นที่สนใจ) นั่นคือชุดข้อมูลที่มีหน่วยการวิเคราะห์ในหลายระดับชั้น ( เช่นนักเรียนซ้อนกันภายในโรงเรียนพร้อมข้อมูลเกี่ยวกับทั้งนักเรียนและโรงเรียน) ยกตัวอย่างเช่นพิจารณาชุดข้อมูลหลายระดับที่มีบุคคลในระดับแรก ( เช่นข้อมูลพฤติกรรมการลงคะแนนประชากร ฯลฯ ) ซ้อนกันภายในประเทศในระดับที่สอง (พร้อมข้อมูลระดับประเทศเช่นประชากร): ID voted age female country population 1 1 19 1 1 53.01 2 1 23 0 1 53.01 3 0 43 1 1 53.01 4 1 27 1 1 53.01 5 …

2
เหตุใดจึงใช้การแจกแจงแบบเบต้าบนพารามิเตอร์ Bernoulli สำหรับการถดถอยโลจิสติกแบบลำดับชั้น
ฉันกำลังอ่านหนังสือ "Doing Bayesian Data Analysis" ที่ยอดเยี่ยมของ Kruschke อย่างไรก็ตามบทที่เกี่ยวกับการถดถอยโลจิสติกแบบลำดับชั้น (บทที่ 20) ค่อนข้างสับสน รูปที่ 20.2 อธิบายการถดถอยโลจิสติกแบบลำดับชั้นที่พารามิเตอร์ Bernoulli ถูกกำหนดเป็นฟังก์ชันเชิงเส้นของสัมประสิทธิ์ที่ถูกแปลงผ่านฟังก์ชัน sigmoid นี่น่าจะเป็นวิธีการถดถอยโลจิสติกแบบลำดับชั้นในตัวอย่างส่วนใหญ่ที่ฉันเคยเห็นในแหล่งอื่น ๆ ทางออนไลน์เช่นกัน ตัวอย่างเช่น - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug อย่างไรก็ตามเมื่อตัวทำนายมีค่าน้อยที่สุดเขาจะเพิ่มเลเยอร์ในลำดับชั้น - พารามิเตอร์ Bernoulli ถูกดึงมาจากการแจกแจงแบบเบต้า (รูปที่ 20.5) ด้วยพารามิเตอร์ที่กำหนดโดย mu และ kappa โดยที่ mu คือการแปลง sigmoid ของฟังก์ชันเชิงเส้นของสัมประสิทธิ์ และคัปปาใช้แกมมามาก่อน ดูเหมือนว่าจะสมเหตุสมผลและคล้ายคลึงกับตัวอย่างการพลิกเหรียญจากบทที่ 9 แต่ฉันไม่เห็นว่าการคาดการณ์เล็กน้อยจะทำอย่างไรกับการเพิ่มการแจกแจงแบบเบต้า เหตุใดจึงไม่ทำเช่นนี้ในกรณีของตัวทำนายเมตริกและทำไมการแจกแจงเบต้าถูกเพิ่มเข้ามาสำหรับตัวทำนายที่ระบุ? แก้ไข:ชี้แจงเกี่ยวกับรูปแบบที่ฉันหมายถึง ก่อนอื่นโมเดลการถดถอยโลจิสติกพร้อมตัวทำนายเมตริก (ไม่มีเบต้าก่อน) นี่คล้ายกับตัวอย่างอื่น ๆ ของการถดถอยโลจิสติกส์แบบลำดับชั้นเช่นตัวอย่างข้อบกพร่องด้านบน: …

2
MCMC กำลังรวมเป็นค่าเดียวหรือไม่
ฉันกำลังพยายามปรับให้เข้ากับโมเดลลำดับชั้นโดยใช้ jags และแพ็คเกจ rjags ตัวแปรผลลัพธ์ของฉันคือ y ซึ่งเป็นลำดับของการทดลองเบอโนลลี ฉันมี 38 วิชามนุษย์ที่มีประสิทธิภาพภายใต้สองประเภท: P เมตรและจากการวิเคราะห์ของฉันลำโพงทุกคนมีความน่าจะเป็นของความสำเร็จในหมวดหมู่ของ Pและความน่าจะเป็นของความสำเร็จในหมวดหมู่ของ M \ฉันยังสมมติว่ามีบาง hyperparameter ระดับชุมชนของ P และ M:และ\θpθp\theta_pθp×θmθp×θm\theta_p\times\theta_mμpμp\mu_pμmμm\mu_m ดังนั้นสำหรับผู้พูดทุกคน: และที่และควบคุมวิธีแหลมกระจายอยู่รอบ ๆและ\θp∼beta(μp×κp,(1−μp)×κp)θp∼beta(μp×κp,(1−μp)×κp)\theta_p \sim beta(\mu_p\times\kappa_p, (1-\mu_p)\times\kappa_p)θm∼beta(μm×κm,(1−μm)×κm)θm∼beta(μm×κm,(1−μm)×κm)\theta_m \sim beta(\mu_m\times\kappa_m, (1-\mu_m)\times\kappa_m)κpκp\kappa_pκmκm\kappa_mμpμp\mu_pμmμm\mu_m นอกจากนี้ยัง ,B_m)μp∼beta(Ap,Bp)μp∼beta(Ap,Bp)\mu_p \sim beta(A_p, B_p)μm∼beta(Am,Bm)μm∼beta(Am,Bm)\mu_m \sim beta(A_m, B_m) นี่คือรูปแบบ jags ของฉัน: model{ ## y = N bernoulli trials ## Each speaker …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
แบบลำดับชั้น Bayesian (?)
โปรดขออภัยการใช้ศัพท์แสงเชิงสถิติของฉันด้วย :) ฉันพบคำถามสองสามข้อเกี่ยวกับการโฆษณาและอัตราการคลิกผ่าน แต่พวกเขาไม่ได้ช่วยฉันมากกับความเข้าใจของฉันเกี่ยวกับสถานการณ์ลำดับชั้นของฉัน มีคำถามที่เกี่ยวข้องการเป็นตัวแทนที่เท่าเทียมกันของโมเดล Bayesian ลำดับชั้นเดียวกันหรือไม่ แต่ฉันไม่แน่ใจว่าจริง ๆ แล้วพวกเขามีปัญหาที่คล้ายกัน อีกคำถามที่Priors สำหรับแบบจำลองแบบทวินามแบบเบย์แบบลำดับชั้นจะมีรายละเอียดเกี่ยวกับ hyperpriors แต่ฉันไม่สามารถแมปคำตอบของพวกเขากับปัญหาของฉันได้ ฉันมีโฆษณาสองรายการออนไลน์สำหรับผลิตภัณฑ์ใหม่ ฉันปล่อยให้โฆษณาทำงานสองสามวัน ณ จุดนี้มีคนคลิกโฆษณาเพื่อดูว่าใครได้รับคลิกมากที่สุด หลังจากเตะออกไปหมดแล้ว แต่คลิกที่มีการคลิกมากที่สุดฉันปล่อยให้มันวิ่งไปอีกสองสามวันเพื่อดูว่าผู้คนซื้อจริงแค่ไหนหลังจากคลิกโฆษณา ณ จุดนี้ฉันรู้ว่ามันเป็นความคิดที่ดีที่จะเรียกใช้โฆษณาในครั้งแรก สถิติของฉันดังมากเพราะฉันไม่มีข้อมูลมากมายเนื่องจากฉันขายสินค้าเพียงไม่กี่รายการทุกวัน ดังนั้นจึงเป็นเรื่องยากที่จะประเมินจำนวนผู้ที่ซื้อบางอย่างหลังจากเห็นโฆษณา การคลิกเพียงครั้งเดียวจะส่งผลให้เกิดการซื้อ โดยทั่วไปฉันต้องทราบว่าฉันเสียเงินกับโฆษณาแต่ละรายการเร็วที่สุดเท่าที่จะเป็นไปได้โดยการปรับสถิติกลุ่มโฆษณาแต่ละรายการให้ราบรื่นด้วยสถิติทั่วโลกสำหรับโฆษณาทั้งหมด หากฉันรอจนกระทั่งโฆษณาทุกรายการเห็นการซื้อมากพอฉันจะพังเพราะใช้เวลานานเกินไป: การทดสอบ 10 โฆษณาที่ฉันต้องใช้จ่ายมากขึ้น 10 เท่าเพื่อให้สถิติสำหรับโฆษณาแต่ละรายการมีความน่าเชื่อถือมากพอ ตามเวลาที่ฉันอาจจะสูญเสียเงิน หากฉันซื้อสินค้าโดยเฉลี่ยมากกว่าโฆษณาทั้งหมดฉันจะไม่สามารถเริ่มโฆษณาที่ไม่ได้ผลเช่นกัน ฉันสามารถใช้อัตราการซื้อทั่วโลก (การกระจายย่อย N $ ได้หรือไม่ นั่นหมายความว่ายิ่งฉันมีข้อมูลสำหรับโฆษณาแต่ละรายการมากเท่าไหร่สถิติของโฆษณานั้นก็จะยิ่งมากขึ้นเท่านั้น หากยังไม่มีใครคลิกโฆษณาฉันคิดว่าค่าเฉลี่ยทั่วโลกเหมาะสมperclick)anduseitasapriorforperclick)anduseitasapriorfor per click) and use it as a prior for …

3
ชุดข้อมูลที่เป็นภาพประกอบและการวิเคราะห์สำหรับการสร้างแบบจำลองหลายระดับ
ฉันเพิ่งเข้าเรียนหลักสูตรเบื้องต้นเกี่ยวกับการสร้างแบบจำลองหลายระดับ ชุดข้อมูลและตัวอย่างส่วนใหญ่ที่เราใช้นั้นมาจากสังคมศาสตร์ ฉันเพิ่งฝึกงาน 2 สัปดาห์ในแผนกชีวสถิติที่พวกเขาต้องการให้ฉันเริ่มโครงการที่เกี่ยวข้องกับการเปลี่ยนแปลงในระดับที่โรงพยาบาลของผู้ป่วยสำหรับภาวะฉุกเฉินที่มีอัตราการตายสูงทั้งระหว่างโรงพยาบาลและ 5 ปีขึ้นไป ช่วงเวลา. ฉันเริ่มฝึกงานในสัปดาห์หน้าและฉันหวังว่าจะหาหนังสือหรือแหล่งข้อมูลออนไลน์ที่มีการวิเคราะห์ที่คล้ายกัน (ควรใช้กับ R, Stata หรือ MLwiN) โดยเฉพาะอย่างยิ่งที่พวกเขามีชุดข้อมูลสำหรับผู้อ่าน ลิงค์ใด ๆ ที่จะได้รับการต้อนรับมากที่สุด แก้ไข: ฉันจะทำงานกับชุดข้อมูลที่มีรายละเอียดทุกแง่มุมที่บันทึกไว้ของการดูแลในโรงพยาบาลของผู้ป่วย ผลลัพธ์หลักที่น่าสนใจคือการเสียชีวิตภายใน 30 วันนับจากวันรับเข้าเรียน

1
การแบ่งประเภทแบ่งชั้นด้วยป่าสุ่ม (หรือตัวแยกประเภทอื่น)
ดังนั้นฉันจึงมีเมทริกซ์ประมาณ 60 x 1,000 ฉันมองว่ามันเป็นวัตถุ 60 ชิ้นที่มีคุณสมบัติ 1,000 รายการ วัตถุ 60 ชิ้นถูกจัดกลุ่มเป็น 3 คลาส (a, b, c) วัตถุ 20 ชิ้นในแต่ละชั้นและเรารู้การจำแนกที่แท้จริง ฉันต้องการทำการเรียนรู้ภายใต้การดูแลในชุดตัวอย่างการฝึกอบรม 60 ชุดนี้และฉันสนใจทั้งความแม่นยำของตัวจําแนก (และตัวชี้วัดที่เกี่ยวข้อง) รวมถึงการเลือกคุณสมบัติของคุณสมบัติ 1,000 รายการ ก่อนชื่อของฉันเป็นอย่างไร ตอนนี้คำถามจริง: ฉันสามารถโยนฟอเรสต์แบบสุ่มตามที่ระบุไว้หรือตัวแยกประเภทอื่น ๆ แต่มีความละเอียดอ่อน - ฉันสนใจเฉพาะความแตกต่างของคลาส c จากคลาส a และ b เท่านั้น ฉันสามารถเรียนสระว่ายน้ำ a และ b แต่มีวิธีที่ดีในการใช้ความรู้เบื้องต้นว่าวัตถุที่ไม่ใช่ c ทั้งหมดน่าจะสร้างกลุ่มที่แตกต่างกันสองกลุ่มหรือไม่? ฉันต้องการใช้ฟอเรสต์แบบสุ่มหรือตัวแปรเนื่องจากมันแสดงให้เห็นว่ามีประสิทธิภาพสำหรับข้อมูลที่คล้ายกับของฉัน แต่ฉันมั่นใจได้ว่าจะลองวิธีอื่น

5
การยืมข้อมูลหมายความว่าอย่างไร
ฉันมักจะพูดคุยเกี่ยวกับการยืมข้อมูลหรือการแบ่งปันข้อมูลในแบบจำลองลำดับชั้นแบบเบย์ ฉันดูเหมือนจะไม่ได้รับคำตอบที่ตรงเกี่ยวกับความหมายของสิ่งนี้จริง ๆ และถ้ามันเป็นเอกลักษณ์ของแบบจำลองลำดับชั้นแบบเบย์ ฉันได้รับแนวคิด: บางระดับในลำดับชั้นของคุณใช้พารามิเตอร์ร่วมกัน ฉันไม่รู้ว่านี่แปลว่า "การยืมข้อมูล" อย่างไร "การขอยืมข้อมูล" / "การแบ่งปันข้อมูล" เป็นคำที่ผู้คนอยากจะทิ้ง มีตัวอย่างของ posteriors แบบปิดที่แสดงปรากฏการณ์การแชร์นี้หรือไม่ การวิเคราะห์แบบเบย์นี้มีลักษณะเฉพาะหรือไม่? โดยทั่วไปเมื่อฉันเห็นตัวอย่างของ "การยืมข้อมูล" พวกเขาเป็นเพียงโมเดลผสม บางทีฉันอาจเรียนรู้โมเดลนี้ในแบบที่ล้าสมัย แต่ฉันไม่เห็นการแบ่งปันใด ๆ ฉันไม่สนใจที่จะเริ่มต้นการอภิปรายเชิงปรัชญาเกี่ยวกับวิธีการ ฉันแค่อยากรู้เกี่ยวกับการใช้คำนี้

4
น้ำหนักเบต้าแบบมาตรฐานสำหรับการถดถอยหลายระดับ
เราจะได้น้ำหนักที่ถดถอยแบบมาตรฐาน (เอฟเฟกต์คงที่) จากการถดถอยหลายระดับได้อย่างไร และในฐานะ "Add-on": วิธีที่ง่ายที่สุดในการรับน้ำหนักมาตรฐานเหล่านี้จากmer-object คืออะไร (จากlmerฟังก์ชั่นของlme4แพ็คเกจในR)


1
การจัดการความสัมพันธ์อัตโนมัติสูงใน MCMC
ฉันกำลังสร้างแบบจำลองเบย์แบบลำดับชั้นที่ค่อนข้างซับซ้อนสำหรับการวิเคราะห์เมตาโดยใช้ R และ JAGS ลดความซับซ้อนของบิตสองระดับที่สำคัญของแบบจำลองมี โดยที่เป็นข้อสังเกตที่จุดสิ้นสุด (ในกรณีนี้จีเอ็มเทียบกับการปลูกพืชที่ไม่ใช่จีเอ็ม) ในการศึกษา ,เป็นผลสำหรับการศึกษา , s เป็นผลกระทบของตัวแปรระดับการศึกษาต่างๆ (สถานะการพัฒนาทางเศรษฐกิจของประเทศที่ ทำการศึกษาชนิดพันธุ์พืชวิธีการศึกษา ฯลฯ ) จัดทำดัชนีโดยกลุ่มฟังก์ชันและyij=αj+ϵiyij=αj+ϵi y_{ij} = \alpha_j + \epsilon_i αj=∑hγh(j)+ϵjαj=∑hγh(j)+ϵj\alpha_j = \sum_h \gamma_{h(j)} + \epsilon_jyijyijy_{ij}iiijjjαjαj\alpha_jjjjγγ\gammahhhϵϵ\epsilons เป็นเงื่อนไขข้อผิดพลาด โปรดทราบว่า s ไม่ใช่สัมประสิทธิ์ของตัวแปรจำลอง แต่มีตัวแปรแตกต่างกันสำหรับค่าระดับการศึกษาที่แตกต่างกัน ตัวอย่างเช่นมีสำหรับประเทศกำลังพัฒนาและสำหรับประเทศที่พัฒนาแล้ว γγ\gammaγγ\gammaγdevelopingγdeveloping\gamma_{developing}γdevelopedγdeveloped\gamma_{developed} ฉันสนใจที่จะประเมินค่าของ s เป็นหลัก ซึ่งหมายความว่าการทิ้งตัวแปรระดับการศึกษาจากตัวแบบไม่ใช่ตัวเลือกที่ดี γγ\gamma มีความสัมพันธ์สูงระหว่างตัวแปรระดับการศึกษาหลายอย่างและฉันคิดว่าสิ่งนี้กำลังสร้างความสัมพันธ์อัตโนมัติขนาดใหญ่ในเครือข่าย MCMC ของฉัน พล็อตการวินิจฉัยนี้แสดงให้เห็นถึงวิถีลูกโซ่ (ซ้าย) และผลสัมพันธ์อัตโนมัติ (ขวา): จากผลของความสัมพันธ์อัตโนมัติฉันได้ขนาดตัวอย่างที่มีประสิทธิภาพ 60-120 จาก …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.