คำถามติดแท็ก stan

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
วิธีการสรุปช่วงเวลาที่น่าเชื่อถือสำหรับผู้ชมทางการแพทย์
ด้วยสแตนและส่วนหน้าแพคเกจrstanarmหรือฉันสามารถวิเคราะห์ข้อมูลทางคชกรรมที่สุดเท่าที่ฉันเคยทำมาก่อนกับการผสมรูปแบบเช่นbrms lmeในขณะที่ฉันมีหนังสือและบทความส่วนใหญ่โดย Kruschke-Gelman-Wagenmakers- ฯลฯ บนโต๊ะของฉันสิ่งเหล่านี้ไม่ได้บอกวิธีสรุปผลลัพธ์สำหรับผู้ชมทางการแพทย์ที่ขาดความโกรธแค้นของ Skyesa จาก Bayesian และ Charybdis ของผู้ตรวจสอบทางการแพทย์ ( "เราต้องการความสำคัญไม่ใช่สิ่งที่กระจาย") ตัวอย่าง: ความถี่กระเพาะอาหาร (1 / นาที) วัดเป็นสามกลุ่ม; การควบคุมสุขภาพเป็นข้อมูลอ้างอิง มีการวัดหลายอย่างสำหรับผู้เข้าร่วมแต่ละคนดังนั้นฉันมักใช้แบบผสมต่อไปนี้lme: summary(lme(freq_min~ group, random = ~1|study_id, data = mo)) ผลลัพธ์ที่แก้ไขเล็กน้อย: Fixed effects: freq_min ~ group Value Std.Error DF t-value p-value (Intercept) 2.712 0.0804 70 33.7 0.0000 groupno_symptoms 0.353 0.1180 27 …

1
สแตน
ผมจะผ่านเอกสารสแตนซึ่งสามารถดาวน์โหลดได้จากที่นี่ ฉันมีความสนใจเป็นพิเศษในการใช้งานการวินิจฉัยของเจลแมน - รูบิน กระดาษดั้งเดิมGelman & Rubin (1992)กำหนดปัจจัยการลดขนาดที่อาจเกิดขึ้น (PSRF) ดังนี้ Let เป็นฉัน TH โซ่มาร์คอฟชิมและให้มีการรวมMโซ่อิสระตัวอย่าง ให้ˉ Xฉัน⋅เป็นค่าเฉลี่ยจากฉันห่วงโซ่, th และˉ X ⋅ ⋅เป็นค่าเฉลี่ยโดยรวม กำหนด W = 1Xฉัน, 1, … , Xฉัน, NXi,1,…,Xi,NX_{i,1}, \dots , X_{i,N}ผมiiMMMX¯ฉัน⋅X¯i⋅\bar{X}_{i\cdot}ผมiiX¯⋅ ⋅X¯⋅⋅\bar{X}_{\cdot \cdot} ที่ s 2 m =1W= 1MΣm = 1Ms2ม.,W=1M∑m=1Msm2,W = \dfrac{1}{M} \sum_{m=1}^{M} {s^2_m}, และกำหนด B B …

2
พารามิเตอร์ที่ไม่มีตัวคั่นที่กำหนดใน Stan
ผมได้เริ่มต้นเพียงเพื่อเรียนรู้ที่จะใช้สแตนrstanและ นอกจากว่าฉันมักจะสับสนเกี่ยวกับวิธีการทำงานของ JAGS / BUGS ฉันคิดว่าคุณต้องกำหนดการแจกจ่ายก่อนหน้าบางชนิดสำหรับพารามิเตอร์ทุกตัวในโมเดลที่จะดึงมา ดูเหมือนว่าคุณไม่จำเป็นต้องทำสิ่งนี้ใน Stan ตามเอกสารประกอบของมัน นี่คือรูปแบบตัวอย่างที่พวกเขาให้ที่นี่ data { int<lower=0> J; // number of schools real y[J]; // estimated treatment effects real<lower=0> sigma[J]; // s.e. of effect estimates } parameters { real theta[J]; real mu; real<lower=0> tau; } model { theta ~ normal(mu, tau); y ~ normal(theta, …

1
Hamiltonian Monte Carlo และการเว้นวรรคพารามิเตอร์ที่ไม่ต่อเนื่อง
ฉันเพิ่งเริ่มสร้างแบบจำลองในสแตน ; เพื่อสร้างความคุ้นเคยกับเครื่องมือฉันกำลังทำงานผ่านแบบฝึกหัดในการวิเคราะห์ข้อมูลแบบเบย์ (2nd ed.) Waterbuck ออกกำลังกายซึมว่าข้อมูลกับ( N , θ )ที่ไม่รู้จัก ตั้งแต่มิล Monte Carlo ไม่อนุญาตให้มีพารามิเตอร์ที่ไม่ต่อเนื่องผมเคยประกาศNเป็นจริง∈ [ 72 , ∞ )และรหัสการกระจายทวินามจริงมูลค่าโดยใช้ฟังก์ชั่นn ∼ ทวินาม( N, θ )n∼binomial(N,θ)n \sim \text{binomial}(N, \theta)( N, θ )(N,θ)(N, \theta)ยังไม่มีข้อความNN∈ [ 72 , ∞ )∈[72,∞)\in [72, \infty)lbeta ฮิสโตแกรมของผลลัพธ์ดูเหมือนจะเหมือนกับสิ่งที่ฉันพบโดยคำนวณความหนาแน่นด้านหลังโดยตรง อย่างไรก็ตามฉันกังวลว่าอาจมีเหตุผลบางอย่างที่ฉันไม่ควรเชื่อถือผลลัพธ์เหล่านี้โดยทั่วไป เนื่องจากการอนุมานมูลค่าจริงบนกำหนดความน่าจะเป็นบวกให้กับค่าที่ไม่ใช่จำนวนเต็มเรารู้ว่าค่าเหล่านี้เป็นไปไม่ได้เนื่องจาก waterbuck ที่เป็นเศษส่วนไม่มีอยู่จริง ในทางกลับกันผลลัพธ์ดูเหมือนจะดีดังนั้นการทำให้เข้าใจง่ายจะไม่มีผลต่อการอนุมานในกรณีนี้ยังไม่มีข้อความNN มีหลักการหรือกฎของหัวแม่มือสำหรับการสร้างแบบจำลองด้วยวิธีนี้หรือไม่หรือเป็นวิธีการ "ส่งเสริม" พารามิเตอร์ที่ไม่ต่อเนื่องกับการปฏิบัติที่ไม่ดีจริงหรือไม่?

2
เหตุใดจึงมีคำแนะนำไม่ให้ใช้ Jeffreys หรือนักบวชที่ใช้เอนโทรปีสำหรับแซมเพลอร์ของ MCMC
บนหน้า wikiผู้พัฒนาของรัฐสแตน: หลักการบางอย่างที่เราไม่ชอบ: ค่าคงที่, เจฟฟรีย์, ค่าเอนโทรปี แต่ฉันเห็นคำแนะนำการกระจายตามปกติมากมาย จนถึงตอนนี้ฉันใช้วิธีเบย์ซึ่งไม่ได้ใช้การสุ่มตัวอย่างและยินดีที่ได้เข้าใจว่าทำไมเป็นตัวเลือกที่ดีสำหรับโอกาสทวินามθ ∼ Beta ( α = 12, β= 12)θ∼Beta(α=12,β=12)\theta \sim \text{Beta}\left(\alpha=\frac{1}{2},\beta=\frac{1}{2}\right)
11 bayesian  mcmc  prior  pymc  stan 

2
ฉันจะสร้างแบบจำลองสัดส่วนด้วย BUGS / JAGS / STAN ได้อย่างไร
ฉันกำลังพยายามสร้างแบบจำลองที่การตอบสนองเป็นสัดส่วน (อันที่จริงแล้วมันคือส่วนแบ่งของคะแนนโหวตที่บุคคลได้รับจากการเลือกตั้ง) การกระจายของมันไม่ปกติดังนั้นฉันตัดสินใจที่จะจำลองด้วยการแจกแจงแบบเบต้า ฉันยังมีผู้ทำนายหลายคน อย่างไรก็ตามฉันไม่รู้วิธีเขียนใน BUGS / JAGS / STAN (JAGS จะเป็นตัวเลือกที่ดีที่สุดของฉัน แต่มันก็ไม่สำคัญอะไร) ปัญหาของฉันคือฉันสร้างผลรวมของพารามิเตอร์โดยตัวทำนาย แต่แล้วฉันจะทำอย่างไรกับมัน? รหัสจะเป็นแบบนี้ (ในรูปแบบของ JAGS) แต่ฉันไม่รู้วิธี "ลิงก์" y_hatและyพารามิเตอร์ for (i in 1:n) { y[i] ~ dbeta(alpha, beta) y_hat[i] <- a + b * x[i] } ( y_hatเป็นเพียงผลคูณของพารามิเตอร์และตัวทำนายดังนั้นความสัมพันธ์ที่กำหนดขึ้นได้aและbเป็นสัมประสิทธิ์ที่ฉันพยายามประเมินxเป็นตัวทำนาย) ขอบคุณสำหรับคำแนะนำของคุณ!

2
สแตนทำโปสเตอร์ทายผลล่วงหน้าได้หรือไม่?
สแตน (โดยเฉพาะอย่างยิ่ง rstan) มีสิ่งอำนวยความสะดวกในตัวเพื่อสร้างการกระจายหลังที่ทำนายได้หรือไม่? มันไม่ยากที่จะสร้างการกระจายจากสแตนพอดี แต่ฉันไม่อยากประดิษฐ์ล้อ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.