คำถามติดแท็ก hierarchical-bayesian

แบบจำลองเบย์เซียนตามลำดับชั้นระบุลำดับชั้นของพารามิเตอร์และไฮเปอร์เปอร์ริเออร์บนพารามิเตอร์ของการแจกแจงก่อนหน้า

2
ทฤษฎีบท Bayes ที่ปรับปรุงแล้วของ XKCD: จริง ๆ แล้วมีเหตุผลไหม?
ฉันรู้ว่านี่มาจากการ์ตูนที่มีชื่อเสียงสำหรับการใช้ประโยชน์จากแนวโน้มการวิเคราะห์บางอย่างแต่จริงๆแล้วมันดูมีเหตุผลหลังจากผ่านการจ้องมองไม่กี่นาที ใครสามารถบอกฉันว่า "การปรับเปลี่ยน Bayes theorem " นี้ทำอะไรได้บ้าง

2
อะไรคือความแตกต่างระหว่าง“ การเรียนรู้ลึก” และการสร้างแบบจำลองหลายระดับ / ลำดับชั้น?
"การเรียนรู้ลึก" เป็นอีกคำหนึ่งสำหรับการสร้างแบบจำลองหลายระดับ / ลำดับชั้นหรือไม่? ฉันคุ้นเคยกับหลังมากกว่าเดิม แต่จากสิ่งที่ฉันสามารถบอกได้ความแตกต่างหลักไม่ได้อยู่ในคำจำกัดความของพวกเขา แต่วิธีที่พวกเขาใช้และประเมินผลภายในโดเมนแอปพลิเคชันของพวกเขา ดูเหมือนว่าจำนวนโหนดในแอปพลิเคชั่น "การเรียนรู้ลึก" โดยทั่วไปมีขนาดใหญ่กว่าและใช้รูปแบบลำดับชั้นทั่วไปในขณะที่การประยุกต์ใช้การสร้างแบบจำลองหลายระดับมักใช้ความสัมพันธ์แบบลำดับชั้นที่เลียนแบบกระบวนการกำเนิดแบบจำลอง การใช้ลำดับชั้นทั่วไปในโดเมนสถิติประยุกต์ (การสร้างแบบจำลองลำดับชั้น) จะถือเป็นแบบจำลอง "ไม่ถูกต้อง" ของปรากฏการณ์ในขณะที่การสร้างแบบจำลองลำดับชั้นของโดเมนเฉพาะอาจถือได้ว่าเป็นการทำลายวัตถุประสงค์ในการสร้างเครื่องเรียนรู้ทั่วไป สองสิ่งนี้เป็นเครื่องจักรชนิดเดียวกันจริงๆหรือไม่ภายใต้ชื่อที่ต่างกันสองชื่อ

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
ปัญหาของนักบวชเชิงประจักษ์คืออะไร?
ในวรรณคดีบางครั้งฉันก็กลั้นกับคำพูดการเลือกนักบวชที่ขึ้นอยู่กับข้อมูล (เช่น Zellners g- ก่อน) จะถูกวิพากษ์วิจารณ์จากมุมมองทางทฤษฎี ปัญหาจะเกิดขึ้นที่ไหนหากข้อมูลก่อนหน้านี้ไม่ได้ถูกเลือกโดยอิสระจากข้อมูล

1
ในตัวอย่างโรงเรียน 8 แห่งของเจลแมนเหตุใดจึงมีข้อผิดพลาดมาตรฐานของการประมาณการส่วนบุคคลที่สันนิษฐาน
บริบท: ในตัวอย่างของโรงเรียน 8 แห่งของ Gelman (การวิเคราะห์ข้อมูลแบบเบย์, รุ่นที่ 3, Ch 5.5) มีการทดลองแบบขนานแปดครั้งใน 8 โรงเรียนที่ทำการทดสอบผลของการฝึก การทดสอบแต่ละครั้งให้ผลลัพธ์โดยประมาณสำหรับประสิทธิภาพของการฝึกและข้อผิดพลาดมาตรฐานที่เกี่ยวข้อง ผู้เขียนสร้างแบบจำลองลำดับชั้นสำหรับจุดข้อมูล 8 จุดของลักษณะพิเศษการฝึกดังนี้: yi∼N(θi,sei)θi∼N(μ,τ)yi∼N(θi,sei)θi∼N(μ,τ) y_i \sim N(\theta_i, se_i) \\ \theta_i \sim N(\mu, \tau) คำถาม ในรูปแบบนี้พวกเขาคิดว่าseiseise_iเป็นที่รู้จักกัน ฉันไม่เข้าใจสมมติฐานนี้ - ถ้าเรารู้สึกว่าเรามีรูปแบบθiθi\theta_iทำไมเราไม่ทำเช่นเดียวกันสำหรับseiseise_i ? ฉันได้ตรวจสอบกระดาษต้นฉบับของ Rubinแนะนำตัวอย่างโรงเรียน 8 แห่งแล้วและที่นั่นผู้เขียนก็บอกเช่นนั้น (หน้า 382): ข้อสันนิษฐานของความเป็นมาตรฐานและข้อผิดพลาดมาตรฐานที่รู้จักนั้นเกิดขึ้นเป็นประจำเมื่อเราสรุปการศึกษาโดยมีผลกระทบโดยประมาณและข้อผิดพลาดมาตรฐานและเราจะไม่ถามคำถามการใช้งานที่นี่ เพื่อสรุปทำไมเราไม่รูปแบบseiseise_i ? ทำไมเราปฏิบัติต่อมันอย่างที่รู้กัน?

2
การประมาณแบบเบย์ของ
คำถามนี้เป็นการติดตามด้านเทคนิคของคำถามนี้ ฉันมีปัญหาในการทำความเข้าใจและจำลองแบบจำลองที่แสดงในRaftery (1988): การอนุมานสำหรับพารามิเตอร์binomial : แนวทาง Bayes แบบลำดับชั้นNNNใน WinBUGS / OpenBUGS / JAGS มันไม่เพียงเกี่ยวกับรหัสเท่านั้นดังนั้นควรอยู่ในหัวข้อที่นี่ พื้นหลัง ให้เป็นชุดของการนับความสำเร็จจากการกระจายทวินามด้วยไม่รู้จักNและθ นอกจากนี้ฉันคิดว่าNตามการกระจายของปัวซองด้วยพารามิเตอร์μ (ดังที่กล่าวไว้ในบทความ) จากนั้นแต่ละx ฉันมีการกระจาย Poisson ที่มีค่าเฉลี่ยλ = μ θ ฉันต้องการที่จะระบุไพรเออร์ในแง่ของλและθx=(x1,…,xn)x=(x1,…,xn)x=(x_{1},\ldots,x_{n})NNNθθ\thetaNNNμμ\muxixix_{i}λ=μθλ=μθ\lambda = \mu \thetaλλ\lambdaθθ\theta สมมติว่าผมไม่ได้มีความรู้ใด ๆ ก่อนที่ดีเกี่ยวกับหรือθผมต้องการที่จะกำหนดไพรเออร์ที่ไม่แสดงข้อมูลทั้งλและθ พูด, ไพรเออร์ของฉันλ ~ G เมตรเมตร ( 0.001 , 0.001 )และθ ~ U n ฉันฉo R เมตร ( 0 …

2
การกระจายก่อนหน้านี้สามารถ / ควรใช้สำหรับความแปรปรวนในตัวแบบเบย์เอซันแบบลำดับชั้นเมื่อความแปรปรวนเฉลี่ยมีความน่าสนใจอย่างไร
ในกระดาษของเขาอ้างกันอย่างแพร่หลายกระจายก่อนหน้าสำหรับพารามิเตอร์ความแปรปรวนในรูปแบบลำดับชั้น (916 การอ้างอิงจนถึง Google Scholar) Gelman เสนอว่าการแจกแจงก่อนหน้าแบบไม่ให้ข้อมูลที่ดีสำหรับความแปรปรวนในแบบจำลอง Bayesian แบบลำดับชั้นคือการกระจายแบบสม่ำเสมอและการกระจายครึ่งหนึ่ง หากฉันเข้าใจสิ่งที่ถูกต้องสิ่งนี้จะทำงานได้ดีเมื่อเป็นพารามิเตอร์ตำแหน่ง (เช่นค่าเฉลี่ย) เป็นสิ่งที่น่าสนใจหลัก บางครั้งพารามิเตอร์ความแปรปรวนเป็นที่สนใจหลักอย่างไรก็ตามเช่นเมื่อวิเคราะห์ข้อมูลการตอบสนองของมนุษย์จากงานเวลาหมายถึงความแปรปรวนของเวลามักจะวัดที่น่าสนใจ ในกรณีเหล่านั้นมันไม่ชัดเจนสำหรับฉันว่าความสามารถแปรผันตามลำดับชั้นได้อย่างไรเช่นการแจกแจงแบบเดียวกันเนื่องจากฉันหลังจากการวิเคราะห์ต้องการได้รับความน่าเชื่อถือของความแปรปรวนเฉลี่ยทั้งในระดับผู้เข้าร่วมและในระดับกลุ่ม คำถามของฉันคือ: การกระจายแบบใดที่แนะนำเมื่อสร้างแบบจำลองแบบเบย์แบบลำดับชั้นเมื่อความแปรปรวนของข้อมูลเป็นความสนใจหลัก ฉันรู้ว่าการแจกแจงแกมมาสามารถแก้ไขได้โดยระบุค่าเฉลี่ยและ SD ยกตัวอย่างเช่นแบบลำดับชั้นด้านล่างเป็นจากหนังสือ Kruschke ของการทำเบส์วิเคราะห์ข้อมูล แต่ Gelman สรุปปัญหาบางอย่างกับการกระจายแกมม่าในบทความของเขาและฉันจะขอบคุณสำหรับคำแนะนำทางเลือกโดยเฉพาะอย่างยิ่งทางเลือกที่ไม่ยากที่จะทำงานใน BUGS / JAGS

1
ทำไมการเพิ่มเอฟเฟกต์ความล่าช้าจึงเพิ่มความเบี่ยงเบนในโมเดลลำดับชั้นแบบเบย์?
ข้อมูลประกอบ:ขณะนี้ฉันกำลังทำงานเปรียบเทียบรูปแบบลำดับชั้นแบบเบย์ต่างๆ ข้อมูลyijyijy_{ij}มีตัวเลขของการวัดเป็นอยู่ที่ดีสำหรับผู้เข้าร่วมiiiและเวลาที่ jjjjฉันมีผู้เข้าร่วมประมาณ 1,000 คนและผู้สังเกตการณ์ 5 ถึง 10 คนต่อผู้เข้าร่วม เช่นเดียวกับชุดข้อมูลระยะยาวส่วนใหญ่ฉันคาดหวังว่าจะเห็นรูปแบบความสัมพันธ์อัตโนมัติซึ่งการสังเกตที่ใกล้เวลาจะมีความสัมพันธ์มากกว่ารูปแบบอื่น ๆ ลดความซับซ้อนของบางสิ่งบางอย่างโมเดลพื้นฐานมีดังนี้: yij∼N(μij,σ2)yij∼N(μij,σ2)y_{ij} \sim N(\mu_{ij}, \sigma^2) ฉันกำลังเปรียบเทียบรุ่นที่ไม่มีความล่าช้า: μij=β0iμij=β0i\mu_{ij} = \beta_{0i} ด้วยความล่าช้าแบบ: μij=β0i+β1(yi(j−1)−β0i)μij=β0i+β1(yi(j−1)−β0i)\mu_{ij} = \beta_{0i} + \beta_{1} (y_{i(j-1)} - \beta_{0i}) β0iβ0i\beta_{0i}β1β1\beta_1yi0yi0y_{i0} ผลลัพธ์ที่ฉันได้รับบ่งชี้ว่า: พารามิเตอร์ lag มีค่าประมาณ. 18, 95% CI [.14, .21] คือมันไม่ใช่ศูนย์ ความเบี่ยงเบนเฉลี่ยและ DIC เพิ่มขึ้นหลายร้อยเมื่อความล่าช้ารวมอยู่ในโมเดล การตรวจสอบการคาดการณ์หลังแสดงให้เห็นว่าการรวมเอฟเฟกต์ความล่าช้าแบบจำลองสามารถกู้คืนความสัมพันธ์อัตโนมัติในข้อมูลได้ดีขึ้น ดังนั้นโดยสรุปพารามิเตอร์ lag ที่ไม่เป็นศูนย์และการตรวจสอบการทำนายหลังแนะนำโมเดล lag จะดีกว่า ยังหมายถึงความเบี่ยงเบนและ …

1
เหตุใดการกำหนดพารามิเตอร์ซ้ำซ้อนจึงเพิ่มความเร็วใน Gibbs MCMC
ในหนังสือของ Gelman & Hill (2007) (การวิเคราะห์ข้อมูลโดยใช้การถดถอยและโมเดลหลายระดับ / ลำดับชั้น) ผู้เขียนอ้างว่าการรวมพารามิเตอร์ที่ซ้ำซ้อนสามารถช่วยเร่ง MCMC ได้ ตัวอย่างที่กำหนดเป็นรูปแบบที่ไม่ใช่ซ้อนกันของ "flight simulator" (Eq 13.9): yiγjδk∼N(μ+γj[i]+δk[i],σ2y)∼N(0,σ2γ)∼N(0,σ2δ)yi∼N(μ+γj[i]+δk[i],σy2)γj∼N(0,σγ2)δk∼N(0,σδ2) \begin{align} y_i &\sim N(\mu + \gamma_{j[i]} + \delta_{k[i]}, \sigma^2_y) \\ \gamma_j &\sim N(0, \sigma^2_\gamma) \\ \delta_k &\sim N(0, \sigma^2_\delta) \end{align} พวกเขาแนะนำการแก้ไขใหม่เพิ่มพารามิเตอร์ค่าเฉลี่ยและดังนี้:μγμγ\mu_\gammaμδμδ\mu_\delta γj∼N(μγ,σ2γ)δk∼N(μδ,σ2δ)γj∼N(μγ,σγ2)δk∼N(μδ,σδ2) \begin{align} \gamma_j \sim N(\mu_\gamma, \sigma^2_\gamma) \\ \delta_k \sim N(\mu_\delta, \sigma^2_\delta) \end{align} …

2
พารามิเตอร์ด้านหลังของ Wishart-Wishart คืออะไร?
เมื่อ infering ความแม่นยำเมทริกซ์ของการกระจายปกติใช้ในการสร้างNเวกเตอร์ D-มิติx 1 , . , x N x iΛΛ\boldsymbol{\Lambda}ยังไม่มีข้อความNNx1, . . , xยังไม่มีข้อความx1,..,xN\mathbf{x_1},..,\mathbf{x_N} เรามักจะวาง Wishart ไว้ก่อนหน้าΛเนื่องจากการแจกแจง Wishart นั้นเป็นคอนจูเกตก่อนที่จะมีการตกตะกอนของการแจกแจงปกติแบบหลายตัวแปรที่มีค่าเฉลี่ยและตัวแปรที่ไม่รู้จัก: knownxi∼N(μ,Λ−1)xi∼N(μ,Λ−1)\begin{align} \mathbf{x_i} &\sim \mathcal{N}(\boldsymbol{\mu, \Lambda^{-1}}) \\ \end{align}ΛΛ\boldsymbol{\Lambda} ที่υเป็นองศาอิสระและΛ0เมทริกซ์ขนาด ในการเพิ่มความทนทานและความยืดหยุ่นให้กับโมเดลเราได้ใส่ไฮเปอร์ไพรส์ไว้เหนือพารามิเตอร์ของ Wishart ตัวอย่างเช่นGörürและ Rasmussenแนะนำ: Λ 0Λ∼W(υ,Λ0)Λ∼W(υ,Λ0)\begin{align} \mathbf{\Lambda} &\sim \mathcal{W}(\upsilon, \boldsymbol{\Lambda_0}) \\ \end{align}υυ\upsilonΛ0Λ0\boldsymbol{\Lambda_0} โดยที่Gคือ tha Gamma distributionΛ01υ−D+1∼W(D,1DΛx)∼G(1,1D)Λ0∼W(D,1DΛx)1υ−D+1∼G(1,1D)\begin{align} \mathbf{\Lambda_0} &\sim \mathcal{W}(D, \frac{1}{D}\boldsymbol{\Lambda_x}) \\ …

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

1
ทำไม LKJcorr เป็นเมทริกซ์สหสัมพันธ์ที่ดีมาก่อน?
ฉันกำลังอ่านบทที่ 13 "การผจญภัยในความแปรปรวนร่วม" ในหนังสือ ( สุดยอด ) การทบทวนทางสถิติโดย Richard McElreathซึ่งเขานำเสนอรูปแบบลำดับชั้นดังต่อไปนี้: ( Rเป็นเมทริกซ์สหสัมพันธ์) ผู้เขียนอธิบายว่าLKJcorrมันเป็นข้อมูลที่อ่อนแอก่อนที่จะทำงานเป็น normalizing ก่อนสำหรับเมทริกซ์ความสัมพันธ์ แต่ทำไมถึงเป็นเช่นนั้น? มีการLKJcorrกระจายแบบใดที่ทำให้เป็นแบบอย่างที่ดีสำหรับเมทริกซ์สหสัมพันธ์? มีนักบวชที่ดีคนอื่น ๆ ที่ใช้ในการฝึกอบรมสำหรับความสัมพันธ์?

5
การยืมข้อมูลหมายความว่าอย่างไร
ฉันมักจะพูดคุยเกี่ยวกับการยืมข้อมูลหรือการแบ่งปันข้อมูลในแบบจำลองลำดับชั้นแบบเบย์ ฉันดูเหมือนจะไม่ได้รับคำตอบที่ตรงเกี่ยวกับความหมายของสิ่งนี้จริง ๆ และถ้ามันเป็นเอกลักษณ์ของแบบจำลองลำดับชั้นแบบเบย์ ฉันได้รับแนวคิด: บางระดับในลำดับชั้นของคุณใช้พารามิเตอร์ร่วมกัน ฉันไม่รู้ว่านี่แปลว่า "การยืมข้อมูล" อย่างไร "การขอยืมข้อมูล" / "การแบ่งปันข้อมูล" เป็นคำที่ผู้คนอยากจะทิ้ง มีตัวอย่างของ posteriors แบบปิดที่แสดงปรากฏการณ์การแชร์นี้หรือไม่ การวิเคราะห์แบบเบย์นี้มีลักษณะเฉพาะหรือไม่? โดยทั่วไปเมื่อฉันเห็นตัวอย่างของ "การยืมข้อมูล" พวกเขาเป็นเพียงโมเดลผสม บางทีฉันอาจเรียนรู้โมเดลนี้ในแบบที่ล้าสมัย แต่ฉันไม่เห็นการแบ่งปันใด ๆ ฉันไม่สนใจที่จะเริ่มต้นการอภิปรายเชิงปรัชญาเกี่ยวกับวิธีการ ฉันแค่อยากรู้เกี่ยวกับการใช้คำนี้

2
ทำไมความน่าจะเป็นสูงสุดที่ จำกัด จึงให้ผลต่างประมาณที่ดีขึ้น (ไม่เอนเอียง)?
ฉันกำลังอ่านบทความทฤษฎีของ Doug Bates บนแพ็คเกจ lme4 ของ R เพื่อทำความเข้าใจกับ nitty-gritty ของแบบจำลองที่ผสมกันและพบผลลัพธ์ที่น่าสนใจที่ฉันต้องการทำความเข้าใจให้ดีขึ้นเกี่ยวกับการใช้โอกาสสูงสุดแบบ จำกัด (REML) เพื่อประเมินความแปรปรวน . ในมาตรา 3.3 ในเกณฑ์ REML เขากล่าวว่าการใช้ REML ในการประมาณค่าความแปรปรวนเกี่ยวข้องอย่างใกล้ชิดกับการใช้องศาความเป็นอิสระในการแก้ไขเมื่อประเมินความแปรปรวนจากส่วนเบี่ยงเบนที่เหลืออยู่ในตัวแบบเชิงเส้นพอดี โดยเฉพาะอย่างยิ่ง "แม้ว่าโดยปกติจะไม่ได้มาในลักษณะนี้" องศาของการแก้ไขอิสรภาพสามารถทำได้โดยการประเมินความแปรปรวนผ่านการปรับให้เหมาะสมของ "เกณฑ์ REML" (Eq. (28)) เกณฑ์ REML นั้นมีความเป็นไปได้เพียงอย่างเดียว แต่พารามิเตอร์เชิงเส้นพอดีได้ถูกกำจัดโดยการทำให้เป็นขอบ (แทนที่จะตั้งค่าให้เท่ากับการประมาณแบบพอดีซึ่งจะทำให้ความแปรปรวนตัวอย่างแบบเอนเอียง) ฉันทำคณิตศาสตร์และตรวจสอบผลลัพธ์ที่อ้างสิทธิ์สำหรับโมเดลเชิงเส้นอย่างง่ายที่มีเอฟเฟกต์คงที่เท่านั้น สิ่งที่ฉันกำลังดิ้นรนคือการตีความ มีมุมมองบางอย่างที่เป็นธรรมชาติหรือไม่ที่จะได้รับการประมาณค่าความแปรปรวนโดยการปรับความน่าจะเป็นที่พารามิเตอร์ทางพอดีได้ถูกทำให้ลดลง? มันให้ความรู้สึกเหมือนกับ Bayesian ราวกับว่าฉันกำลังคิดถึงโอกาสที่จะเป็นหลังและปรับพารามิเตอร์ที่เหมาะสมเหมือนพวกมันเป็นตัวแปรสุ่ม หรือเหตุผลหลักเกี่ยวกับคณิตศาสตร์เพียงอย่างเดียว - มันทำงานในกรณีเชิงเส้น แต่ยังเป็น generalizable?

1
ความหนาแน่นสูงเกินไปสำหรับโมเดล Gamma-Poisson แบบลำดับชั้น
ในรูปแบบลำดับชั้นของข้อมูลที่ มันดูเหมือนจะเป็นเรื่องปกติในทางปฏิบัติเพื่อเลือกค่า (ว่าค่าเฉลี่ยและความแปรปรวนของการแจกแจงแกมมาประมาณตรงกับค่าเฉลี่ยและความแปรปรวนของข้อมูล (เช่น Clayton และ Kaldor, 1987 "Empirical Bayes Estimates ของความเสี่ยงสัมพัทธ์ตามมาตรฐานอายุสำหรับการทำแผนที่โรค" Biometrics ) เห็นได้ชัดว่านี่เป็นเพียงโซลูชันเฉพาะกิจแต่เนื่องจากมันจะเกินความเชื่อมั่นของนักวิจัยในพารามิเตอร์yyyy∼Poisson(λ)y∼Poisson(λ)y \sim \textrm{Poisson}(\lambda) λ∼Gamma(α,β)λ∼Gamma(α,β)\lambda \sim \textrm{Gamma}(\alpha, \beta)α,β)α,β)\alpha, \beta)yyy(α,β)(α,β)(\alpha, \beta)และความผันผวนเล็กน้อยในข้อมูลที่รับรู้อาจมีผลต่อความหนาแน่นของแกมม่าแม้ว่ากระบวนการสร้างข้อมูลพื้นฐานจะยังคงเหมือนเดิม นอกจากนี้ในการวิเคราะห์ข้อมูลแบบเบย์ (2nd Ed) Gelman เขียนว่าวิธีนี้คือ " เลอะเทอะ ;" ในหนังสือและบทความนี้ (เริ่มต้นที่ 3232) เขาแนะนำว่าควรเลือกความหนาแน่น hyperpriorในแบบที่คล้ายกับตัวอย่างเนื้องอกหนู (เริ่มต้นที่ 130)p(α,β)p(α,β)p(\alpha, \beta) แม้ว่าจะเป็นที่ชัดเจนว่ายอมรับได้ตราบใดที่มันสร้างความหนาแน่นของหลังที่ จำกัด แต่ฉันไม่พบตัวอย่างของความหนาแน่น hyperprior ที่นักวิจัยได้ใช้สำหรับปัญหานี้ในอดีต ฉันจะซาบซึ้งอย่างยิ่งถ้ามีคนชี้ให้ฉันไปที่หนังสือหรือบทความที่ใช้ความหนาแน่นสูงเกินไปเพื่อประเมินแบบจำลอง Poisson-Gamma เป็นการดีที่ฉันสนใจในที่ค่อนข้างแบนและจะถูกครอบงำโดยข้อมูลในตัวอย่างเนื้องอกหนูหรือการอภิปรายเปรียบเทียบข้อกำหนดทางเลือกหลายประการและการแลกเปลี่ยนที่เกี่ยวข้องกับแต่ละp(α,β)p(α,β)p(\alpha, \beta)p(α,β)p(α,β)p(\alpha, \beta)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.