คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต


3
การประมาณพารามิเตอร์ของการแจกแจงแบบสม่ำเสมอ: ไม่เหมาะสมมาก่อน
เรามีตัวอย่าง Nจากการแจกแจงแบบสม่ำเสมอโดยที่ไม่ทราบประมาณจากข้อมูลXiXiX_i[0,θ][0,θ][0,\theta]θθ\thetaθθ\theta ดังนั้นกฎของเบย์ ... f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(\theta | {X_i}) = \frac{f({X_i}|\theta)f(\theta)}{f({X_i})} และโอกาสก็คือ: f(Xi|θ)=∏Ni=11θf(Xi|θ)=∏i=1N1θf({X_i}|\theta) = \prod_{i=1}^N \frac{1}{\theta} (แก้ไข: เมื่อ0≤Xi≤θ0≤Xi≤θ0 \le X_i \le \thetaสำหรับiทั้งหมดiiiและ 0 เป็นอย่างอื่น - ขอบคุณ whuber) แต่ไม่มีข้อมูลอื่น ๆ เกี่ยวกับθθ\thetaดูเหมือนว่าก่อนหน้านี้ควรมีสัดส่วน111 (เช่นรูปแบบเดียวกัน) หรือ1L1L\frac{1}{L} (Jeffreys ก่อนหน้า?) ใน[0,∞][0,∞][0,\infty]แต่อินทิกรัลของฉันไม่ มาบรรจบกันและฉันไม่แน่ใจว่าจะดำเนินการอย่างไร ความคิดใด ๆ

3
แบบฝึกหัดที่ 2.2 ขององค์ประกอบของการเรียนรู้ทางสถิติ
หนังสือเรียนจะสร้างข้อมูล 2 ระดับก่อนผ่าน: ซึ่งจะช่วยให้: แล้วมันจะถามว่า: ฉันพยายามที่จะแก้ปัญหานี้โดยการสร้างแบบจำลองนี้ครั้งแรกด้วยโมเดลกราฟิกนี้: ที่ไหน ccc คือฉลาก h(1≤h≤10)h(1≤h≤10)h\,(1\le h \le 10) คือดัชนีของค่าเฉลี่ยที่เลือก mchmhcm_h^cและ xxxเป็นจุดข้อมูล นี้จะให้ Pr(x∣mch)=Pr(mch∣h,c=blue)=Pr(mch∣h,c=orange)=Pr(h)=Pr(c)=N(mch,I/5)N((1,0)T,I)N((0,1)T,I)11012Pr(x∣mhc)=N(mhc,I/5)Pr(mhc∣h,c=blue)=N((1,0)T,I)Pr(mhc∣h,c=orange)=N((0,1)T,I)Pr(h)=110Pr(c)=12 \begin{align*} \Pr(x\mid m_h^c) =& \mathcal{N}(m_h^c,\mathbf{I}/5)\\ \Pr(m_h^c\mid h,c=\mathrm{blue}) =& \mathcal{N}((1,0)^T,\mathbf{I})\\ \Pr(m_h^c\mid h,c=\mathrm{orange}) =& \mathcal{N}((0,1)^T,\mathbf{I})\\ \Pr(h) =& \frac{1}{10}\\ \Pr(c) =& \frac{1}{2} \end{align*} ในทางตรงกันข้ามเขตแดนเป็น\} ด้วยกฎของเบย์เรามี{x:Pr(c=blue∣x)=Pr(c=orange∣x)}{x:Pr(c=blue∣x)=Pr(c=orange∣x)}\{x:\Pr(c=\mathrm{blue}\mid x)=\Pr(c=\mathrm{orange}\mid x)\} Pr(c∣x)=Pr(x∣c)=Pr(x∣c)Pr(c)∑cPr(x∣c)Pr(c)∑h∫mchPr(h)Pr(mch∣h,c)Pr(x∣mch)Pr(c∣x)=Pr(x∣c)Pr(c)∑cPr(x∣c)Pr(c)Pr(x∣c)=∑h∫mhcPr(h)Pr(mhc∣h,c)Pr(x∣mhc) \begin{align*} \Pr(c\mid x) =& \frac{\Pr(x\mid c)\Pr(c)}{\sum_c\Pr(x\mid c)\Pr(c)}\\ …

2
ค่าเดียวนี้ตรงกับการแจกแจงนั้นหรือไม่
นี่รู้สึกเหมือนเป็นคำถามที่ไร้เดียงสา แต่ฉันมีปัญหาในการดูคำตอบ ฉันมี 30 ชุดหนึ่งค่า ฉันได้รับค่าที่ 31 อย่างอิสระ สมมติฐานที่ว่างเปล่าคือค่าที่ 31 เป็นส่วนหนึ่งของการแจกแจงแบบเดียวกัน ทางเลือกคือมันแตกต่างกัน ฉันต้องการค่า p หรือค่าความน่าจะเป็นบางประเภท ฉันมีความคิดบางอย่าง: นี่คล้ายกับต้องการทำแบบทดสอบสองตัวอย่าง - ยกเว้นว่าสำหรับตัวอย่างที่สองฉันมีเพียงค่าเดียวและค่า 30 ค่าไม่จำเป็นต้องกระจายแบบปกติ หากแทนการวัด 30 รายการฉันมีการวัด 10,000 ตำแหน่งอันดับของการวัดเดี่ยวสามารถให้ข้อมูลที่เป็นประโยชน์ได้ ฉันจะคำนวณความน่าจะเป็นหรือค่า p นี้ได้อย่างไร ขอบคุณ! Yannick

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

3
Winbugs และ MCMC อื่น ๆ โดยไม่มีข้อมูลสำหรับการเผยแพร่ก่อนหน้า
จะเกิดอะไรขึ้นเมื่อคุณไม่มีแนวคิดเกี่ยวกับการกระจายพารามิเตอร์ เราควรใช้วิธีใด เวลาส่วนใหญ่ของเรามุ่งไปที่ขีดล่างหากตัวแปรบางตัวมีอิทธิพลเหนือการมีอยู่ / ไม่มีชนิดที่แน่นอนและตัวแปรนั้นได้รับการยอมรับหรือไม่ตามความสำคัญของตัวแปร ซึ่งหมายความว่าส่วนใหญ่เราไม่ได้คิดเกี่ยวกับการแจกแจงแบบ expetcted พารามิเตอร์ควรมี มันถูกต้องหรือไม่ที่จะสมมติว่าพารามิเตอร์ทั้งหมดเป็นไปตามการแจกแจงปกติเมื่อทุกอย่างที่ฉันรู้คือว่า b1, b2, b3 และ b4 ควรแตกต่างกันระหว่าง -2 ถึง 2 และ b0 สามารถแตกต่างกันระหว่าง -5 และ 5? model { # N observations for (i in 1:N) { species[i] ~ dbern(p[i]) logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + b3*var3[i] + b4*var4[i] } # …
10 r  bayesian  mcmc  bugs  winbugs 

5
เป็นไปได้หรือไม่ที่จะพอดีกับแบบจำลอง Bayesian ก่อนจากนั้นจึงเริ่มลดระดับ Priors?
เมื่อทำสถิติบ่อยครั้งจะมีรายการไม่ต้องเสียเงินจำนวนมากเช่นการดูผลการทดสอบทางสถิติก่อนตัดสินใจรวบรวมข้อมูลเพิ่มเติม ฉันสงสัยว่าโดยทั่วไปหากมีรายการ no-nos ที่คล้ายกันสำหรับวิธีการที่เกี่ยวข้องในสถิติแบบเบย์และโดยเฉพาะอย่างยิ่งว่าต่อไปนี้เป็นหนึ่งในนั้นหรือไม่ เมื่อไม่นานมานี้ฉันได้ตระหนักว่าสำหรับบางรุ่นที่ฉันทำเหมาะสมขั้นตอนของฉันคือการปรับแบบจำลองให้พร้อมกับนักบวชที่มีข้อมูลเพื่อดูว่ามันทำงานหรือระเบิดได้หรือไม่ ดัดแปลงโมเดลใหม่ แรงจูงใจของฉันสำหรับเรื่องนี้เกี่ยวข้องกับความจริงที่ว่าฉันเขียนแบบจำลองเหล่านี้ใน JAGS / Stan และในใจของฉันฉันได้ปฏิบัติต่อมันเหมือนงานเขียนโปรแกรมมากกว่าสถิติ ดังนั้นฉันจะทำการวิ่งครั้งแรกเรียงลำดับของเสื้อผ้าเพื่อที่จะมาบรรจบกันอย่างรวดเร็วโดยใช้นักบวชที่มีข้อมูลทำให้ง่ายต่อการตรวจจับข้อผิดพลาดในแบบจำลองที่ฉันเขียน จากนั้นหลังจากแก้ไขจุดบกพร่องในแบบจำลองแล้วฉันปรับโฉมใหม่ด้วยนักบวชที่ไม่มีข้อมูลหรือมีข้อมูลน้อย คำถามของฉันคือฉันกำลังทำผิดกฎบางอย่างกับกระบวนการนี้หรือไม่ ตัวอย่างเช่นเพื่อให้ข้อสรุปของฉันถูกต้องและเพื่อหลีกเลี่ยงการใช้ประโยชน์จากองศาอิสระของนักวิจัยฉันต้องผูกมัดให้กับนักบวชที่เฉพาะเจาะจงก่อนที่จะเริ่มปรับรูปแบบใด ๆ

1
จะรับการทำนายสำหรับตัวแปรเฉพาะใน WinBUGS ได้อย่างไร
ฉันเป็นผู้ใช้ใหม่ของ WinBUGS และมีคำถามหนึ่งข้อสำหรับความช่วยเหลือของคุณ หลังจากใช้รหัสต่อไปนี้ผมได้ค่าพารามิเตอร์ของbeta0ผ่านbeta4(สถิติ, ความหนาแน่น) แต่ผมไม่ทราบว่าจะได้รับการคาดการณ์ของมูลค่าสุดท้ายของhซึ่งผมตั้งค่าให้NAกับรูปแบบในรหัส ทุกคนสามารถให้คำแนะนำแก่ฉันได้หรือไม่? คำแนะนำใด ๆ ที่จะได้รับการชื่นชมอย่างมาก model { for(i in 1: N) { CF01[i] ~ dnorm(0, 20) CF02[i] ~ dnorm(0, 1) h[i] ~ dpois (lambda [i]) log(lambda [i]) <- beta0 + beta1*CF03[i] + beta2*CF02[i] + beta3*CF01[i] + beta4*IND[i] } beta0 ~ dnorm(0.0, 1.0E-6) beta1 ~ dnorm(0.0, …

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

4
รับโซ่ 10D MCMC ฉันจะกำหนดโหมดหลังได้อย่างไรใน R
คำถาม:ด้วยห่วงโซ่ MCMC แบบ 10 มิติสมมติว่าฉันพร้อมที่จะมอบเมทริกซ์การจับ: 100,000 ซ้ำ (แถว) โดย 10 พารามิเตอร์ (คอลัมน์) ฉันจะระบุโหมดหลังได้ดีที่สุดอย่างไร ฉันกังวลเป็นพิเศษกับหลายโหมด พื้นหลัง:ฉันคิดว่าตัวเองเป็นนักสถิติที่มีความชำนาญ แต่เมื่อเพื่อนร่วมงานถามคำถามนี้กับฉันฉันรู้สึกละอายใจที่ไม่สามารถหาคำตอบที่เหมาะสมได้ ข้อกังวลหลักคืออาจมีหลายโหมดปรากฏขึ้น แต่หากพิจารณาอย่างน้อยแปดหรือมากกว่านั้นในสิบส่วนข้อมูล ความคิดแรกของฉันคือการใช้การประมาณความหนาแน่นของเคอร์เนล แต่การค้นหาผ่าน R เปิดเผยว่าไม่มีอะไรน่ากังวลสำหรับปัญหาที่มีขนาดเกินกว่าสามมิติ เพื่อนร่วมงานได้เสนอกลยุทธ์เฉพาะกิจในสิบมิติและค้นหาสูงสุด แต่ข้อกังวลของฉันคือแบนด์วิดท์อาจนำไปสู่ปัญหาการกระจัดกระจายที่สำคัญหรือขาดความละเอียดในการแยกแยะหลายโหมด ที่กล่าวว่าฉันยินดีรับข้อเสนอแนะสำหรับคำแนะนำแบนด์วิดธ์อัตโนมัติลิงก์ไปยังตัวประมาณความหนาแน่นเคอร์เนล 10 ตัวหรือสิ่งอื่นที่คุณรู้ ความกังวลเกี่ยวกับ: เราเชื่อว่าการกระจายอาจเบ้ค่อนข้าง ดังนั้นเราต้องการระบุโหมดด้านหลังไม่ใช่วิธีหลัง เรากังวลว่าอาจมีโหมดหลังหลายโหมด หากเป็นไปได้เราต้องการคำแนะนำจาก R แต่อัลกอริทึมใด ๆ ที่จะทำตราบเท่าที่มันไม่ยากอย่างไม่น่าเชื่อที่จะใช้ ฉันเดาว่าฉันไม่ต้องการใช้ตัวประมาณความหนาแน่นของเคอร์เนลด้วยการเลือกแบนด์วิดท์อัตโนมัติตั้งแต่เริ่มต้น

2
การประมาณความไม่แน่นอนในปัญหาการอนุมานมิติสูงโดยไม่มีการสุ่มตัวอย่าง?
ฉันกำลังทำงานกับปัญหาการอนุมานมิติสูง (ประมาณพารามิเตอร์โมเดลปี 2000) ซึ่งเราสามารถทำการประมาณค่า MAP ได้อย่างมีประสิทธิภาพโดยการหาค่าสูงสุดของผู้บันทึกล็อกระดับโลกโดยใช้การเพิ่มประสิทธิภาพการไล่ระดับสีและอัลกอริทึมทางพันธุกรรม ฉันอยากจะประเมินความไม่แน่นอนเกี่ยวกับพารามิเตอร์ของแบบจำลองเพิ่มเติมนอกเหนือจากการค้นหาการประมาณค่า MAP เราสามารถคำนวณการไล่ระดับสีของ log-posterior ได้อย่างมีประสิทธิภาพเกี่ยวกับพารามิเตอร์ดังนั้นในระยะยาวเรามีเป้าหมายที่จะใช้ Hamiltonian MCMC ทำการสุ่มตัวอย่าง แต่ตอนนี้ฉันสนใจการประมาณการแบบไม่สุ่มตัวอย่าง วิธีเดียวที่ฉันรู้ก็คือการคำนวณค่าผกผันของ Hessian ในโหมดเพื่อประมาณหลังเป็นหลายตัวแปรปกติ แต่แม้มันจะดูเป็นไปไม่ได้สำหรับระบบขนาดใหญ่เช่นนี้เพราะแม้ว่าเราจะคำนวณ ∼4×106∼4×106\sim 4\times10^{6} องค์ประกอบของ Hessian ฉันแน่ใจว่าเราไม่พบสิ่งที่ตรงกันข้าม ใครช่วยแนะนำวิธีการแบบใดที่มักใช้ในกรณีเช่นนี้? ขอบคุณ! แก้ไข - ข้อมูลเพิ่มเติมเกี่ยวกับปัญหา ความเป็นมา นี้เป็นปัญหาผกผันที่เกี่ยวข้องกับการทดลองฟิสิกส์ขนาดใหญ่ เรามีตาข่ายสามเหลี่ยมสองมิติซึ่งอธิบายถึงเขตข้อมูลทางกายภาพบางส่วนและพารามิเตอร์แบบจำลองของเราคือค่าทางกายภาพของเขตข้อมูลเหล่านั้นในแต่ละจุดยอดของตาข่าย ตาข่ายมีประมาณ 650 จุดยอดและเราสร้างแบบจำลอง 3 เขตข้อมูลดังนั้นนั่นคือที่มาของพารามิเตอร์แบบจำลอง 2000 ของเรา ข้อมูลการทดลองของเรานั้นมาจากเครื่องมือที่ไม่ได้วัดเขตข้อมูลเหล่านี้โดยตรง แต่ปริมาณที่มีฟังก์ชั่นที่ไม่ใช่เชิงเส้นที่ซับซ้อนของเขตข้อมูล สำหรับเครื่องมือที่แตกต่างกันเรามีตัวแบบไปข้างหน้าซึ่งจะจับคู่พารามิเตอร์ของแบบจำลองกับการทำนายข้อมูลการทดลองและการเปรียบเทียบระหว่างการทำนายและการวัดทำให้เกิดความน่าจะเป็นบันทึก จากนั้นเราจะสรุปความเป็นไปได้ของการบันทึกจากเครื่องมือที่แตกต่างกันเหล่านี้และยังเพิ่มค่าบางอย่างก่อนบันทึกซึ่งใช้ข้อ จำกัด ทางกายภาพบางอย่างกับเขตข้อมูล ดังนั้นฉันจึงสงสัยว่า 'แบบจำลอง' นี้จัดอยู่ในหมวดหมู่อย่างเรียบร้อย - เราไม่มีทางเลือกว่าแบบจำลองคืออะไรมันถูกกำหนดโดยวิธีการใช้งานจริงของเครื่องมือที่รวบรวมข้อมูลการทดลองของเรา …

1
ทำไมคนหลัง Bayesian จึงมุ่งไปที่ตัวย่อของ KL divergence?
พิจารณาคชกรรมหลังX asymptotically, สูงสุดเกิดขึ้นใน MLE ประมาณการที่เพิ่งเพิ่มโอกาส(X)θ ∣ Xθ|X\theta\mid Xθ^θ^\hat \thetaargminθฉθ( X)argminθฉθ(X)\operatorname{argmin}_\theta\, f_\theta(X) แนวคิดทั้งหมดเหล่านี้ - นักบวชชาว Bayesian, เพิ่มความเป็นไปได้สูงสุด - ให้เสียงที่ดีเลิศและไม่เป็นไปตามอำเภอใจ ไม่มีการลงชื่อเข้าใช้ แต่ MLE จะลดความแตกต่างของ KL ให้น้อยที่สุดระหว่างการกระจายจริงและเช่นจะย่อเล็กสุดฉ~ฉ~\tilde fฉθ( x )ฉθ(x)f_\theta(x) KL (ฉ~∥ฉθ) =∫+ ∞- ∞ฉ~( x ) [บันทึกฉ~( x ) - บันทึกฉθ( x ) ]dxKL(ฉ~∥ฉθ)=∫-∞+∞ฉ~(x)[เข้าสู่ระบบ⁡ฉ~(x)-เข้าสู่ระบบ⁡ฉθ(x)]dx KL(\tilde f \parallel f_\theta) = \int_{-\infty}^{+\infty} \tilde f(x) …

3
ตัวประมาณค่า Bayes ต้องการให้พารามิเตอร์จริงเป็นค่าแปรปรวนที่เป็นไปได้ของค่าก่อนหน้าหรือไม่?
นี้อาจจะมีบิตของคำถามปรัชญา แต่ที่นี่เราจะไป: ในทางทฤษฎีการตัดสินใจความเสี่ยงของ Bayes ประมาณการสำหรับมีการกำหนดเกี่ยวกับการกระจายก่อนใน\θ^(x)θ^(x)\hat\theta(x)θ∈Θθ∈Θ\theta\in\Thetaππ\piΘΘ\Theta ทีนี้ในแง่หนึ่งสำหรับความจริงจะสร้างข้อมูล (เช่น "มีอยู่"),จะต้องเป็นตัวแปรที่เป็นไปได้ภายใต้ , เช่นมีความน่าจะเป็นที่ไม่ใช่ศูนย์, ความหนาแน่นไม่เป็นศูนย์ ฯลฯ ; ในทางกลับกัน,ไม่เป็นที่รู้จัก, ดังนั้นการเลือกก่อนหน้า, ดังนั้นเราจึงไม่รับประกันว่าจริงเป็นความแปรปรวนที่เป็นไปได้ภายใต้เราเลือกθθ\thetaθθ\thetaππ\piθθ\thetaθθ\thetaππ\pi ตอนนี้ดูเหมือนว่าเราจะต้องเลือกเพื่อที่จะเป็นรูปแบบที่เป็นไปได้ มิฉะนั้นทฤษฎีบทบางอย่างจะไม่ถือ ตัวอย่างเช่นการประมาณค่าขนาดเล็กที่สุดจะไม่เป็นการประมาณค่าแบบเบย์สำหรับสิ่งที่น่าพอใจน้อยที่สุดก่อนเนื่องจากเราสามารถทำให้ค่านั้นไม่ดีตามอำเภอใจก่อนโดยการยกเว้นพื้นที่ขนาดใหญ่รอบ ๆ และรวมถึงจากโดเมน อย่างไรก็ตามการรับประกันว่านั้นอยู่ในโดเมนนั้นอาจทำได้ยากππ\piθθ\thetaθθ\thetaθθ\theta ดังนั้นคำถามของฉันคือ: โดยทั่วไปแล้วสันนิษฐานว่าแท้จริงคือความแปรปรวนของเป็นไปได้หรือไม่?θθ\thetaππ\pi สามารถรับประกันได้หรือไม่ กรณีที่ละเมิดนี้สามารถตรวจพบได้อย่างน้อยดังนั้นจึงไม่เชื่อในทฤษฎีบทเช่น minimax เมื่อเงื่อนไขไม่ได้ถือ? หากไม่จำเป็นต้องทำทำไมมาตรฐานผลลัพธ์ในทฤษฎีการตัดสินใจจึงเป็นเช่นนั้น?

2
ความพอเพียงแบบเบย์เกี่ยวข้องกับความพอเพียงของผู้ถี่บ่อยอย่างไร
ความหมายที่ง่ายที่สุดของสถิติที่เพียงพอในมุมมอง frequentist จะได้รับที่นี่ในวิกิพีเดีย อย่างไรก็ตามเมื่อเร็ว ๆ นี้ฉันเจอหนังสือ Bayesian พร้อมคำจำกัดความP( θ | x , t ) = P( θ | t )P(θ|x,t)=P(θ|t)P(\theta|x,t)=P(\theta|t). มันระบุไว้ในลิงค์ว่าทั้งสองจะเท่ากัน แต่ฉันไม่เห็นว่า นอกจากนี้ในหน้าเดียวกันนั้นในส่วน«ประเภทอื่น ๆ ของความพอเพียง»มันระบุไว้ว่าคำจำกัดความทั้งสองนั้นไม่เท่ากันในช่องว่างมิติ ... นอกจากนี้ความพอเพียงเชิงทำนายยังเกี่ยวข้องกับความพอเพียงแบบดั้งเดิมอย่างไร

2
เป็นจริงหรือไม่ที่ Bayesians ไม่ต้องการชุดทดสอบ?
ฉันเพิ่งดูการพูดคุยนี้โดยเอริคเจ Maและการตรวจสอบของเขารายการบล็อกที่เขาพูดราดโอนีลว่ารูปแบบเบส์ไม่ overfit ( แต่พวกเขาสามารถ overfit ) และเมื่อใช้พวกเขาเราไม่จำเป็นต้องใช้ชุดทดสอบสำหรับการตรวจสอบพวกเขา (สำหรับ ฉันพูดดูเหมือนจะพูดค่อนข้างเกี่ยวกับการใช้ชุดการตรวจสอบเพื่อปรับพารามิเตอร์) ความจริงแล้วข้อโต้แย้งนั้นไม่ทำให้ฉันและฉันไม่สามารถเข้าถึงหนังสือได้ดังนั้นคุณจะให้ข้อโต้แย้งที่ละเอียดและเข้มงวดมากขึ้นหรือคัดค้านข้อความดังกล่าวหรือไม่? ในขณะเดียวกัน Eric Ma ได้ชี้ให้ฉันสนทนาในหัวข้อเดียวกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.