Bayesians ตรวจสอบวิธีการของพวกเขาโดยใช้วิธีการจำลองมอนติคาร์โลได้อย่างไร


11

ความเป็นมา : ฉันมีปริญญาเอกในด้านจิตวิทยาสังคมซึ่งสถิติและคณิตศาสตร์ในเชิงทฤษฎีแทบจะไม่ครอบคลุมในหลักสูตรเชิงปริมาณของฉัน ผ่านการเรียนในระดับปริญญาตรีและระดับบัณฑิตศึกษาฉันได้รับการสอน (เช่นเดียวกับพวกคุณหลายคนในสังคมศาสตร์ด้วย) ผ่านโครงร่างของนักประพันธ์เพลง "คลาสสิค" ตอนนี้ฉันยังรัก R และใช้วิธีการจำลองเพื่อตรวจสอบว่าวิธีการทำงานเป็นวิธีความรู้สึกของฉันมากกว่าการพิสูจน์ทางคณิตศาสตร์ (อีกครั้ง: ภูมิหลังในเชิงสังคมศาสตร์เชิงปริมาณไม่ใช่สถิติเชิงทฤษฎี) วิธีการของผู้ใช้บ่อยและวิธีการจำลองด้วยกันทำให้ฉันมีเหตุผล เพราะผู้ที่พบเห็นความน่าจะเป็นเป็นอัตราเดิมพันระยะยาว (เช่นถ้าฉันทำสิ่งนี้เป็นจำนวนมากตามอำเภอใจและมันเกิดขึ้น 50% ของเวลาก็มีความน่าจะเป็น 50%) เราสามารถจำลองระยะยาวนี้ได้ด้วยวิธีการมอนติคาร์โล!

ภาวะแทรกซ้อน : ตั้งแต่ปริญญาตรีผมได้รับมากตระหนักถึงวิธีการแบบเบย์และมีได้เสมอคนในชีวิตของฉันเรียกฉันไปทางด้านเบส์บอกว่าผลที่ได้ก็ง่ายต่อการตีความที่เราได้รับความน่าจะเป็นสำหรับสมมติฐานแทนของข้อมูล ให้สมมติฐานและอื่น ๆ ฉันเป็นแบบนี้จริง ๆ แล้วเอาชั้นเรียนแบบเบย์อ่านหนังสือและเอกสารแบบเบย์บางอันและตอนนี้ฉันก็ค่อนข้างคุ้นเคยกับสแตนและแพ็คเกจ R ที่เกี่ยวข้อง

ใส่มายอ : หลังจากความคิด "แบบเบย์อาจจะเป็นวิธีของอนาคต" ในขณะที่ผมอ่านเดโบราห์เมโยสถิติอนุมานเป็นรุนแรงทดสอบ เธอบอกว่าเธอไม่ได้เลือกข้างในตอนเริ่มต้นของหนังสือ แต่เธอก็รู้ว่า: เธอเป็นคนที่เรียนบ่อยและหนังสือจำนวนมากกำลังปกป้องวิธีการที่ใช้บ่อย ฉันไม่ต้องการพูดคุยเกี่ยวกับว่าเราคิดว่าวิธีที่เธอเห็นหลักฐานนั้นถูกต้องหรือไม่ แต่สิ่งนี้ทำให้ฉันคิดว่า: Bayes เป็นสิ่งที่โฆษณาจริงๆหรือไม่? ฉันหมายความว่าฝูงชนเบย์แตกหักตัวเองจนฉันไม่รู้วิธีที่ถูกต้องในการวิเคราะห์ข้อมูลในกรอบเบย์บ่อยครั้ง ปกติฉันจะใช้rstanarmและการประมาณจุดปัจจุบันและช่วงเวลาที่น่าเชื่อถือ ... ซึ่งมักจะเข้าแถวอย่างใกล้ชิดกับการประมาณการบ่อยครั้งและช่วงความเชื่อมั่น ฉันอาจทำการเปรียบเทียบโมเดล แต่ฉันมักจะกลัวที่จะอธิบายปัจจัย Bayes เป็นการเปรียบเทียบความน่าจะเป็นหลังและอื่น ๆ

คิดมากขึ้น : สิ่งที่ฉันคิดต่อไปในหนังสือของมาโยคือ: มีวิธีที่เราสามารถใช้คอมพิวเตอร์เพื่อให้แน่ใจว่าวิธีการของเราใช้งานได้บ่อยเพราะความน่าจะเป็นคือสิ่งที่เราเห็นในระยะยาวและเราสามารถจำลองได้ Bayesians ไม่สามารถเห็นด้วยกับความน่าจะเป็นที่แท้จริงขึ้นอยู่กับโรงเรียนของ Bayesian (ค่าเริ่มต้นอัตนัย ฯลฯ ) ซึ่งทำให้ฉันคำถามของฉัน:

คำถาม : Bayesians ตรวจสอบได้อย่างไรว่าวิธีการของพวกเขากำหนดความไม่แน่นอนอย่างเหมาะสม (เช่นคำนวณระยะเวลาที่น่าเชื่อถือและการแจกแจงหลัง) โดยใช้วิธีการจำลอง Monte Carlo หากความน่าจะเป็นไม่ได้กำหนดไว้ว่าเป็นอัตราในระยะยาว?

ตัวอย่าง : ฉันสร้างตัวสร้างข้อมูล นี่จะเป็นการจำลองจากการแจกแจงเบอร์นูลลีด้วยความน่าจะเป็น 0.5

set.seed(1839)
p <- .50
n <- 100
gen_dat <- function(n, p) {
  rbinom(n, 1, p)
}

ทีนี้สมมุติว่าฉันต้องการให้แน่ใจว่าช่วงความเชื่อมั่นในการถดถอยโลจิสติกนั้นใช้ได้จริง ฉันสามารถจำลองการถดถอยเป็นจำนวนมากครั้งและตรวจสอบให้แน่ใจว่ามูลค่าจริงของประชากรอยู่ในช่วงความเชื่อมั่น 95% 95% ของเวลา เป็นโมเดลดักจับเท่านั้นดังนั้นฉันแค่ต้องการให้แน่ใจว่าฉันประมาณpอย่างถูกต้อง:

set.seed(1839)
iter <- 10000
results <- sapply(seq_len(iter), function(zzz) {
  mod <- glm(gen_dat(n, p) ~ 1, binomial)
  conf <- suppressMessages(confint(mod))
  log(p / (1 - p)) < max(conf) & log(p / (1 - p)) > min(conf)
})
mean(results)

นี้จะใช้เวลานาทีในการทำงาน แต่เราจบลงด้วยการเรียกร้องให้เราmean(results) 0.9416นี่คือประมาณ 95% และฉันมั่นใจในการบอกว่าglmคำสั่งอธิบายความไม่แน่นอนในทางที่ถูกต้อง ฉันแน่ใจว่ามันจะเข้าใกล้จมูกได้ถึง 95% ถ้าฉันเติมiterและอยากรอที่แล็ปท็อปของฉันนานกว่านี้

ในทางกลับกันเราจะพอดีกับแบบจำลอง Bayesian สำหรับสิ่งเดียวกัน:

library(rstanarm)
set.seed(1839)
dat <- data.frame(y = gen_dat(n, p))
stan_mod <- stan_glm(y ~ 1, binomial, dat)
summary(stan_mod)

ในส่วนนี้ให้ฉัน:

Estimates:
                mean   sd    2.5%   25%   50%   75%   97.5%
(Intercept)    -0.1    0.2  -0.5   -0.2  -0.1   0.0   0.3  
mean_PPD        0.5    0.1   0.3    0.4   0.5   0.5   0.6  
log-posterior -73.0    0.7 -75.1  -73.1 -72.7 -72.5 -72.5  

เนื่องจาก Bayesians ไม่ได้กำหนดความน่าจะเป็นเหมือนที่เราเห็นในระยะยาวฉันจะใช้วิธีการจำลองในการตรวจสอบมากกว่าที่จะตรวจสอบstan_glmความไม่แน่นอนได้อย่างไร นั่นคือฉันจะมั่นใจได้อย่างไรว่าช่วงเวลาที่น่าเชื่อถือเหล่านี้ใช้ได้โดยใช้วิธีการจำลอง และตอนนี้ฉันไม่ได้กำหนดมาก่อน - การรวมนักบวชเข้ามาเล่นที่นี่ได้อย่างไรเนื่องจากจะส่งผลต่อการวัดความไม่แน่นอนของเรา

เมื่อฉันพยายามเขียนการถดถอยเบต้าด้วยองค์ประกอบตัวแบบกระโดดข้ามใน Stan ตั้งแต่เริ่มต้นฉันมีคนแนะนำให้ฉัน: "จำลองข้อมูลทำหลาย ๆ ครั้งและการประมาณจริงควรอยู่ในช่วงเวลาที่น่าเชื่อถือประมาณ 95 % ของเวลา " แต่สำหรับฉันมันขัดแย้งกับสิ่งที่ Bayesians เชื่อมั่น! นั่นขึ้นอยู่กับความเข้าใจถึงความน่าจะเป็นที่เกิดขึ้นเป็นประจำ! ดังนั้น Bayesian จะทำให้ฉันมั่นใจได้อย่างไรว่าช่วงเวลาที่น่าเชื่อถือที่ฉันได้รับจากการsummary()โทรไปยังแบบจำลองของฉันอธิบายความไม่แน่นอนได้อย่างแม่นยำโดยใช้วิธีการจำลอง

วัตถุประสงค์ของคำถาม : นี่เป็นตัวอย่างเล็กน้อย แต่หลายครั้งที่ลูกค้าให้ฉันมีปัญหาที่ยาก และฉันลองสิ่งที่ฉันไม่คุ้นเคยดังนั้นฉันมักจะทำการศึกษาแบบจำลองเพื่อให้แน่ใจว่าสิ่งที่ฉันกำลังทำนั้นถูกต้อง ถ้าฉันจะเขียนโมเดลที่กำหนดเองในสแตนฉันจะรู้ได้อย่างไรว่าสิ่งที่ฉันทำนั้นถูกต้อง? ฉันจะใช้วิธีจำลองสถานการณ์เพื่อตรวจสอบว่าสิ่งที่ฉันทำในสแตนนั้นจริง ๆ แล้วจะบอกฉันว่าฉันอยากรู้อะไร


3
คำถามที่ดี. สองความคิดเห็น: 1. เราสามารถใช้วิธีการซิมเพื่อ "ตรวจสอบ" โมเดลผู้ใช้บ่อย แต่การจำลองเพียงอย่างเดียวไม่สามารถแจ้งให้เราทราบถึงความน่าเชื่อถือของแบบจำลองผู้ใช้บ่อย 2: มีวิธีที่จะรู้ว่าแบบจำลอง Bayesian / Stan นั้นไม่น่าเชื่อถือสำหรับการอนุมาน เช่นการเปลี่ยนที่ไม่เหมือนกันถูกสังเกตหลังช่วงเวลาอบอุ่นร่างกาย
JTH

1
ฉันคิดว่าคุณกำลังพูดถึง "ความไม่แน่นอน" สองแบบที่แตกต่างกัน วิธีการที่ผู้ใช้บ่อยจัดการกับความไม่แน่นอนของการแชทและเป็นธรรมโดยคุณสมบัติระยะยาวของพวกเขา วิธีการแบบเบย์จัดการกับความไม่แน่นอนของ epistemic และไม่จำเป็นต้องได้รับการพิสูจน์บนพื้นฐานของคุณสมบัติที่ยาวนานของพวกเขา โดยเฉพาะช่วงเวลาที่น่าเชื่อถือ 95% ไม่จำเป็นต้องเป็นช่วงความมั่นใจ 95% ถึงกระนั้นแม้แต่ชาวเบย์ก็อาจต้องการ "ปรับเทียบ" เพื่อให้ตรงกับความน่าจะเป็นของผู้ใช้บ่อย ดู: Rubin, DB "การคำนวณความถี่ที่สมเหตุสมผลอย่างสมเหตุสมผลและเกี่ยวข้องกันสำหรับนักสถิติประยุกต์สถิติพงศาวดาร 1984: 12: 1151-1172
a.arfe

หากคุณอาศัยอยู่ในโลกความน่าจะเป็นอัตนัยบางทีคุณไม่จำเป็นต้องตรวจสอบอะไรคุณไม่เคยผิด
Aksakal

คุณอาจต้องการดูstats.stackexchange.com/questions/2272/…เพื่อดูว่าทำไมคุณไม่สามารถทำสิ่งที่คุณคิดเกี่ยวกับการทำอย่างน้อยช่วงเวลา
เดฟแฮร์ริส

คำตอบ:


5

ฉันคิดว่าคุณเห็นปัญหาตรรกะในคำถามของคุณ ในกระบวนทัศน์ที่พบบ่อยมันเป็นเรื่องปกติที่จะเข้าใจความจริงของประชากรสร้างข้อมูลและดูว่าการประมาณการมีความครอบคลุมที่ดีเพราะนั่นคือสิ่งที่พวกเขาควรจะทำ อย่างไรก็ตามในกระบวนทัศน์แบบเบย์ไม่มีความจริงพื้นฐานที่จะสร้างข้อมูลจาก! เบย์ถามถึงความน่าจะเป็นของความจริงดังกล่าวที่ได้รับข้อมูลดังนั้นในการจำลองสถานการณ์เราต้องการความจริงที่แตกต่างกันซึ่งก่อให้เกิดข้อมูลแล้วกำหนดเงื่อนไขของข้อมูล ในทางปฏิบัติเราจะจำลองกฎความน่าจะเป็นแบบมีเงื่อนไขซึ่งโชคดีที่มีคำจำกัดความเสมอ ฉันรับเรื่องนี้แน่นอนในรูเดอร์ปี 2014 วารสารจิตวิทยาและการทบทวน https://dx.doi.org/10.3758/s13423-014-0595-4


1

Bayesians ตรวจสอบได้อย่างไรว่าวิธีการของพวกเขากำหนดความไม่แน่นอนอย่างเหมาะสม (เช่นคำนวณระยะเวลาที่น่าเชื่อถือที่ถูกต้องและการแจกแจงหลัง) โดยใช้วิธีการจำลอง Monte Carlo หากความน่าจะเป็นไม่ได้กำหนดเป็นอัตราในระยะยาว?

ฉันเชื่อว่าความสับสนที่นี่เกี่ยวกับวัตถุประสงค์ของวิธีการจำลองในสถิติแบบเบย์ จุดประสงค์เดียวของวิธีการมาร์คอฟเชนมอนติคาร์โลเช่นการสุ่มตัวอย่างกิ๊บส์หรือมิลโตเนียนมอนติคาร์โลคือการคำนวณตัวหารของกฎเบย์

แน่นอนว่ายังมีวิธีการอื่น ๆ ซึ่งจะทำให้ MCMC ไม่จำเป็น บางรุ่นสามารถแสดงได้ด้วยการใช้ conjugacy ส่วนอื่น ๆ ผ่านการใช้กริดที่ดีเหนือพื้นที่พารามิเตอร์ แต่ผู้อื่นสามารถแก้ไขได้ด้วยการทดสอบการปฏิเสธการยอมรับ ที่ MCMC มีประโยชน์คือเมื่ออินทิกรัลไม่ดี

π(θ|x)=f(X|θ)π(θ)θΘf(X|θ)π(θ)dθ,
f(X|θ)π(θ)f(X|θ)π(θ|X)รวมเป็นหนึ่ง เป้าหมายของ MCMC คือการกำหนดหมายเลขด้านล่าง โปรดทราบว่าตัวเลขด้านล่างเป็นค่าคงที่ มันเป็นโอกาสที่คาดหวัง

ความแม่นยำของตัวเลขนั้นเป็นตัวกำหนดบางส่วน แต่ไม่ทั้งหมดประมาณค่าพารามิเตอร์ หากคุณใช้ตัวประมาณค่าด้านหลังสูงสุด MCMC นั้นเป็นขั้นตอนที่ไม่จำเป็น คุณควรสร้างอัลกอริธึมการปีนเขาแทน ในทางกลับกันก็จำเป็นต้องกำหนดค่าเฉลี่ยหลังหรือช่วงเวลา นั่นเป็นเพราะช่วงเวลา 95% จะต้องเป็น 95% ของบางอย่างและตัวส่วนกำหนดว่าขนาดของสิ่งนั้นคืออะไร

เป้าหมายของ MCMC ในวิธีการแบบเบย์คือเพื่อให้โซ่มาร์คอฟมาบรรจบกันกับความหนาแน่นหลัง นั่นแหละ. มันไม่ได้ทดสอบความถูกต้องของสิ่งใด มันเป็นเพียงความพยายามในการกำหนดค่าจุดคงที่ มันเป็นรูปแบบของการรวมตัวเลข เนื่องจากไม่มีวิธีที่จะรู้ได้โดยไม่ต้องให้อัลกอริทึมวิ่งไปหาอินฟินิตี้ไม่ว่าจะเป็นบริเวณที่หนาแน่นทั้งหมดหรือไม่ก็มีการตัดสินของมนุษย์ อัลกอริทึมจะมีการตัดเมื่อเชื่อว่ามันทำเสร็จ แต่นั่นไม่ได้หมายความว่ามันทำจริง

ในวิธีการแบบใช้บ่อย MCMC มักใช้เพื่อทดสอบความสมเหตุสมผลของแบบจำลองหรือเพื่อประมาณค่าตัวเลขวิธีแก้ปัญหาเมื่อไม่มีการวิเคราะห์ ไม่มีจุดประสงค์คล้ายกันที่นี่

ถ้าฉันจะเขียนโมเดลที่กำหนดเองในสแตนฉันจะรู้ได้อย่างไรว่าสิ่งที่ฉันทำนั้นถูกต้อง? ฉันจะใช้วิธีจำลองสถานการณ์เพื่อตรวจสอบว่าสิ่งที่ฉันทำในสแตนนั้นจริง ๆ แล้วจะบอกฉันว่าฉันอยากรู้อะไร

คำถามนี้ยากกว่ามาก Stan เป็นอัลกอริธึมที่รวดเร็วซึ่งหมายความว่าการค้าขายความเร็วเพื่อความเสี่ยงที่เพิ่มขึ้นของความไม่ถูกต้อง สแตนโดยการก่อสร้างมักจะถูกต้องมากกว่าไม่ถูกต้อง มีอัลกอริธึมอื่น ๆ ที่ออกแบบมาเพื่อค้นหาพื้นที่พารามิเตอร์อย่างกว้างขวางเพื่อหาค่าสูงสุดในท้องถิ่นซึ่งอาจแม่นยำกว่า แต่จะช้ามาก

θΘ(X|θ)π(θ)dθ.

สิ่งที่สองที่คุณสามารถทำได้คือการตรวจสอบด้วยอัลกอริทึมทางเลือก ตัวเลขจะไม่ตรงกัน แต่ถ้าคุณเห็นว่าใกล้พอแล้วคุณก็สบายดี

ประการที่สามแพ็คเกจที่สร้างไว้ล่วงหน้าส่วนใหญ่มีคำเตือนว่าอาจมีบางอย่างผิดปกติ หากมีคำเตือนเกิดขึ้นให้ใช้อย่างอื่นหลังจากตรวจสอบแหล่งที่มาของปัญหาดังนั้นคุณจึงไม่ต้องสร้างมันขึ้นมาใหม่ในอัลกอริทึมอื่น

ราคา(μ)=ยังไม่มีข้อความ(7,22)σ2ยังไม่มีข้อความ(25,0.12)

ประการที่ห้าและคุณควรทำสิ่งนี้ก่อนเริ่มสแตนตั้งแต่แรกลองวาดกราฟความน่าจะเป็นของคุณในหนึ่งหรือสองมิติ มีเรื่องประหลาดใจบ้างไหมที่อาจรบกวนการทำงานของอัลกอริทึม?

เนื่องจาก Bayesians ไม่ได้กำหนดความน่าจะเป็นเหมือนที่เราเห็นในระยะยาวฉันจะใช้วิธีการจำลองเพื่อยืนยันว่า stan_glm สามารถจับความไม่แน่นอนได้อย่างไร นั่นคือฉันจะมั่นใจได้อย่างไรว่าช่วงเวลาที่น่าเชื่อถือเหล่านี้ใช้ได้โดยใช้วิธีการจำลอง และตอนนี้ฉันไม่ได้กำหนดมาก่อน - การรวมนักบวชเข้ามาเล่นที่นี่ได้อย่างไรเนื่องจากจะส่งผลต่อการวัดความไม่แน่นอนของเรา

หากคุณไม่ได้กำหนดไว้ก่อนหน้าโมเดลของคุณจะไม่ถูกต้อง หากคุณไม่ได้กำหนดความหนาแน่นก่อนหน้านี้ที่สมเหตุสมผลแล้วทำไมคุณจะใช้แบบจำลอง Bayesian แบบจำลองผู้ใช้บ่อยลดความเสี่ยงของการสูญเสียสูงสุดที่อาจเกิดขึ้นจากการรวบรวมตัวอย่างที่ไม่ดี พวกเขามองโลกในแง่ร้ายมากและมักใช้ข้อมูลมากขึ้นในการสร้างผลลัพธ์แบบเดียวกับที่วิธีการแบบเบย์ใช้

อย่างไรก็ตามนั่นเป็นสิ่งที่ไม่มีประโยชน์หากไม่ใช้ความหนาแน่นก่อนดี ความหนาแน่นก่อนหน้าช่วยให้วิธีการแบบเบย์ลดการสูญเสียเฉลี่ยจากการเลือกตัวอย่างที่ไม่ดี ข้อมูลในการกระทำก่อนหน้านี้เป็นรูปแบบการถ่วงน้ำหนักเพื่อที่ว่าหากมีกลุ่มตัวอย่างที่มากเกินไปถูกเลือกโดยโอกาสที่โชคร้ายก่อนหน้านี้จะทำให้บทบาทที่อ่อนแอของข้อมูลอ่อนแอลง

แก้ไข ฉันรู้ว่าฉันไม่ได้ให้คำตอบที่เฉพาะเจาะจง มันเป็นคำถาม

ฉันจะใช้วิธีจำลองสถานการณ์เพื่อตรวจสอบว่าสิ่งที่ฉันทำในสแตนนั้นจริง ๆ แล้วจะบอกฉันว่าฉันอยากรู้อะไร

สิ่งที่ทำให้คำถามนี้มีความท้าทายคือในกระบวนทัศน์เบย์จุดคงที่คือตัวอย่าง ในวิธีการใช้บ่อยพารามิเตอร์จะได้รับการแก้ไขและมีการสร้างตัวอย่างที่มองไม่เห็นนับพัน ที่ด้าน Bayesian ของเหรียญมันเป็นตัวอย่างที่ได้รับการแก้ไข คุณต้องจำลองจักรวาลคู่ขนานนับพันX

ที่จะเห็นสิ่งที่อาจจะเป็นเหมือนจินตนาการทุกฟังก์ชั่นความหนาแน่นของการโยนเหรียญที่มีความน่าจะเป็นที่ไม่รู้จักของการเป็นหัวและของการเป็นหาง คุณสังเกตเห็นหกหัวและสองหาง ลองนึกภาพพื้นที่พารามิเตอร์เล็ก ๆ ที่\} การจำลองของคุณจะพิจารณาทุกกรณีที่สามารถรับหกหัวได้จากการแจกแจงทวินามทั้งสามแบบ คนหลังจะเป็นค่าเฉลี่ยถ่วงน้ำหนักของแต่ละพารามิเตอร์เป็นค่าจริง การกระจายการทำนายของคุณจะเป็นผลรวมของการแจกแจงทวินามถ่วงน้ำหนักพี1-พีพี{1/3,1/2,2/3}

มีความสำคัญต่อคุณเป็นไปไม่ได้ที่การทำนายแบบเบย์จะเป็นการกระจายที่แท้จริง หนึ่งในสามของการแจกแจงคือการแจกแจงที่แท้จริง วิธีการแบบเบย์มีน้ำหนักน่าจะเป็นของพวกเขาขึ้นอยู่กับค่าที่สังเกตและก่อนหน้านี้ หลังไม่สามารถกระจายตัวที่แท้จริงหรือความหนาแน่นในการทำนาย

มันถามว่า "ความน่าจะเป็นที่จะเห็นหัวหกและสองก้อยเหนือชุดของคำอธิบายที่เป็นไปได้ทั้งหมดคืออะไร (พารามิเตอร์, แบบจำลอง, ฯลฯ )"

ผู้ใช้บ่อยจะอ้างว่าหนึ่งในสามตัวเลือกคือมูลค่าที่แท้จริงโดยทำให้เป็นโมฆะ หกหัวและสองหางจะปลอมแปลงแต่ไม่ใช่คนอื่น ถ้าบังเอิญคุณเลือกหนึ่งในสามของการแจกแจงที่ถูกต้องคุณก็จะถูกต้องสมบูรณ์แบบ มิฉะนั้นคุณจะผิดH0:พี=1/3,

หากคุณจะใช้แบบจำลองเพื่อเก็บตัวอย่างที่คงที่คุณจะพบว่าสแตนจะแสดงได้อย่างน่าชื่นชมเนื่องจากทฤษฎีบทของเบย์เป็นทฤษฎีทางคณิตศาสตร์ มันเป็นการโพสต์ที่ดีที่สุด สิ่งที่คุณจะพบคืออัลกอริธึมที่ใช้ทฤษฎีบทของเบย์อย่างถูกต้องจนถึงระดับข้อผิดพลาดตามธรรมชาติในการประมาณส่วน

มีสามสิ่งที่คุณสามารถทำได้ ก่อนอื่นคุณสามารถใช้วิธีการให้คะแนนแบบจำลองสำหรับข้อมูลที่ไม่อยู่ในกลุ่มตัวอย่าง ประการที่สองคุณสามารถใช้การเลือกแบบจำลองแบบเบย์หรือกระบวนการหาค่าเฉลี่ยของแบบจำลอง ประการที่สามคุณสามารถถือว่าเป็นปัญหาของผู้ที่ใช้บ่อยและสร้างการกระจายตัวตัวอย่างของตัวประมาณ

สำหรับครั้งแรกวิธีการให้คะแนนเป็นวรรณกรรมทั้งหมดแก่ตัวเอง คุณควรทำการวิจัยพวกเขา การเลือกแบบจำลองแบบเบย์และการหาค่าเฉลี่ยของแบบจำลองถือว่าเป็นพารามิเตอร์ สำหรับการเลือกแบบจำลองความน่าจะเป็นของแบบจำลองจะถูกคำนวณ สำหรับค่าเฉลี่ยของแบบจำลองความน่าจะเป็นแต่ละแบบจำลองนั้นถูกคำนวณและทำหน้าที่เป็นการถ่วงน้ำหนักเหนือพื้นที่แบบจำลอง ในที่สุดคุณสามารถปฏิบัติต่อมันเป็นรูปแบบผู้มาเป็นประจำ

คนสุดท้ายจะเป็นปัญหาในหลายกรณีมาตรฐานเพราะก่อนหน้านี้ สำหรับรุ่นที่มีสามมิติขึ้นไปและมีการแจกแจงแบบปกติความหนาแน่นหลังจะไม่รวมเข้ากับความสามัคคีหากความหนาแน่นก่อนหน้านี้ไม่ใช่ความหนาแน่นที่เหมาะสม คุณต้องกัดสัญลักษณ์แสดงหัวข้อย่อยและเลือกรุ่นก่อนหน้าสำหรับโมเดลที่มีความซับซ้อนจริง ๆ

การปรากฏตัวของแรงก่อนที่เหมาะสมตรงกลางอย่างถูกต้องในกรณีที่วิธีการแบบเบย์จะดีกว่าวิธีการประจำที่สอดคล้องกันเนื่องจากข้อมูลที่ดีขึ้น วิธีเบย์จะชนะภายใต้มาตรฐานที่สมเหตุสมผล นั่นไม่ได้เกิดจากข้อบกพร่องในวิธีการของนักธนู แต่วิธีการแบบเบย์ใช้ข้อมูลภายนอก วิธี Frequentist โดยพิจารณาเฉพาะข้อมูลในตัวอย่างจะมีข้อมูลน้อยลงหากคุณมีจริงก่อน

อีกครั้งถ้าคุณไม่มีความจริงมาก่อนทำไมคุณใช้วิธีการแบบเบย์


@ Aksakal ฉันเห็นด้วยกับคุณมันจะทำให้การตัดสินใจและการวิเคราะห์ conflate ฉันลบมัน
Dave Harris
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.