คำถามติดแท็ก prior

ในสถิติแบบเบย์การกระจายก่อนหน้านี้ทำให้ข้อมูลหรือความรู้เป็นระเบียบ (มักเป็นแบบอัตนัย) ซึ่งมีอยู่ก่อนตัวอย่างจะเห็นในรูปแบบของการแจกแจงความน่าจะเป็น การกระจายที่มีการแพร่กระจายขนาดใหญ่จะถูกใช้เมื่อมีความรู้เพียงเล็กน้อยเกี่ยวกับพารามิเตอร์ในขณะที่การกระจายก่อนหน้าแคบลงแสดงถึงระดับของข้อมูลที่มากขึ้น

1
นักสถิติใช้ Jeffreys 'มาก่อนในการใช้งานจริงหรือไม่?
เมื่อฉันเรียนรู้เกี่ยวกับ Jeffreys 'ก่อนหน้าในการอนุมานสถิติระดับบัณฑิตศึกษาของฉันอาจารย์ของฉันทำให้มันฟังดูเหมือนว่ามันน่าสนใจส่วนใหญ่ด้วยเหตุผลทางประวัติศาสตร์มากกว่าเพราะใครจะเคยใช้มัน จากนั้นเมื่อฉันทำการวิเคราะห์ข้อมูลแบบเบย์เราไม่เคยถูกขอให้ใช้นักบวชของเจฟฟรีย์ ไม่มีใครใช้จริงเหล่านี้ในทางปฏิบัติ ถ้าเป็นเช่นนั้น (หรือถ้าไม่) ทำไมหรือทำไมไม่ ทำไมนักสถิติบางคนถึงไม่จริงจัง

1
Neg Binomial และ Jeffreys 'ก่อนหน้า
ฉันพยายามรับ Jeffreys ก่อนเพื่อการกระจายแบบทวินามลบ ฉันไม่สามารถดูว่าฉันผิดไปไหนดังนั้นถ้ามีคนช่วยชี้ให้เห็นว่าจะได้รับการชื่นชม เอาล่ะเพื่อให้สถานการณ์อย่างนี้ผมจะเปรียบเทียบการกระจายก่อนที่ได้รับใช้ทวินามและทวินามลบที่ (ในทั้งสองกรณี) มีการทดลองและประสบความสำเร็จ ฉันได้คำตอบที่ถูกสำหรับเคสทวินาม แต่ไม่ใช่สำหรับลบทวินามnnnม.ม.m ลองโทรฟรีย์ก่อนtheta) จากนั้นπJ( θ )πJ(θ)\pi_J(\theta) πJ( θ ) ∝ [ I( θ ) ]1 / 2.πJ(θ)α[ผม(θ)]1/2. \pi_J(\theta)\propto [I(\theta)]^{1/2}. ภายใต้เงื่อนไขความสม่ำเสมอ (ปฏิบัติตามที่เรากำลังเผชิญกับตระกูลเอ็กซ์โปเนนเชียล) ผม( θ ) = - E( ∂2เข้าสู่ระบบL ( θ | x )∂θ2)ผม(θ)=-E(∂2เข้าสู่ระบบ⁡L(θ|x)∂θ2) I(\theta)=-E\left(\frac{\partial^2 \log L(\theta|x)}{\partial \theta^2}\right) โดยที่ลบทวินามคือxด้านบน expression (จำนวนความสำเร็จทั้งหมดmได้รับการแก้ไขแล้วnไม่ใช่) การกระจายตัว - ฉันคิดว่า …

2
"ข้อมูลหน่วยก่อน" คืออะไร
ฉันได้อ่าน Wagenmakers (2007) วิธีการแก้ปัญหาการปฏิบัติเพื่อให้ปัญหาที่แพร่หลายของค่าพี ฉันรู้สึกทึ่งกับการแปลงค่า BIC ให้เป็นปัจจัยและความน่าจะเป็นของเบย์ อย่างไรก็ตามจนถึงตอนนี้ฉันยังไม่เข้าใจว่าข้อมูลหน่วยก่อนหน้าเป็นอย่างไร ฉันจะขอบคุณสำหรับคำอธิบายเกี่ยวกับรูปภาพหรือรหัส R เพื่อสร้างรูปภาพของสิ่งนี้ก่อนหน้านี้

2
เหตุใดจึงมีคำแนะนำไม่ให้ใช้ Jeffreys หรือนักบวชที่ใช้เอนโทรปีสำหรับแซมเพลอร์ของ MCMC
บนหน้า wikiผู้พัฒนาของรัฐสแตน: หลักการบางอย่างที่เราไม่ชอบ: ค่าคงที่, เจฟฟรีย์, ค่าเอนโทรปี แต่ฉันเห็นคำแนะนำการกระจายตามปกติมากมาย จนถึงตอนนี้ฉันใช้วิธีเบย์ซึ่งไม่ได้ใช้การสุ่มตัวอย่างและยินดีที่ได้เข้าใจว่าทำไมเป็นตัวเลือกที่ดีสำหรับโอกาสทวินามθ ∼ Beta ( α = 12, β= 12)θ∼Beta(α=12,β=12)\theta \sim \text{Beta}\left(\alpha=\frac{1}{2},\beta=\frac{1}{2}\right)
11 bayesian  mcmc  prior  pymc  stan 


1
ปัจจัยเบย์กับนักบวชที่ไม่เหมาะสม
ฉันมีคำถามเกี่ยวกับการเปรียบเทียบแบบจำลองโดยใช้ปัจจัยของเบย์ ในหลายกรณีนักสถิติมีความสนใจที่จะใช้วิธีการแบบเบย์ร่วมกับนักบวชที่ไม่เหมาะสม (ตัวอย่างเช่นนักบวชเจฟฟรีย์และนักบวชอ้างอิง) คำถามของฉันคือในกรณีที่การกระจายตัวด้านหลังของพารามิเตอร์แบบจำลองมีการกำหนดไว้อย่างถูกต้องมันจะถูกต้องหรือไม่ที่จะเปรียบเทียบแบบจำลองที่ใช้ปัจจัย Bayes ภายใต้การใช้ของนักบวชที่ไม่เหมาะสม? ตัวอย่างง่ายๆลองพิจารณาเปรียบเทียบโมเดลปกติกับโมเดลโลจิสติกกับ Jeffreys priors

3
สร้างนักบวช ... ด้วยเงิน!
สมมติว่าฉันมี 'ผู้เชี่ยวชาญ' จากคนที่ผมอยากจะล้วงเอาการกระจายก่อนในบางตัวแปรXฉันต้องการที่จะกระตุ้นให้พวกเขาด้วยเงินจริง ความคิดที่จะล้วงเอาไพรเออร์ที่สังเกตความเข้าใจของตัวแปรสุ่มแล้ว divvy ขึ้นบางที่กำหนดไว้ 'กระเป๋า' ในหมู่ผู้เชี่ยวชาญขึ้นอยู่กับวิธีการที่ดีไพรเออร์ของพวกเขาตรงกับหลักฐาน อะไรคือวิธีที่แนะนำสำหรับส่วนสุดท้ายนี้การทำแผนที่นักบวชและหลักฐานลงบนเวกเตอร์การจ่ายเงินX n XkkkXXXnnnXXX
10 bayesian  prior 


3
ตัวประมาณค่า Bayes ต้องการให้พารามิเตอร์จริงเป็นค่าแปรปรวนที่เป็นไปได้ของค่าก่อนหน้าหรือไม่?
นี้อาจจะมีบิตของคำถามปรัชญา แต่ที่นี่เราจะไป: ในทางทฤษฎีการตัดสินใจความเสี่ยงของ Bayes ประมาณการสำหรับมีการกำหนดเกี่ยวกับการกระจายก่อนใน\θ^(x)θ^(x)\hat\theta(x)θ∈Θθ∈Θ\theta\in\Thetaππ\piΘΘ\Theta ทีนี้ในแง่หนึ่งสำหรับความจริงจะสร้างข้อมูล (เช่น "มีอยู่"),จะต้องเป็นตัวแปรที่เป็นไปได้ภายใต้ , เช่นมีความน่าจะเป็นที่ไม่ใช่ศูนย์, ความหนาแน่นไม่เป็นศูนย์ ฯลฯ ; ในทางกลับกัน,ไม่เป็นที่รู้จัก, ดังนั้นการเลือกก่อนหน้า, ดังนั้นเราจึงไม่รับประกันว่าจริงเป็นความแปรปรวนที่เป็นไปได้ภายใต้เราเลือกθθ\thetaθθ\thetaππ\piθθ\thetaθθ\thetaππ\pi ตอนนี้ดูเหมือนว่าเราจะต้องเลือกเพื่อที่จะเป็นรูปแบบที่เป็นไปได้ มิฉะนั้นทฤษฎีบทบางอย่างจะไม่ถือ ตัวอย่างเช่นการประมาณค่าขนาดเล็กที่สุดจะไม่เป็นการประมาณค่าแบบเบย์สำหรับสิ่งที่น่าพอใจน้อยที่สุดก่อนเนื่องจากเราสามารถทำให้ค่านั้นไม่ดีตามอำเภอใจก่อนโดยการยกเว้นพื้นที่ขนาดใหญ่รอบ ๆ และรวมถึงจากโดเมน อย่างไรก็ตามการรับประกันว่านั้นอยู่ในโดเมนนั้นอาจทำได้ยากππ\piθθ\thetaθθ\thetaθθ\theta ดังนั้นคำถามของฉันคือ: โดยทั่วไปแล้วสันนิษฐานว่าแท้จริงคือความแปรปรวนของเป็นไปได้หรือไม่?θθ\thetaππ\pi สามารถรับประกันได้หรือไม่ กรณีที่ละเมิดนี้สามารถตรวจพบได้อย่างน้อยดังนั้นจึงไม่เชื่อในทฤษฎีบทเช่น minimax เมื่อเงื่อนไขไม่ได้ถือ? หากไม่จำเป็นต้องทำทำไมมาตรฐานผลลัพธ์ในทฤษฎีการตัดสินใจจึงเป็นเช่นนั้น?

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
หนึ่งจะทำให้การกระจายความน่าจะเป็นก่อนเป็นทางการได้อย่างไร มีกฎของหัวแม่มือหรือเคล็ดลับที่ควรใช้หรือไม่
ในขณะที่ฉันชอบคิดว่าฉันมีความเข้าใจอย่างดีเกี่ยวกับแนวคิดของข้อมูลก่อนหน้านี้ในการวิเคราะห์ทางสถิติแบบเบย์และการตัดสินใจ ฉันมีสถานการณ์สองสามอย่างที่เป็นตัวอย่างการต่อสู้ของฉันและฉันรู้สึกว่าพวกเขาไม่ได้รับการกล่าวถึงอย่างถูกต้องในตำราทางสถิติแบบเบย์ที่ฉันได้อ่าน: สมมติว่าฉันทำแบบสำรวจไม่กี่ปีที่ผ่านมาที่บอกว่า 68% ของผู้คนจะสนใจซื้อผลิตภัณฑ์ ACME ฉันตัดสินใจที่จะเรียกใช้แบบสำรวจอีกครั้ง ในขณะที่ฉันจะใช้ขนาดตัวอย่างเดียวกับครั้งที่แล้ว (พูด, n = 400) ความคิดเห็นของผู้คนมีการเปลี่ยนแปลงตั้งแต่นั้นมา อย่างไรก็ตามหากฉันใช้เป็นรุ่นก่อนหน้ากับการแจกแจงแบบเบต้าซึ่งผู้ตอบแบบสอบถาม 272 จาก 400 คนตอบว่า "ใช่" ฉันจะให้น้ำหนักเท่ากันกับแบบสำรวจที่ฉันวิ่งไปเมื่อสองสามปีก่อน มีกฎง่ายๆที่จะสร้างความไม่แน่นอนที่ยิ่งใหญ่กว่าที่ฉันต้องการก่อนหน้านี้โดยอาศัยอำนาจของข้อมูลที่มีอายุไม่กี่ปี? ฉันเข้าใจว่าฉันสามารถลดค่าก่อนหน้านี้จาก 272/400 เป็น 136/200 แต่สิ่งนี้ให้ความรู้สึกโดยพลการมากและฉันสงสัยว่ามีรูปแบบของการให้เหตุผลบางอย่างหรืออาจเป็นในวรรณกรรม อีกตัวอย่างหนึ่งสมมติว่าเรากำลังจะทำการทดลองทางคลินิก ก่อนที่จะเริ่มการทดลองเราทำการวิจัยระดับทุติยภูมิซึ่งเราสามารถใช้เป็นข้อมูลก่อนหน้านี้รวมถึงความคิดเห็นของผู้เชี่ยวชาญผลจากการทดลองทางคลินิกก่อนหน้านี้ (จากความเกี่ยวข้องที่แตกต่างกัน) ข้อเท็จจริงทางวิทยาศาสตร์พื้นฐานอื่น ๆ (บางอันไม่ใช่เชิงปริมาณโดยธรรมชาติ) ไปสู่การแจกแจงความน่าจะเป็นก่อนหน้า? เป็นกรณีของการตัดสินใจที่จะเลือกครอบครัวและทำให้ครอบครัวกระจายข้อมูลมากพอที่จะทำให้แน่ใจว่าข้อมูลถูกครอบงำหรือมีงานจำนวนมากเพื่อสร้างการเผยแพร่ก่อนหน้าอย่างเป็นธรรมหรือไม่?

1
เลือก Priors ตามข้อผิดพลาดการวัด
คุณคำนวณค่าที่เหมาะสมก่อนว่าคุณมีข้อผิดพลาดในการวัดของเครื่องมืออย่างไร ย่อหน้านี้มาจากหนังสือของ Cressie "สถิติสำหรับข้อมูล Spatio-Temporal": มักจะเป็นกรณีที่ข้อมูลก่อนหน้านี้บางส่วนมีอยู่เกี่ยวกับความแปรปรวนของการวัด - ข้อผิดพลาดทำให้สามารถระบุรูปแบบพารามิเตอร์ที่มีข้อมูลที่ค่อนข้างยุติธรรม ตัวอย่างเช่นถ้าเราสมมติว่าข้อผิดพลาดการวัดที่เป็นอิสระตามเงื่อนไขคือ iid Gau(0,σ2ϵ)Gau(0,σϵ2)Gau(0, \sigma_{\epsilon}^2)จากนั้นเราควรระบุข้อมูลก่อน σ2ϵσϵ2\sigma_{\epsilon}^2. สมมติว่าเราสนใจอุณหภูมิของอากาศแวดล้อมและเราเห็นว่าข้อกำหนดของผู้ผลิตเครื่องมือระบุว่า "ผิดพลาด"±0.1°C±0.1°C±0.1°C. สมมติว่า "ข้อผิดพลาด" นี้สอดคล้องกับ 2 ส่วนเบี่ยงเบนมาตรฐาน (สมมติฐานที่ควรตรวจสอบ!) เราอาจระบุให้มีค่าเฉลี่ยก่อนหน้า . เนื่องจากข้อกำหนดของผู้ผลิตเครื่องมือเราจะถือว่าการกระจายที่มีจุดสูงสุดที่ชัดเจนและค่อนข้างแคบที่ 0.0025 (เช่นแกมมาผกผัน) อันที่จริงเราสามารถแก้ไขได้ที่ 0.0025; อย่างไรก็ตามข้อผิดพลาดของตัวแบบข้อมูลอาจมีองค์ประกอบอื่นที่มีความไม่แน่นอนเช่นกัน (มาตรา 7.1) เพื่อหลีกเลี่ยงปัญหาในการระบุตัวตนที่เป็นไปได้กับข้อผิดพลาดของกระบวนการแบบจำลองมันเป็นสิ่งสำคัญมากที่ผู้สร้างแบบจำลองจะลดความไม่แน่นอนให้มากที่สุดเท่าที่วิทยาศาสตร์อนุญาตรวมถึงการศึกษาด้านการออกแบบข้อมูลσ2ϵσϵ2\sigma_{\epsilon}^{2}(0.1/2)2=0.0025(0.1/2)2=0.0025(0.1/2)^2 = 0.0025 ไม่มีใครรู้ว่าขั้นตอนทั่วไปที่จะได้รับค่าของก่อนหน้าตามที่อธิบายไว้ข้างต้น (แม้ว่าย่อหน้าเท่านั้นหมายถึงการได้รับค่าเฉลี่ยก่อนหน้า)?

2
“ หลงลืม” จากก่อนหน้านี้ในการตั้งค่า Bayesian?
เป็นที่ทราบกันดีว่าเมื่อคุณมีหลักฐานมากขึ้น (พูดในรูปของมีขนาดใหญ่กว่าสำหรับตัวอย่าง iid) Bayesian ก่อนหน้านี้จะ "ลืม" และการอนุมานส่วนใหญ่ได้รับผลกระทบจากหลักฐาน (หรือโอกาส)nnnnnn มันง่ายที่จะเห็นมันสำหรับกรณีเฉพาะต่าง ๆ (เช่น Bernoulli กับรุ่นเบต้าก่อนหรือประเภทอื่น ๆ ) - แต่มีวิธีดูในกรณีทั่วไปด้วยและก่อนไหมx1,…,xn∼p(x|μ)x1,...,xn~พี(x|μ)x_1,\ldots,x_n \sim p(x|\mu)p(μ)พี(μ)p(\mu) แก้ไข: ฉันเดาว่าจะไม่สามารถแสดงในกรณีทั่วไปสำหรับก่อนหน้านี้ใด ๆ (ตัวอย่างเช่นมวลจุดก่อนหน้าจะทำให้มวลหลังจุด) แต่อาจมีเงื่อนไขบางอย่างที่ถูกลืมไปก่อน นี่คือ "เส้นทาง" ที่ฉันคิดเกี่ยวกับการแสดงบางอย่างเช่นนั้น: สมมติว่าพื้นที่พารามิเตอร์คือ ΘΘ\Thetaและปล่อยให้ p(θ)พี(θ)p(\theta) และ q(θ)Q(θ)q(\theta) เป็นนักบวชสองคนที่วางมวลความน่าจะไม่เป็นศูนย์ไว้สำหรับทุกคน ΘΘ\Theta. ดังนั้นการคำนวณหลังทั้งสองสำหรับจำนวนเงินก่อนหน้านี้ไปที่: p(θ|x1,…,xn)=∏ip(xi|θ)p(θ)∫θ∏ip(xi|θ)p(θ)dθพี(θ|x1,...,xn)=Πผมพี(xผม|θ)พี(θ)∫θΠผมพี(xผม|θ)พี(θ)dθp(\theta | x_1,\ldots,x_n) = \frac{\prod_i p(x_i | \theta) p(\theta)}{\int_{\theta} \prod_i p(x_i | \theta) p(\theta) d\theta} …
9 bayesian  prior 

2
อนุญาตให้ใช้ข้อมูลเพื่อกำหนดค่า Priors จากนั้นเรียกใช้แบบจำลองด้วย Priors เหล่านี้ (เช่นนักบวชที่ขับเคลื่อนด้วยข้อมูลจากชุดข้อมูลเดียวกัน)
เป็นความเข้าใจของฉันที่เราไม่ควรอนุญาตให้มีชุดข้อมูลเดียวกับที่เรากำลังวิเคราะห์เพื่อขับเคลื่อน / กำหนดว่าการกระจายก่อนหน้านี้มีลักษณะอย่างไรในการวิเคราะห์แบบเบย์ โดยเฉพาะอย่างยิ่งมันไม่เหมาะสมที่จะกำหนดการกระจายก่อนหน้านี้สำหรับการวิเคราะห์แบบเบส์ตามสถิติสรุปจากชุดข้อมูลเดียวกันที่คุณจะใช้นักบวชเพื่อช่วยให้พอดีกับแบบจำลอง มีใครรู้บ้างเกี่ยวกับทรัพยากรที่พูดถึงเรื่องนี้โดยเฉพาะว่าไม่เหมาะสมหรือไม่? ฉันต้องการการอ้างอิงบางอย่างสำหรับปัญหานี้
9 bayesian  prior 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.