คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต

3
การปรับพารามิเตอร์ไฮเปอร์: การค้นหาแบบสุ่มกับการปรับให้เหมาะสมแบบเบย์
ดังนั้นเรารู้ว่าการค้นหาแบบสุ่มทำงานได้ดีกว่าการค้นหาแบบตาราง แต่วิธีการที่ใหม่กว่าคือการเพิ่มประสิทธิภาพแบบเบย์ (ใช้กระบวนการแบบเกาส์) ฉันค้นหาการเปรียบเทียบระหว่างทั้งสองและไม่พบอะไรเลย ฉันรู้ว่าที่ cs231n ของ Stanford พวกเขาพูดถึงการค้นหาแบบสุ่มเท่านั้น แต่เป็นไปได้ว่าพวกเขาต้องการทำให้สิ่งต่าง ๆ เรียบง่าย คำถามของฉันคือ: วิธีใดดีกว่าและถ้าคำตอบคือ "บางครั้งการค้นหาแบบสุ่มบางครั้ง Bayesian" เมื่อใดฉันจึงควรเลือกวิธีอื่นมากกว่า?

5
ตำราสำหรับเศรษฐมิติแบบเบย์
ฉันกำลังมองหาตำราเรียนที่เข้มงวดทางทฤษฎีเกี่ยวกับเศรษฐมิติแบบเบย์โดยมีความเข้าใจอย่างถ่องแท้เกี่ยวกับเศรษฐมิติเชิงเศรษฐศาสตร์ ฉันอยากจะแนะนำหนึ่งงานต่อหนึ่งคำตอบเพื่อให้ข้อเสนอแนะนั้นสามารถโหวตขึ้นหรือลงทีละรายการได้

2
การโยนเหรียญกระบวนการตัดสินใจและคุณค่าของข้อมูล
ลองนึกภาพการตั้งค่าต่อไปนี้: คุณมี 2 เหรียญ, เหรียญ A ซึ่งรับประกันว่าจะยุติธรรมและเหรียญ B ซึ่งอาจหรืออาจไม่ยุติธรรม คุณจะถูกขอให้โยนเหรียญ 100 ครั้งและเป้าหมายของคุณคือเพิ่มจำนวนหัวให้มากที่สุด ข้อมูลก่อนหน้าของคุณเกี่ยวกับเหรียญ B คือพลิก 3 ครั้งและให้ 1 หัว หากกฎการตัดสินใจของคุณขึ้นอยู่กับการเปรียบเทียบความน่าจะเป็นที่คาดหวังของหัวของเหรียญ 2 เหรียญคุณจะพลิกเหรียญ 100 ครั้งและทำตามนั้น สิ่งนี้เป็นจริงแม้ว่าจะใช้การประมาณแบบเบย์ที่สมเหตุสมผล (ความหมายด้านหลัง) ของความน่าจะเป็นเนื่องจากคุณไม่มีเหตุผลที่จะเชื่อว่าเหรียญ B ให้ผลตอบแทนที่มากกว่า อย่างไรก็ตามจะเกิดอะไรขึ้นถ้าเหรียญ B มีความเอนเอียงในความเป็นจริง แน่นอนว่า "หัวหน้าที่มีศักยภาพ" ที่คุณยอมแพ้โดยการโยนเหรียญ B สองครั้ง (และการได้รับข้อมูลเกี่ยวกับคุณสมบัติทางสถิติของมัน) จะมีค่าในบางแง่มุมดังนั้นจึงเป็นปัจจัยในการตัดสินใจของคุณ "คุณค่าของข้อมูล" นี้จะอธิบายทางคณิตศาสตร์ได้อย่างไร? คำถาม:คุณสร้างกฎการตัดสินใจที่ดีที่สุดทางคณิตศาสตร์ในสถานการณ์นี้ได้อย่างไร

1
การถดถอยโลจิสติกแบบเบย์ปกติใน JAGS
มีเอกสารทางคณิตศาสตร์มากมายที่อธิบาย Bayesian Lasso แต่ฉันต้องการทดสอบและแก้ไขรหัส JAGS ที่ฉันสามารถใช้ได้ ใครบางคนสามารถโพสต์ตัวอย่างรหัส BUGS / JAGS ที่ใช้การถดถอยโลจิสติกปกติ? รูปแบบใด ๆ (L1, L2, Elasticnet) จะดี แต่ Lasso เป็นที่ต้องการ ฉันยังสงสัยว่ามีกลยุทธ์การใช้งานทางเลือกที่น่าสนใจหรือไม่

1
การตีความแบบเบย์มีไว้สำหรับ REML หรือไม่
มีการตีความแบบเบย์ของ REML หรือไม่ สำหรับสัญชาตญาณของฉัน REML มีความคล้ายคลึงกันอย่างมากกับกระบวนการประมาณค่าเบย์เชิงประจักษ์และฉันสงสัยว่ามีการแสดงความเท่าเทียมเชิงซีมโทติค (ภายใต้คลาสของนักบวชชั้นสูงที่เหมาะสม) ทั้งเชิงประจักษ์ Bayes และ REML ดูเหมือนว่าวิธีการประมาณค่าแบบ 'ประนีประนอม' ที่ดำเนินการในการเผชิญกับพารามิเตอร์ที่สร้างความรำคาญเช่น ส่วนใหญ่สิ่งที่ฉันค้นหาด้วยคำถามนี้คือความเข้าใจในระดับสูงที่การโต้แย้งประเภทนี้มักจะให้ผล แน่นอนหากการโต้เถียงในลักษณะนี้ด้วยเหตุผลบางอย่างไม่สามารถถูกนำไปใช้อย่างมีประสิทธิภาพสำหรับ REML คำอธิบายว่าทำไมสิ่งนี้จึงส่งผลให้เกิดความเข้าใจอย่างลึกซึ้ง!

1
จะหาช่วงเวลาที่น่าเชื่อถือ 95% ได้อย่างไร
ฉันพยายามคำนวณช่วงเวลาที่น่าเชื่อถือ 95% ของการแจกแจงหลัง ฉันไม่พบฟังก์ชันใน R สำหรับมัน แต่วิธีการด้านล่างถูกต้องหรือไม่ x <- seq(0.4,12,0.4) px <- c(0,0, 0, 0, 0, 0, 0.0002, 0.0037, 0.018, 0.06, 0.22 ,0.43, 0.64,0.7579, 0.7870, 0.72, 0.555, 0.37, 0.24, 0.11, 0.07, 0.02, 0.009, 0.005, 0.0001, 0,0.0002, 0, 0, 0) plot(x,px, type="l") mm <- sum(x*px)/sum(px) var <- (sum((x)^2*px)/sum(px)) - (mm^2) cat("95% …

1
Bayesian lasso vs spike และ slab
คำถาม:อะไรคือข้อดี / ข้อเสียของการใช้อันใดอันหนึ่งก่อนหน้าสำหรับการเลือกตัวแปร? สมมติว่าฉันมีความน่าจะเป็น: ที่ฉันสามารถใส่ได้ทั้งหนึ่งในไพรเออร์นี้: or: y∼N(Xw,σ2I)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I)wi∼πδ0+(1−π)N(0,100)π=0.9,wi∼πδ0+(1−π)N(0,100)π=0.9, w_i\sim \pi\delta_0+(1-\pi)\mathcal{N}(0,100)\\ \pi=0.9\,, wi∼exp(−λ|wi|)λ∼Γ(1,1).wi∼exp⁡(−λ|wi|)λ∼Γ(1,1). w_i\sim \exp(-\lambda|w_i|)\\ \lambda \sim \Gamma(1,1)\,. ฉันใส่เพื่อเน้นน้ำหนักส่วนใหญ่เป็นศูนย์และแกมม่าก่อนหน้าบนเพื่อเลือกพารามิเตอร์ 'normalizing'π=0.9π=0.9\pi=0.9λλ\lambda อย่างไรก็ตามอาจารย์ของฉันยังคงยืนยันว่ารุ่น lasso 'ลดค่าสัมประสิทธิ์และไม่ได้ทำการเลือกตัวแปรที่เหมาะสมจริง ๆ นั่นคือมีการหดตัวมากเกินไปของพารามิเตอร์ที่เกี่ยวข้อง ฉันพบว่าการนำ Lasso ไปใช้งานได้ง่ายขึ้นเนื่องจากฉันใช้ Bayes แบบแปรผัน ในความเป็นจริงแล้วSparse Bayesian Learning paper ซึ่งวางก่อนหน้าของให้การแก้ปัญหาแบบสปอร์1|wi|1|wi|\frac{1}{|w_i|}

2
Naive Bayes ทำงานอย่างไรกับตัวแปรต่อเนื่อง
เพื่อความเข้าใจ (พื้นฐานมาก) ของฉัน Naive Bayes ประมาณการความน่าจะเป็นไปตามความถี่ของคลาสของแต่ละคุณสมบัติในข้อมูลการฝึก แต่มันคำนวณความถี่ของตัวแปรต่อเนื่องได้อย่างไร และเมื่อทำการคาดการณ์มันจะจำแนกการสังเกตใหม่ที่อาจไม่มีค่าเดียวกันของการสังเกตใด ๆ ในชุดฝึกอบรมอย่างไร มันใช้การวัดระยะทางบางอย่างหรือหา 1NN หรือไม่?

6
การประมาณค่า MLE เทียบกับ MAP จะใช้เมื่อใด
MLE = การประมาณความน่าจะเป็นสูงสุด MAP = หลังที่ใหญ่ที่สุด MLE ใช้งานง่าย / ไร้เดียงสาโดยเริ่มจากความน่าจะเป็นของการสังเกตที่กำหนดพารามิเตอร์ (เช่นฟังก์ชันความน่าจะเป็น)และพยายามค้นหาพารามิเตอร์ที่สอดคล้องกับการสังเกตการณ์ที่สุด แต่มันไม่ได้คำนึงถึงความรู้เดิม MAP ดูเหมือนจะสมเหตุสมผลมากกว่าเนื่องจากคำนึงถึงความรู้เดิมผ่านกฎของเบย์ นี่คือคำถามที่เกี่ยวข้อง แต่คำตอบนั้นไม่ละเอียด /signals/13174/differences-using-maximum-likelihood-or-maximum-a-posteriori-for-deconvolution-d ดังนั้นฉันคิดว่า MAP ดีกว่ามาก นั่นถูกต้องใช่ไหม? และฉันควรใช้อันไหนดี?

4
MCMC เป็นวิธีการที่เหมาะสมหรือไม่เมื่อมีการประมาณค่าแบบโปสเตอร์สูงสุด
ฉันสังเกตเห็นว่าในแอปพลิเคชั่นที่ใช้งานได้จริงวิธีการที่ใช้ MCMC นั้นใช้ในการประมาณค่าพารามิเตอร์ถึงแม้ว่าส่วนหลังนั้นจะทำการวิเคราะห์ (ตัวอย่างเช่น สำหรับฉันมันสมเหตุสมผลกว่าที่จะใช้ตัวประมาณค่า MAP แทนที่จะเป็นตัวประมาณค่า MCMC ใครสามารถชี้ให้เห็นว่าทำไม MCMC ยังคงเป็นวิธีการที่เหมาะสมในการปรากฏตัวของผู้วิเคราะห์หลัง?

2
Bayesian Deep Learning คืออะไร
การเรียนรู้แบบเบย์ลึกคืออะไรและเกี่ยวข้องกับสถิติแบบเบย์แบบดั้งเดิมและการเรียนรู้แบบลึกแบบดั้งเดิมอย่างไร อะไรคือแนวคิดหลักและคณิตศาสตร์ที่เกี่ยวข้อง? ฉันจะบอกว่ามันไม่ใช่แค่สถิติแบบเบย์ น้ำเชื้อทำงานอย่างไรรวมถึงการพัฒนาและแอพพลิเคชั่นหลักในปัจจุบัน PS: การเรียนรู้ลึกแบบเบย์ได้รับความสนใจเป็นอย่างมากให้ดูที่ NIPS workshop

3
ทำ MCMC: ใช้ jags / stan หรือใช้ด้วยตนเอง
ฉันใหม่สำหรับการวิจัยสถิติแบบเบย์ ฉันได้ยินจากนักวิจัยว่านักวิจัยชาวเบย์นำเอา MCMC มาใช้ด้วยตัวเองแทนที่จะใช้เครื่องมืออย่าง JAGS / Stan ฉันขอถามว่าประโยชน์ของการใช้อัลกอริทึม MCMC ด้วยตัวเอง (ในภาษา "ไม่ค่อนข้างเร็ว" เช่น R) คืออะไรยกเว้นเพื่อการเรียนรู้?
13 bayesian  mcmc 

2
การทำแบบเบย์ก่อนจากผลลัพธ์ที่พบบ่อย
เราควรจะเปลี่ยนผลการค้นหาเป็นประจำไปสู่ ​​Bayesian ได้อย่างไร? พิจารณาสถานการณ์ทั่วไปที่น่าสนใจต่อไปนี้: ทำการทดลองในอดีตและผลลัพธ์ของพารามิเตอร์บางอย่างถูกวัด การวิเคราะห์ทำด้วยวิธีการที่ใช้บ่อย ช่วงความเชื่อมั่นสำหรับได้รับในผลลัพธ์ϕφϕ\phiφϕ\phi ตอนนี้ผมกำลังทำบางการทดสอบใหม่ที่ฉันต้องการที่จะวัดค่าพารามิเตอร์อื่น ๆ บางพูดทั้งและ\การทดลองของฉันแตกต่างจากการศึกษาก่อนหน้า --- มันไม่ได้ใช้วิธีการเดียวกัน ผมอยากจะทำวิเคราะห์คชกรรมและดังนั้นผมจะต้องไพรเออร์ขึ้นในวันที่และ\ϕ θ ϕθθ\thetaφϕ\phiθθ\thetaφϕ\phi ไม่มีการวัดก่อนหน้านี้ที่ได้รับการดำเนินการดังนั้นฉันวาง uninformative (พูดว่าชุดของมัน) ก่อนที่มัน θθ\theta ดังที่กล่าวไว้มีผลลัพธ์ก่อนหน้าสำหรับกำหนดเป็นช่วงความมั่นใจ ในการใช้ผลลัพธ์นั้นในการวิเคราะห์ปัจจุบันของฉันฉันจะต้องแปลผลลัพธ์นักการประจำก่อนหน้านี้เป็นข้อมูลก่อนการวิเคราะห์ของฉัน φϕ\phi ตัวเลือกหนึ่งที่ไม่สามารถใช้งานได้ในสถานการณ์จำลองนี้คือการทำซ้ำการวิเคราะห์ก่อนหน้าซึ่งนำไปสู่การวัดในแบบเบย์ ถ้าฉันสามารถทำสิ่งนี้จะมีหลังจากการทดลองก่อนหน้านี้ที่ฉันจะใช้เป็นของฉันก่อนหน้านี้และจะไม่มีปัญหาϕφϕ\phi φϕ\phi ฉันควรแปล CI ที่ใช้บ่อยเป็นการแจกแจงก่อนแบบเบย์สำหรับการวิเคราะห์ของฉันได้อย่างไร หรือกล่าวอีกนัยหนึ่งฉันจะแปลผลลัพธ์ที่พบบ่อยที่สุดในให้เป็นหลังที่ที่ฉันจะใช้ก่อนหน้านี้ในการวิเคราะห์ได้อย่างไรϕφϕ\phiφϕ\phi ข้อมูลเชิงลึกหรือการอ้างอิงใด ๆ ที่กล่าวถึงปัญหาประเภทนี้ยินดีต้อนรับ

1
การระบุขนาดเอฟเฟกต์ก่อนหน้าในการวิเคราะห์อภิมาน
ความกังวลเกี่ยวกับคำถามของฉันไพรเออร์กับขนาดของผลกระทบในโครงการของฉันวัดเป็นของโคเฮนDจากการอ่านวรรณกรรมดูเหมือนว่านักบวชที่คลุมเครือมักถูกนำมาใช้เช่นในโรงเรียนแปดตัวอย่างที่เป็นตัวอย่างของการวิเคราะห์อภิมานเบย์แบบลำดับชั้น ในตัวอย่างแปดโรงเรียน, ฉันได้เห็นคลุมเครือก่อนที่ใช้สำหรับการประมาณการของหมู่บ้านเช่น \ หมู่ _ {\ theta} \ ซิม \ operatorname {} ปกติ (0, 100)DDDμθ∼normal(0,100)μθ∼normal⁡(0,100)\mu_{\theta} \sim \operatorname{normal}(0, 100) วินัยของฉันคือจิตวิทยาโดยปกติแล้วขนาดของเอฟเฟกต์จะเล็ก เป็นเช่นนี้ผมกำลังพิจารณาที่จะใช้นี้ก่อน: μθ∼normal(0,.5)μθ∼normal⁡(0,.5)\mu_{\theta} \sim \operatorname{normal}(0, .5)0.5) เหตุผลของฉันก่อนหน้านี้อย่างแน่นหนาคือจากความเข้าใจของฉันเกี่ยวกับนักบวชฉันกำลังวางความน่าจะเป็น 95% ก่อนที่μθμθ\mu_{\theta}อยู่ระหว่าง -1 ถึง 1 ทำให้ความน่าจะเป็นก่อนหน้านี้ 5% สำหรับผลกระทบที่ใหญ่กว่า - 1 หรือ 1 เนื่องจากเอฟเฟกต์ที่มีขนาดใหญ่นี้ไม่ค่อยเกิดขึ้นนี่เป็นเหตุผลที่สมควรมาก่อนหรือไม่?

1
ทฤษฎีบทเบย์ที่มีเงื่อนไขหลายข้อ
ฉันไม่เข้าใจว่าสมการนี้มาจากอะไร P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M_{1}\cap M_{2}) \leq \frac{P(I)}{P(I')}\cdot \frac{P(M_{1}|I)P(M_{2}|I)}{P(M_{1}|I')P(M_{2}|I')} สมการนี้มาจากบทความ "Trial by Probability" ซึ่งเป็นกรณีตัวอย่างของ OJ Simpson ซึ่งเป็นปัญหาตัวอย่าง จำเลยอยู่ระหว่างการพิจารณาคดีฆาตกรรมสองครั้งและมีหลักฐานสองประการแนะนำเขา M 2ฉันฉัน′M1M1M_{1}เป็นเหตุการณ์ที่เลือดของจำเลยตรงกับหยดเลือดที่พบในที่เกิดเหตุ เป็นเหตุการณ์ที่เลือดของเหยื่อจับคู่กับถุงเท้าของจำเลย สมมติว่ามีความผิดการเกิดขึ้นของหลักฐานหนึ่งเพิ่มความน่าจะเป็นของคนอื่น เป็นเหตุการณ์ที่จำเลยเป็นผู้บริสุทธิ์ในขณะที่เป็นเมื่อเขามีความผิดM2M2M_{2}IIII′I′I' เรากำลังพยายามที่จะทำให้เพดานของความน่าจะเป็นที่จำเลยเป็นผู้บริสุทธิ์ที่ได้รับหลักฐานทั้งสอง ได้รับค่าตัวแปรบางตัว แต่สิ่งที่ฉันสนใจคือวิธีที่ได้มาของสมการ ฉันพยายาม แต่ไม่มีที่ไหนเลย ใช่ฉันได้ตรวจสอบ 'คำถามที่อาจมีคำตอบของคุณแล้ว'

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.