คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต

5
หลังเบย์ต้องมีการกระจายที่เหมาะสมหรือไม่?
ฉันรู้ว่านักบวชไม่จำเป็นต้องเหมาะสมและฟังก์ชั่นความน่าจะเป็นไม่ได้รวมเข้ากับ 1 เช่นกัน แต่คนหลังต้องมีการกระจายตัวที่เหมาะสมหรือไม่? อะไรคือความหมายถ้ามัน / ไม่

3
เคยมีคอนจูเกตก่อนหน้า: ทรัพย์สินลึกหรืออุบัติเหตุทางคณิตศาสตร์
การแจกแจงบางอย่างมีคอนจูเกตคอนจูเกตและบางอันไม่มี ความแตกต่างนี้เป็นเพียงอุบัติเหตุหรือไม่? นั่นคือคุณทำคณิตศาสตร์และมันได้ผลในทางใดทางหนึ่ง แต่มันไม่ได้บอกอะไรที่สำคัญเกี่ยวกับการแจกแจงยกเว้นความจริงด้วยตัวเอง? หรือการมีหรือไม่มีคอนจูเกตก่อนสะท้อนถึงคุณสมบัติที่ลึกกว่าของการแจกแจงหรือไม่? การแจกแจงกับนักบวชสังฆะแบ่งปันคุณสมบัติที่น่าสนใจอื่น ๆ หรือคุณสมบัติที่การกระจายอื่น ๆ ขาดที่ทำให้เกิดการกระจายเหล่านั้นและไม่ใช่ผู้อื่นที่จะมีการผันก่อนหน้านี้?

1
มีการปรับปรุงอะไรบ้างที่รู้จักกันดีในอัลกอริทึม MCMC แบบเรียนที่ผู้คนใช้สำหรับการอนุมานแบบเบย์?
เมื่อฉันเขียนโค้ดสำหรับการจำลอง Monte Carlo สำหรับปัญหาบางอย่างและตัวแบบนั้นง่ายพอฉันใช้การสุ่มตัวอย่างตำราเรียนพื้นฐานกิ๊บส์ เมื่อเป็นไปไม่ได้ที่จะใช้การสุ่มตัวอย่างของกิ๊บส์ฉันจะเขียนรหัสตำราเรียน Metropolis-Hastings ที่ฉันเรียนรู้เมื่อหลายปีก่อน ความคิดเดียวที่ฉันมอบให้คือเลือกการกระจายการกระโดดหรือพารามิเตอร์ ฉันรู้ว่ามีวิธีการพิเศษหลายร้อยและหลายร้อยวิธีที่พัฒนาขึ้นจากตัวเลือกตำราเรียนเหล่านั้น แต่ฉันมักไม่เคยคิดถึงการใช้ / การเรียนรู้ มันมักจะรู้สึกว่ามันเป็นความพยายามมากเกินไปในการปรับปรุงนิดหน่อยสิ่งที่ทำงานได้ดีอยู่แล้ว แต่เมื่อเร็ว ๆ นี้ฉันกำลังคิดว่าอาจจะไม่มีวิธีการทั่วไปแบบใหม่ที่สามารถปรับปรุงสิ่งที่ฉันทำ เป็นเวลาหลายทศวรรษแล้วที่ค้นพบวิธีการเหล่านั้น บางทีฉันล้าสมัยจริงๆ ! มีทางเลือกอื่น ๆ ที่รู้จักกันดีใน Metropolis-Hastings หรือไม่: ใช้งานง่ายพอสมควร เป็นที่ยอมรับในระดับสากลว่าเป็น MH และปรับปรุงผลลัพธ์ของ MH ให้ดีขึ้นอยู่เสมอ (การคำนวณประสิทธิภาพความแม่นยำ ฯลฯ ) ฉันรู้เกี่ยวกับการปรับปรุงที่พิเศษมากสำหรับโมเดลที่มีความพิเศษมาก แต่มีบางสิ่งที่ทุกคนใช้โดยทั่วไปที่ฉันไม่รู้

1
การวินิจฉัยที่เหลือในรูปแบบการถดถอยแบบ MCMC
ฉันเพิ่งลงมือเมื่อไม่นานมานี้ในแบบผสมการถดถอยที่เหมาะสมในกรอบ Bayesian โดยใช้อัลกอริทึม MCMC (ฟังก์ชั่น MCMCglmm ใน R จริง) ฉันเชื่อว่าฉันเข้าใจวิธีการวินิจฉัยลู่เข้าของกระบวนการประมาณ (ติดตาม, พล็อต geweke, autocorrelation, การกระจายหลัง ... ) สิ่งหนึ่งที่ทำให้ฉันตกอยู่ในกรอบการทำงานของ Bayesian คือความพยายามอย่างมากที่จะอุทิศให้กับการวินิจฉัยเหล่านั้นในขณะที่ดูเหมือนว่าจะทำได้น้อยมากในแง่ของการตรวจสอบชิ้นส่วนที่เหลือของแบบจำลองที่ติดตั้ง ยกตัวอย่างเช่นใน MCMCglmm ส่วนฟังก์ชั่น residual.mcmc () นั้นยังมีอยู่ แต่ยังไม่ได้นำไปใช้จริง (เช่นส่งกลับ: "ส่วนที่เหลือยังไม่ได้นำไปใช้กับวัตถุ MCMCglmm"; เรื่องเดียวกันสำหรับทำนาย. ดูเหมือนว่าจะขาดจากแพ็คเกจอื่น ๆ เช่นกันและโดยทั่วไปแล้วจะมีการพูดคุยกันเล็กน้อยในวรรณคดีที่ฉันพบ ใครช่วยชี้ให้ฉันถึงการอ้างอิงที่มีประโยชน์และรหัส R ที่ฉันสามารถเล่นหรือแก้ไขได้ ขอบคุณมาก.

2
วิธีเลือกระหว่างอัลกอริทึมการเรียนรู้
ฉันต้องใช้โปรแกรมที่จะจัดประเภทระเบียนเป็น 2 หมวดหมู่ (จริง / เท็จ) ขึ้นอยู่กับข้อมูลการฝึกอบรมบางอย่างและฉันสงสัยว่าอัลกอริทึม / วิธีการที่ฉันควรจะดู ดูเหมือนจะมีพวกเขาให้เลือกมากมาย - โครงข่ายประสาทเทียม, อัลกอริทึมทางพันธุกรรม, การเรียนรู้ของเครื่อง, การเพิ่มประสิทธิภาพเบย์เซียนเป็นต้นและอื่น ๆ ฉันไม่แน่ใจว่าจะเริ่มจากตรงไหน ดังนั้นคำถามของฉันคือ ฉันจะเลือกอัลกอริทึมการเรียนรู้ที่ฉันควรใช้สำหรับปัญหาของฉันได้อย่างไร หากสิ่งนี้ช่วยได้นี่คือปัญหาที่ฉันต้องแก้ไข ข้อมูลการฝึกอบรม: ข้อมูล การฝึกอบรมประกอบด้วยแถวจำนวนมากเช่นนี้: Precursor1, Precursor2, Boolean (true/false) การวิ่งที่ ฉันจะได้รับมาก่อน จากนั้น ฉันเลือกอัลกอริทึม A จากอัลกอริธึมที่แตกต่างกัน (หรือสร้างอัลกอริทึมแบบไดนามิก) และใช้กับชุดค่าผสมที่เป็นไปได้ของสารตั้งต้นเหล่านี้และรวบรวม "บันทึก" ที่ถูกปล่อยออกมา "บันทึก" ประกอบด้วยคู่ค่าคีย์หลายคู่ * ฉันใช้อัลกอริทึมที่ยอดเยี่ยมและจัดประเภทระเบียนเหล่านี้เป็น 2 หมวดหมู่ (จริง / เท็จ) ฉันจะสร้างตารางที่มีรูปแบบเดียวกับข้อมูลรถไฟ: Precursor1, Precursor2, Boolean …

5
ทฤษฎีการวัดเบื้องต้น
ฉันสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับเทคนิคแบบไม่มีพารามิเตอร์ Bayesian (และที่เกี่ยวข้อง) พื้นหลังของฉันอยู่ในวิทยาการคอมพิวเตอร์และถึงแม้ว่าฉันไม่เคยเรียนวิชาทฤษฎีการวัดหรือทฤษฎีความน่าจะเป็นมาก่อน แต่ฉันมีการฝึกอบรมอย่างเป็นทางการจำนวน จำกัด ในความน่าจะเป็นและสถิติ ทุกคนสามารถแนะนำการแนะนำแนวคิดที่อ่านได้เหล่านี้เพื่อเริ่มต้นกับฉันได้ไหม

4
การแจกแจงก่อนหน้าอย่างไม่ทราบข้อมูลสำหรับพารามิเตอร์มาตราส่วน
ฉันใช้การแจกแจงแบบปกติของล็อกเป็นการแจกแจงก่อนหน้าสำหรับพารามิเตอร์สเกล (สำหรับการแจกแจงแบบปกติ, การแจกแจงแบบอื่น ๆ ) เมื่อฉันมีความคิดคร่าวๆเกี่ยวกับสิ่งที่สเกลควรจะเป็น แต่ต้องการทำผิดด้าน มากเกี่ยวกับมัน ฉันใช้เพราะการใช้นั้นทำให้ฉันเข้าใจได้ง่าย แต่ฉันไม่ได้เห็นคนอื่นใช้ มีอันตรายซ่อนอยู่หรือไม่?

2
วิธีการสรุปช่วงเวลาที่น่าเชื่อถือสำหรับผู้ชมทางการแพทย์
ด้วยสแตนและส่วนหน้าแพคเกจrstanarmหรือฉันสามารถวิเคราะห์ข้อมูลทางคชกรรมที่สุดเท่าที่ฉันเคยทำมาก่อนกับการผสมรูปแบบเช่นbrms lmeในขณะที่ฉันมีหนังสือและบทความส่วนใหญ่โดย Kruschke-Gelman-Wagenmakers- ฯลฯ บนโต๊ะของฉันสิ่งเหล่านี้ไม่ได้บอกวิธีสรุปผลลัพธ์สำหรับผู้ชมทางการแพทย์ที่ขาดความโกรธแค้นของ Skyesa จาก Bayesian และ Charybdis ของผู้ตรวจสอบทางการแพทย์ ( "เราต้องการความสำคัญไม่ใช่สิ่งที่กระจาย") ตัวอย่าง: ความถี่กระเพาะอาหาร (1 / นาที) วัดเป็นสามกลุ่ม; การควบคุมสุขภาพเป็นข้อมูลอ้างอิง มีการวัดหลายอย่างสำหรับผู้เข้าร่วมแต่ละคนดังนั้นฉันมักใช้แบบผสมต่อไปนี้lme: summary(lme(freq_min~ group, random = ~1|study_id, data = mo)) ผลลัพธ์ที่แก้ไขเล็กน้อย: Fixed effects: freq_min ~ group Value Std.Error DF t-value p-value (Intercept) 2.712 0.0804 70 33.7 0.0000 groupno_symptoms 0.353 0.1180 27 …

2
ทำไม
พื้นหลัง หนึ่งของสินค้าที่อ่อนแอก่อนในความแปรปรวนมากที่สุดคือการผกผันแกมมากับพารามิเตอร์ (Gelman 2006)α = 0.001 , β= 0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 อย่างไรก็ตามการกระจายนี้มี CI 90% ของประมาณ ][ 3 × 1019, ∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf จากนี้ฉันตีความว่าให้ความน่าจะเป็นต่ำที่ความแปรปรวนจะสูงมากและความน่าจะเป็นต่ำมากที่ความแปรปรวนจะน้อยกว่า 1 P ( σ < 1 | α = 0.001 , β = 0.001 ) = 0.006ผมG ( …

1
จาก Bayesian Networks ไปยัง Neural Networks: วิธีการถดถอยหลายตัวแปรสามารถเปลี่ยนเป็นเครือข่ายหลายเอาท์พุทได้อย่างไร
ฉันกำลังจัดการกับโมเดลเชิงเส้นลำดับชั้นแบบเบย์ที่นี่เครือข่ายอธิบาย YYYหมายถึงยอดขายสินค้ารายวันในซูเปอร์มาร์เก็ต (ปฏิบัติตาม) XXXเป็นเมทริกซ์ที่รู้จักกันดีของผู้ถดถอยซึ่งรวมถึงราคาโปรโมชั่นวันของสัปดาห์สภาพอากาศวันหยุด 1SSSคือระดับสินค้าคงคลังแฝงที่ไม่รู้จักของแต่ละผลิตภัณฑ์ซึ่งทำให้เกิดปัญหามากที่สุดและฉันพิจารณาเวกเตอร์ของตัวแปรไบนารีหนึ่งรายการสำหรับแต่ละผลิตภัณฑ์ที่มีบ่งบอกถึงการออกจากสต็อคและดังนั้นความไม่พร้อมใช้งานของผลิตภัณฑ์ แม้ว่าในทางทฤษฎีไม่ทราบว่าฉันประเมินมันผ่าน HMM สำหรับแต่ละผลิตภัณฑ์ดังนั้นจึงถือได้ว่าเป็นที่รู้จักกันในชื่อ X.ฉันเพิ่งตัดสินใจปลดมันเพื่อพิธีการที่เหมาะสม111 ηη\etaเป็นพารามิเตอร์เอฟเฟกต์แบบผสมสำหรับผลิตภัณฑ์ใด ๆ ก็ตามที่พิจารณาถึงผลกระทบแบบผสมคือราคาผลิตภัณฑ์โปรโมชั่นและสต็อกสินค้า b 1 b 2ββ\betaคือเวกเตอร์ของสัมประสิทธิ์การถดถอยคงที่ในขณะที่และเป็นเวกเตอร์ของสัมประสิทธิ์ผลกระทบผสม กลุ่มหนึ่งบ่งบอกถึงแบรนด์และอีกกลุ่มระบุถึงรสชาติ (นี่คือตัวอย่างในความเป็นจริงฉันมีหลายกลุ่ม แต่ที่นี่ฉันรายงานเพียง 2 เพื่อความชัดเจน)ข1ข1b_1ข2ข2b_2 Σ ข1 Σ ข2ΣηΣη\Sigma_{\eta} ,และเป็นเหนือเอฟเฟกต์ผสมΣข1Σข1\Sigma_{b_1}Σข2Σข2\Sigma_{b_2} เนื่องจากฉันมีข้อมูลจำนวนมากสมมติว่าฉันปฏิบัติต่อยอดขายแต่ละครั้งเนื่องจาก Poisson กระจายเงื่อนไขบน Regressors (แม้ว่าสำหรับผลิตภัณฑ์บางอย่างการประมาณเชิงเส้นจะถือและสำหรับคนอื่นแบบจำลองที่สูงเกินศูนย์จะดีกว่า) ในกรณีเช่นนี้ฉันจะมีผลิตภัณฑ์ ( นี่เป็นเพียงสำหรับผู้ที่สนใจในแบบจำลอง Bayesian เองข้ามไปที่คำถามหากคุณพบว่ามันไม่น่าสนใจหรือไม่สำคัญ :) ):YYY Ση∼ ฉันW( α0, γ0)Ση~ผมW(α0,γ0)\Sigma_{\eta} \sim IW(\alpha_0,\gamma_0) Σข1∼ ฉันW( α1, γ1)Σข1~ผมW(α1,γ1)\Sigma_{b_1} \sim IW(\alpha_1,\gamma_1) …

2
การสุ่มตัวอย่าง Gibbs กับ MH-MCMC ทั่วไป
ฉันเพิ่งได้อ่านการสุ่มตัวอย่างของกิ๊บส์และอัลกอริทึม Metropolis Hastings และมีคำถามสองสามข้อ อย่างที่ฉันเข้าใจในกรณีของการสุ่มตัวอย่างของกิ๊บส์ถ้าเรามีปัญหาหลายตัวแปรขนาดใหญ่เราจะสุ่มตัวอย่างจากการแจกแจงแบบมีเงื่อนไขนั่นคือตัวอย่างหนึ่งตัวแปรในขณะที่รักษาตัวแปรอื่น ๆ ทั้งหมดไว้ในขณะที่ MH เราสุ่มตัวอย่าง สิ่งหนึ่งที่เอกสารกล่าวคือตัวอย่างที่เสนอนั้นเป็นที่ยอมรับเสมอในการสุ่มตัวอย่างกิ๊บส์นั่นคืออัตราการยอมรับข้อเสนออยู่เสมอ 1 สำหรับฉันแล้วนี่เป็นข้อได้เปรียบที่ยิ่งใหญ่สำหรับปัญหาหลายตัวแปรขนาดใหญ่ดูเหมือนว่าอัตราการปฏิเสธสำหรับอัลกอริธึม MH ค่อนข้างใหญ่ . หากเป็นเช่นนั้นจริง ๆ แล้วอะไรคือสาเหตุที่ไม่ใช้ Gibbs Sampler ตลอดเวลาในการสร้างการกระจายหลัง

2
การวิเคราะห์การอยู่รอดแบบเบย์: โปรดเขียนก่อนสำหรับ Kaplan Meier!
พิจารณาข้อสังเกตขวาตรวจสอบกับเหตุการณ์ที่เกิดขึ้นครั้ง ... จำนวนบุคคลที่อ่อนแอในช่วงเวลาที่ฉันเป็นn ฉันและจำนวนของเหตุการณ์ที่เกิดขึ้นในเวลาที่ฉันเป็นdฉันt1,t2,…t1,t2,…t_1, t_2, \dotsiiininin_iiiididid_i Kaplan-Meier หรือประมาณการผลิตภัณฑ์ที่เกิดขึ้นตามธรรมชาติเป็น MLE เมื่อฟังก์ชั่นการอยู่รอดเป็นฟังก์ชั่นขั้นตอนฉัน ความน่าจะเป็นแล้ว L ( α ) = Πฉัน ( 1 - α ฉัน) d ฉัน α n ฉัน - d ฉันฉัน และ MLE คือαฉัน = 1 - d ฉันS(t)=∏i:ti&lt;tαiS(t)=∏i:ti&lt;tαiS(t) = \prod_{i : t_i < t} \alpha_iL(α)=∏i(1−αi)diαni−diiL(α)=∏i(1−αi)diαini−di L(\alpha) = \prod_i (1-\alpha_i)^{d_i} \alpha_i^{n_i-d_i} …

3
สถิติเบื้องต้นสำหรับลูกขุน
ฉันถูกเรียกตัวให้ทำหน้าที่คณะลูกขุน ฉันตระหนักถึงความเกี่ยวข้องของสถิติกับการพิจารณาของคณะลูกขุน ตัวอย่างเช่นแนวคิดของ "อัตราฐาน" และการประยุกต์ใช้กับการคำนวณความน่าจะเป็นบางครั้งอาจเกี่ยวข้องกับทุกครั้ง หัวข้อทางสถิติใดที่บุคคลในสถานการณ์ของฉันอาจศึกษาอย่างมีประโยชน์และวัสดุใดที่จะเหมาะสำหรับบางคนที่มีภูมิหลัง ฉันมีระดับ "วิทยาศาสตร์ที่ยาก" และมีความรู้ทางสถิติที่ จำกัด แต่ทักษะของฉันก็เป็นสนิม ฉันทำงานเต็มเวลาและไม่มีเวลาก่อนหน้าที่คณะลูกขุน ดังนั้นมันจะเหมาะสำหรับคำตอบที่จะมุ่งเน้นแนวคิดพื้นฐานทักษะการแก้ปัญหาอย่างง่ายและการประยุกต์ใช้กับปัญหาที่เกี่ยวข้อง (และข้อ จำกัด ของแนวคิดและวิธีการเหล่านั้นแน่นอน)

2
ฉันจะรวบรวมวิธีการหลังและช่วงเวลาที่น่าเชื่อถือหลังจากการใส่ร้ายหลายครั้งได้อย่างไร
ฉันใช้การใส่หลายชุดเพื่อรับชุดข้อมูลที่สมบูรณ์จำนวนหนึ่ง ฉันได้ใช้วิธีการแบบเบย์ในชุดข้อมูลแต่ละชุดที่เสร็จสมบูรณ์เพื่อรับการแจกแจงด้านหลังสำหรับพารามิเตอร์ (เอฟเฟกต์แบบสุ่ม) ฉันจะรวม / รวมผลลัพธ์สำหรับพารามิเตอร์นี้ได้อย่างไร บริบทเพิ่มเติม: แบบจำลองของฉันเป็นแบบลำดับชั้นในแง่ของนักเรียนแต่ละคน (หนึ่งการสังเกตต่อนักเรียนหนึ่งคน) จัดเป็นกลุ่มในโรงเรียน ฉันได้ทำการใส่หลาย ๆ ครั้ง (ใช้MICEใน R) กับข้อมูลของฉันซึ่งฉันรวมไว้schoolเป็นหนึ่งในตัวทำนายสำหรับข้อมูลที่หายไป - เพื่อพยายามรวมลำดับชั้นของข้อมูลเข้ากับการใส่ข้อมูล ฉันได้ติดตั้งโมเดลความชันสุ่มแบบง่ายกับชุดข้อมูลที่สมบูรณ์แต่ละชุด (ใช้MCMCglmmใน R) ผลลัพธ์ที่ได้คือไบนารี ฉันได้พบว่าความหนาแน่นด้านหลังของความแปรปรวนแบบสุ่มเป็น "พฤติกรรมที่ดี" ในแง่ที่ว่าพวกเขามีลักษณะเช่นนี้: ฉันจะรวม / รวมหมายถึงหลังและช่วงเวลาที่น่าเชื่อถือจากชุดข้อมูลแต่ละอันที่มีการกำหนดไว้สำหรับเอฟเฟกต์แบบสุ่มนี้ได้อย่างไร อัปเดต 1 : จากสิ่งที่ฉันเข้าใจจนถึงตอนนี้ฉันสามารถนำกฎของรูบินไปใช้กับค่าเฉลี่ยหลังเพื่อให้ค่าเฉลี่ยหลังซึ่งมีการโต้แย้งกันหลายครั้ง - มีปัญหาอะไรไหมกับการทำเช่นนี้? แต่ฉันไม่รู้ว่าจะรวมช่วงเวลาที่น่าเชื่อถือได้ 95% อย่างไร นอกจากนี้เนื่องจากฉันมีตัวอย่างความหนาแน่นด้านหลังที่แท้จริงสำหรับการใส่ร้ายแต่ละครั้ง - ฉันสามารถรวมสิ่งเหล่านี้ได้หรือไม่ อัปเดต 2 : ตามคำแนะนำของ @ cyan ในความคิดเห็นฉันชอบความคิดที่จะรวมตัวอย่างจากการแจกแจงหลังที่ได้จากชุดข้อมูลแต่ละชุดจากการใส่หลายครั้ง อย่างไรก็ตามฉันควรจะรู้เหตุผลทางทฤษฎีสำหรับการทำเช่นนี้

6
“ Bayesian เต็มที่” กับ“ Bayesian”
ฉันได้เรียนรู้เกี่ยวกับสถิติแบบเบย์และฉันมักจะอ่านบทความ "เราใช้แนวทางแบบเบย์" หรือสิ่งที่คล้ายกัน ฉันยังสังเกตเห็นน้อยกว่า: "เราใช้แนวทางแบบเบย์อย่างเต็มที่ " (ความสำคัญของฉัน) มีความแตกต่างระหว่างวิธีการเหล่านี้ในทางปฏิบัติหรือในทางทฤษฎีใด ๆ ? FWIW ฉันใช้แพ็คเกจMCMCglmmใน R ในกรณีที่เกี่ยวข้อง
20 bayesian 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.