คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต

1
เมื่อทำการ parametrizing ฟังก์ชั่นความน่าจะเป็นอีกครั้งมันก็เพียงพอแล้วที่จะเสียบตัวแปรที่แปลงแล้วแทนที่จะเป็นสูตรการเปลี่ยนแปลงของตัวแปรหรือไม่?
สมมติว่าฉันกำลังพยายามสร้างความน่าจะเป็นซ้ำให้กับฟังก์ชันที่มีการแจกแจงแบบเอ็กซ์โปเนนเชียล หากฟังก์ชันความน่าจะเป็นดั้งเดิมของฉันคือ: p ( y∣ θ ) = θ e- θ yพี(Y|θ)=θอี-θY p(y \mid \theta) = \theta e^{-\theta y} และฉันต้องการอีกครั้ง parametrize โดยใช้เนื่องจากไม่ได้เป็นตัวแปรสุ่ม แต่พารามิเตอร์มันเพียงพอที่จะเสียบ?ϕ = 1θφ=1θ\phi = \frac{1}{\theta}θθ\theta สิ่งที่ฉันหมายถึงอย่างชัดเจนคือ: p ( y∣ ϕ = 1θ) = 1φอี- 1φYพี(Y|φ=1θ)=1φอี-1φY p\left(y \mid \phi = \frac{1}{\theta}\right) = \frac{1}{\phi} e^{-\frac{1}{\phi} y} ถ้าเป็นเช่นนั้นฉันไม่แน่ใจว่าทฤษฎีที่อยู่เบื้องหลังเรื่องนี้คืออะไร ความเข้าใจของฉันคือฟังก์ชั่นความน่าจะเป็นเป็นหน้าที่ของพารามิเตอร์ดังนั้นทำไมฉันไม่จำเป็นต้องใช้การเปลี่ยนแปลงของสูตรตัวแปรทำให้ฉันสับสน ความช่วยเหลือใด ๆ …

1
bayesglm (แขน) กับ MCMCpack
ทั้งbayesglm()(ในแพ็คเกจ R) และฟังก์ชั่นต่าง ๆ ในแพ็คเกจ MCMCpack มีวัตถุประสงค์เพื่อทำการประมาณค่าแบบจำลองเชิงเส้นแบบเบย์แบบเบย์ แต่ฉันไม่แน่ใจว่าพวกเขากำลังคำนวณสิ่งเดียวกัน ฟังก์ชั่น MCMCpack ใช้โซ่มาร์คอฟ Monte Carlo เพื่อให้ได้ตัวอย่าง (ขึ้นอยู่กับ) จากส่วนหลังของข้อต่อสำหรับพารามิเตอร์รุ่น bayesglm()ในทางกลับกันผลิตผล ฉันไม่แน่ใจ ดูเหมือนbayesglm()จะสร้างการประมาณค่าแบบจุดซึ่งจะทำให้การประมาณค่า MAP (สูงสุดหลัง) แทนที่จะเป็นการประมาณแบบเบย์แบบเต็ม แต่มีsim()ฟังก์ชั่นที่ดูเหมือนว่าสามารถใช้ในการดึงหลังได้ บางคนสามารถอธิบายความแตกต่างในการใช้งานทั้งสองอย่างได้ไหม สามารถbayesglm() + sim()ผลิตหลังดึงที่แท้จริงหรือมันเป็นประมาณบางชนิด?

3
การอนุมานแบบผสม 2-Gaussian ด้วย MCMC และ PyMC
ปัญหา ฉันต้องการให้พอดีกับพารามิเตอร์แบบจำลองของประชากร 2-Gaussian แบบเรียบง่าย ให้ทุก hype รอบวิธี Bayesian ฉันต้องการเข้าใจว่าสำหรับปัญหานี้อนุมาน Bayesian เป็นเครื่องมือที่ดีกว่าวิธีการกระชับแบบดั้งเดิม จนถึงตอนนี้ MCMC ทำงานได้แย่มากในตัวอย่างของเล่นนี้ แต่บางทีฉันอาจมองข้ามบางสิ่งบางอย่าง ดังนั้นเรามาดูรหัส เครื่องมือ ฉันจะใช้ python (2.7) + scipy stack, lmfit 0.8 และ PyMC 2.3 สมุดบันทึกเพื่อทำซ้ำการวิเคราะห์สามารถพบได้ที่นี่ สร้างข้อมูล ก่อนอื่นให้สร้างข้อมูล: from scipy.stats import distributions # Sample parameters nsamples = 1000 mu1_true = 0.3 mu2_true = 0.55 sig1_true = 0.08 …

3
เมื่อใดที่จะยุติการทดสอบ A / B แบบเบย์?
ฉันพยายามที่จะทำ A / B การทดสอบด้วยวิธีแบบเบย์เช่นเดียวกับในการเขียนโปรแกรมสำหรับความน่าจะเป็นแฮกเกอร์และคชกรรมการทดสอบ A / B บทความทั้งสองอนุมานว่าผู้มีอำนาจตัดสินใจตัดสินใจว่าตัวแปรใดดีกว่าโดยขึ้นอยู่กับความน่าจะเป็นของเกณฑ์บางอย่างเช่นดังนั้นจึงดีกว่า ความน่าจะเป็นนี้ไม่ได้ให้ข้อมูลใด ๆ ว่ามีข้อมูลเพียงพอที่จะสรุปได้หรือไม่ ดังนั้นจึงไม่ชัดเจนสำหรับฉันเมื่อต้องหยุดการทดสอบAP(pA>pB)=0.97P(pA>pB)=0.97P(p_A > p_B) = 0.97 AAA สมมติว่ามีสอง RVs ไบนารีและBและฉันต้องการที่จะประเมินว่าเป็นไปได้ที่p_A> p_Bและ\ frac {p_A - p_B} {} p_A> 5 \%ตามข้อสังเกตของและB นอกจากนี้สมมติว่าผู้ออกแบบโปสเตอร์ p_Aและp_Bนั้นเป็นรุ่นเบต้าAAABBBpA>pBpA>pB p_A > p_B pA−pBpA>5%pA−pBpA>5% \frac{p_A - p_B}{p_A} > 5\% AAABBBpApAp_ApBpBp_B เนื่องจากฉันสามารถหาพารามิเตอร์α,βα,β\alpha, \betaสำหรับpA|datapA|datap_A\,|\,\text{data} และpB|datapB|datap_B\,|\,\text{data} ฉันสามารถเก็บตัวอย่าง posteriors และประมาณP(pA>pB | data)P(pA>pB …

2
เหมือนหรือต่างกัน ทางเบย์
พูดว่าฉันมีรูปแบบดังต่อไปนี้: Poisson(λ)∼{λ1λ2if t<τif t≥τPoisson(λ)∼{λ1if t<τλ2if t≥τ\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases} และฉันสรุปผู้โปสเตอร์สำหรับและλ 2 ที่แสดงด้านล่างจากข้อมูลของฉัน มีวิธีการบอกแบบเบย์ (หรือเชิงปริมาณ) ถ้าλ 1และλ 2เป็นเหมือนกันหรือแตกต่างกัน ?λ1λ1\lambda_1λ2λ2\lambda_2λ1λ1\lambda_1λ2λ2\lambda_2 บางทีการวัดความน่าจะเป็นที่แตกต่างจากλ 2λ1λ1\lambda_1λ2λ2\lambda_2หรือไม่? หรืออาจจะใช้ divergences ของ KL? ตัวอย่างเช่นฉันจะวัดหรืออย่างน้อยp ( λ 2 > λ 1 ) ได้อย่างไรp(λ2≠λ1)p(λ2≠λ1)p(\lambda_2 \neq \lambda_1)p(λ2>λ1)p(λ2>λ1)p(\lambda_2 …

2
การเปรียบเทียบที่ดีเพื่อแสดงให้เห็นถึงจุดแข็งของแบบจำลองลำดับชั้น Bayesian คืออะไร
ฉันค่อนข้างใหม่กับสถิติแบบเบย์และใช้ JAGS เมื่อเร็ว ๆ นี้เพื่อสร้างแบบจำลองแบบเบย์แบบลำดับชั้นในชุดข้อมูลที่แตกต่างกัน ในขณะที่ฉันพอใจกับผลลัพธ์มาก (เมื่อเทียบกับโมเดล glm มาตรฐาน) ฉันต้องอธิบายให้ผู้ที่ไม่ใช่นักสถิติเห็นว่าความแตกต่างของแบบจำลองทางสถิติมาตรฐานคืออะไร โดยเฉพาะอย่างยิ่งฉันต้องการแสดงให้เห็นว่าทำไมและเมื่อ HBMs ทำงานได้ดีกว่าแบบจำลองที่ง่ายกว่า การเปรียบเทียบจะมีประโยชน์โดยเฉพาะอย่างยิ่งที่แสดงองค์ประกอบสำคัญบางอย่าง: หลายระดับของความแตกต่าง ความจำเป็นในการคำนวณเพิ่มเติมเพื่อให้พอดีกับโมเดล ความสามารถในการดึง "สัญญาณ" เพิ่มเติมจากข้อมูลเดียวกัน โปรดทราบว่าคำตอบนั้นควรเป็นการเปรียบเทียบกับคนที่ไม่มีสถิติไม่ใช่ตัวอย่างที่ง่ายและดูดี

4
แนวคิดแบบผสมและวิธีเบย์
ในรูปแบบผสมเราถือว่าผลกระทบแบบสุ่ม (พารามิเตอร์) เป็นตัวแปรสุ่มที่เป็นไปตามการแจกแจงปกติ มันดูคล้ายกับวิธีเบย์ซึ่งมีการสันนิษฐานว่าพารามิเตอร์ทั้งหมดเป็นแบบสุ่ม ดังนั้นแบบจำลองลักษณะพิเศษแบบสุ่มของกรณีพิเศษของวิธีการแบบเบย์?

2
เกี่ยวกับความเป็นอิสระตามเงื่อนไขและการแสดงกราฟิก
เมื่อศึกษาการเลือกความแปรปรวนร่วมฉันเคยอ่านตัวอย่างต่อไปนี้ ด้วยความเคารพต่อรูปแบบดังต่อไปนี้: เมทริกซ์ความแปรปรวนร่วมและเมทริกซ์ความแปรปรวนร่วมผกผันมีดังต่อไปนี้ ฉันไม่เข้าใจว่าทำไมความอิสระของและจึงถูกตัดสินโดยความแปรปรวนร่วมที่นี่?yxxxyyy ตรรกะทางคณิตศาสตร์ที่เป็นรากฐานของความสัมพันธ์นี้คืออะไร? นอกจากนี้กราฟด้านซ้ายในรูปต่อไปนี้อ้างว่าสามารถจับความสัมพันธ์ที่เป็นอิสระระหว่างและ ; ทำไม?yxxxyyy

2
PyMC สำหรับการจัดกลุ่มแบบไม่ใช้พารามิเตอร์: กระบวนการ Dirichlet เพื่อประเมินพารามิเตอร์ของส่วนผสมแบบเกาส์ไม่สามารถทำคลัสเตอร์ได้
การตั้งค่าปัญหา หนึ่งในปัญหาของเล่นครั้งแรกที่ฉันต้องการใช้ PyMC กับการจัดกลุ่มแบบไม่ใช้พารามิเตอร์: ให้ข้อมูลบางส่วนสร้างแบบจำลองเป็นแบบเกาส์และเรียนรู้จำนวนของกลุ่มและค่าเฉลี่ยและความแปรปรวนร่วมของแต่ละกลุ่ม สิ่งที่ฉันรู้เกี่ยวกับวิธีนี้ส่วนใหญ่มาจากการบรรยายทางวิดีโอโดย Michael Jordan และ Yee Whye Teh ประมาณปี 2007 (ก่อนที่จะกลายเป็นความโกรธแค้น) และสองสามวันสุดท้ายของการอ่านบทเรียนของดร. Fonnesbeck และ E. Chen [fn1], [ Fn2] แต่ปัญหาคือการศึกษาที่ดีและมีการใช้งานที่น่าเชื่อถือ [fn3] ในปัญหาของเล่นนี้ฉันสร้างสิบดึงจากหนึ่งมิติเกาส์และสี่สิบวาดจาก . อย่างที่คุณเห็นด้านล่างฉันไม่ได้สลับการสุ่มเพื่อให้ง่ายต่อการบอกว่าตัวอย่างใดมาจากส่วนประกอบผสมN ( μ = 4 , σ = 2 )ยังไม่มีข้อความ( μ = 0 , σ= 1 )N(μ=0,σ=1)\mathcal{N}(\mu=0, \sigma=1)ยังไม่มีข้อความ( μ = 4 , σ= …

3
การถดถอยทั่วไปแบบถ่วงน้ำหนักใน BUGS, JAGS
ในRเราสามารถ "น้ำหนักก่อนหน้า" การglmถดถอยผ่านพารามิเตอร์น้ำหนัก ตัวอย่างเช่น: glm.D93 <- glm(counts ~ outcome + treatment, family = poisson(), weights=w) วิธีนี้สามารถทำได้ในJAGSหรือBUGSรูปแบบ? ฉันพบบทความบางส่วนเกี่ยวกับเรื่องนี้ แต่ไม่มีบทความใดแสดงให้เห็น ฉันสนใจตัวอย่างปัวซองและการถดถอยโลจิสติกเป็นส่วนใหญ่

3
วิธีการเห็นภาพความดีแบบเบย์ของความเหมาะสมสำหรับการถดถอยโลจิสติก
สำหรับปัญหาการถดถอยแบบลอจิสติกแบบเบย์ฉันได้สร้างการแจกแจงการคาดการณ์หลัง ฉันสุ่มตัวอย่างจากการแจกแจงแบบคาดการณ์และได้รับตัวอย่างจำนวนมาก (0,1) สำหรับการสังเกตแต่ละครั้งที่ฉันมี การแสดงให้เห็นถึงความดีงามของพอดีนั้นน้อยกว่าที่น่าสนใจตัวอย่างเช่น พล็อตนี้แสดงตัวอย่าง 10,000 ตัวอย่าง + จุดข้อมูลที่สังเกตได้ (วิธีทางซ้ายสามารถสร้างเส้นสีแดงได้: ใช่แล้วนั่นคือการสังเกต) ปัญหาคือว่าพล็อตนี้ไม่ค่อยให้ข้อมูลและฉันจะมี 23 อันหนึ่งอันสำหรับแต่ละจุดข้อมูล มีวิธีที่ดีกว่าในการมองเห็นจุดข้อมูล 23 จุดพร้อมตัวอย่างหลังหรือไม่ ความพยายามอื่น: ความพยายามอื่นขึ้นอยู่กับกระดาษที่นี่

2
ฉันจะสร้างแบบจำลองสัดส่วนด้วย BUGS / JAGS / STAN ได้อย่างไร
ฉันกำลังพยายามสร้างแบบจำลองที่การตอบสนองเป็นสัดส่วน (อันที่จริงแล้วมันคือส่วนแบ่งของคะแนนโหวตที่บุคคลได้รับจากการเลือกตั้ง) การกระจายของมันไม่ปกติดังนั้นฉันตัดสินใจที่จะจำลองด้วยการแจกแจงแบบเบต้า ฉันยังมีผู้ทำนายหลายคน อย่างไรก็ตามฉันไม่รู้วิธีเขียนใน BUGS / JAGS / STAN (JAGS จะเป็นตัวเลือกที่ดีที่สุดของฉัน แต่มันก็ไม่สำคัญอะไร) ปัญหาของฉันคือฉันสร้างผลรวมของพารามิเตอร์โดยตัวทำนาย แต่แล้วฉันจะทำอย่างไรกับมัน? รหัสจะเป็นแบบนี้ (ในรูปแบบของ JAGS) แต่ฉันไม่รู้วิธี "ลิงก์" y_hatและyพารามิเตอร์ for (i in 1:n) { y[i] ~ dbeta(alpha, beta) y_hat[i] <- a + b * x[i] } ( y_hatเป็นเพียงผลคูณของพารามิเตอร์และตัวทำนายดังนั้นความสัมพันธ์ที่กำหนดขึ้นได้aและbเป็นสัมประสิทธิ์ที่ฉันพยายามประเมินxเป็นตัวทำนาย) ขอบคุณสำหรับคำแนะนำของคุณ!

1
ปัจจัยเบย์กับนักบวชที่ไม่เหมาะสม
ฉันมีคำถามเกี่ยวกับการเปรียบเทียบแบบจำลองโดยใช้ปัจจัยของเบย์ ในหลายกรณีนักสถิติมีความสนใจที่จะใช้วิธีการแบบเบย์ร่วมกับนักบวชที่ไม่เหมาะสม (ตัวอย่างเช่นนักบวชเจฟฟรีย์และนักบวชอ้างอิง) คำถามของฉันคือในกรณีที่การกระจายตัวด้านหลังของพารามิเตอร์แบบจำลองมีการกำหนดไว้อย่างถูกต้องมันจะถูกต้องหรือไม่ที่จะเปรียบเทียบแบบจำลองที่ใช้ปัจจัย Bayes ภายใต้การใช้ของนักบวชที่ไม่เหมาะสม? ตัวอย่างง่ายๆลองพิจารณาเปรียบเทียบโมเดลปกติกับโมเดลโลจิสติกกับ Jeffreys priors

2
ตำราเรียนที่ได้รับ Metropolis-Hastings และ Gibbs Sampling
ฉันมีประสบการณ์ในทางปฏิบัติที่ดีกับการสุ่มตัวอย่าง Metropolis-Hastings และ Gibbs แต่ฉันต้องการทำความเข้าใจทางคณิตศาสตร์ของอัลกอริทึมเหล่านี้ให้ดีขึ้น หนังสือหรือบทความดี ๆ อะไรบ้างที่พิสูจน์ความถูกต้องของตัวอย่างเหล่านี้ (อัลกอริธึมที่มากกว่านั้นก็ยอดเยี่ยมเช่นกัน)?

3
วิธีทำแบบจำลองลำเอียงที่มีอคติแตกต่างกันไปตามเวลา
สินค้าทุกรุ่นของเหรียญลำเอียงมักจะมีพารามิเตอร์หนึ่งtheta) วิธีหนึ่งในการประมาณจากชุดของการจับฉลากคือการใช้เบต้าก่อนหน้านี้และคำนวณการกระจายด้านหลังด้วยความน่าจะเป็นทวินามθ=P(Head|θ)θ=P(Head|θ)\theta = P(\text{Head} | \theta)θθ\theta ในการตั้งค่าของฉันเพราะของกระบวนการทางกายภาพบางอย่างแปลกคุณสมบัติเหรียญของฉันจะเปลี่ยนแปลงอย่างช้าๆและกลายเป็นหน้าที่ของเวลาทีข้อมูลของฉันคือชุดของคำสั่งให้ดึงเช่น\} ฉันสามารถพิจารณาว่าฉันมีเพียงหนึ่งวาดสำหรับแต่ละในตารางเวลาไม่ต่อเนื่องและปกติθθ\thetattt{H,T,H,H,H,T,...}{H,T,H,H,H,T,...}\{H,T,H,H,H,T,...\}ttt คุณจะทำแบบนี้อย่างไร ฉันกำลังคิดบางอย่างเช่นตัวกรองคาลมานที่ปรับให้เข้ากับความจริงที่ว่าตัวแปรที่ซ่อนอยู่คือและรักษาโอกาสทวินาม ฉันจะใช้อะไรกับโมเดลเพื่อให้อนุมานได้θθ\thetaP(θ(t+1)|θ(t))P(θ(t+1)|θ(t))P(\theta(t+1)|\theta(t)) แก้ไขคำตอบต่อไปนี้ (ขอบคุณ!) : ฉันต้องการสร้างแบบจำลองเป็น Markov Chain ของคำสั่งที่ 1 เหมือนที่ทำในตัวกรอง HMM หรือ Kalman ข้อสันนิษฐานเดียวที่ฉันทำได้คือราบรื่น ฉันสามารถเขียนด้วยเสียงแบบเกาส์ขนาดเล็ก (ความคิดตัวกรองคาลมาน) แต่สิ่งนี้จะทำลายข้อกำหนดที่จะต้องยังคงอยู่ใน[0,1]จากแนวคิดต่อไปนี้จาก @J Dav ฉันสามารถใช้ฟังก์ชัน probit เพื่อแมปบรรทัดจริงกับแต่ฉันมีสัญชาตญาณว่าสิ่งนี้จะให้โซลูชันที่ไม่ใช่การวิเคราะห์ การแจกแจงแบบเบต้าพร้อมค่าเฉลี่ยθ(t)θ(t)\theta(t)θ(t)θ(t)\theta(t)P(θ(t+1)|θ(t))=θ(t)+ϵP(θ(t+1)|θ(t))=θ(t)+ϵP(\theta(t+1)|\theta(t)) = \theta(t) + \epsilonϵϵ\epsilonθθ\theta[0,1][0,1][0,1][0,1][0,1][0,1]θ(t)θ(t)\theta(t) และความแปรปรวนที่กว้างขึ้นสามารถทำกลอุบายได้ ฉันถามคำถามนี้เพราะฉันรู้สึกว่าปัญหานี้ง่ายมากจนต้องมีการศึกษามาก่อน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.