เห็นได้ชัดว่าปัจจัยของ Bayes ใช้ความน่าจะเป็นที่แสดงถึงความน่าจะเป็นของแต่ละรุ่นที่รวมอยู่ในพื้นที่พารามิเตอร์ทั้งหมด (เช่นไม่ใช่ที่ MLE) โดยทั่วไปแล้วการบูรณาการนี้ประสบความสำเร็จได้อย่างไร? มีใครลองทำการคำนวณความน่าจะเป็นที่แต่ละตัวอย่างสุ่มจากหลายพัน (ล้าน?) จากพื้นที่พารามิเตอร์หรือมีวิธีการวิเคราะห์เพื่อรวมความน่าจะเป็นในพื้นที่พารามิเตอร์หรือไม่?
ก่อนอื่นสถานการณ์ใด ๆ ที่คุณพิจารณาคำเช่นสำหรับข้อมูลDและรุ่นMถือเป็นแบบจำลองความน่าจะเป็น นี่มักจะเป็นขนมปังและเนยของการวิเคราะห์ทางสถิติบ่อยครั้งหรือเบย์และนี่คือส่วนที่การวิเคราะห์ของคุณตั้งใจจะแนะนำคือแบบที่ดีหรือไม่ดี ดังนั้นเบย์จึงไม่ได้ทำสิ่งใดที่แตกต่างจากอัตราส่วนความน่าจะเป็นP(D|M)DM
การใส่ปัจจัยเบย์ไว้ในตำแหน่งที่ถูกต้องเป็นสิ่งสำคัญ เมื่อคุณมีสองรุ่นพูดและคุณแปลงจากความน่าจะเป็นเป็นอัตราต่อรองปัจจัย Bayes ทำหน้าที่เหมือนโอเปอเรเตอร์ตามความเชื่อเดิม:
PosteriorOdds=BayesFactor∗PriorOdds
P( M1| D)P( M2| D)= B F. × P( M1)P( M2)
ความแตกต่างที่แท้จริงคืออัตราส่วนความน่าจะเป็นที่ถูกกว่าในการคำนวณและง่ายต่อการระบุแนวคิด ความน่าจะเป็นที่ MLE เป็นเพียงการประมาณค่าจุดของตัวคูณตัวประกอบของ Bayes และตัวหารตามลำดับ เช่นเดียวกับสิ่งปลูกสร้างที่พบบ่อยที่สุดมันสามารถถูกมองว่าเป็นกรณีพิเศษของการวิเคราะห์แบบเบย์โดยมีการวางแผนล่วงหน้ามาก่อนซึ่งยากที่จะเข้าถึง แต่ส่วนใหญ่มันเกิดขึ้นเพราะมันง่ายต่อการวิเคราะห์และง่ายต่อการคำนวณ (ในยุคก่อนที่วิธีการคำนวณแบบเบย์จะเกิดขึ้น)
จนถึงการคำนวณใช่: คุณจะประเมินความเป็นไปได้ที่อินทิกรัลอินทิเกรชั่นในการตั้งค่าแบบเบย์ด้วยกระบวนการมอนติคาร์โลขนาดใหญ่ในเกือบทุกกรณีที่น่าสนใจ มีตัวจำลองพิเศษบางอย่างเช่น GHK ซึ่งทำงานได้ถ้าคุณสมมติว่ามีการแจกแจงบางอย่างและถ้าคุณตั้งสมมติฐานเหล่านี้บางครั้งคุณอาจพบปัญหาที่สามารถแก้ไขได้ซึ่งสามารถวิเคราะห์ได้ซึ่งมีปัจจัยการวิเคราะห์แบบเบย์อย่างครบถ้วน
แต่ไม่มีใครใช้สิ่งเหล่านี้ ไม่มีเหตุผลที่จะ ด้วยตัวอย่างที่ดีที่สุดของ Metropolis / Gibbs และวิธีการ MCMC อื่น ๆ มันสามารถจัดการปัญหาเหล่านี้ได้อย่างสมบูรณ์แบบในการขับเคลื่อนข้อมูลอย่างสมบูรณ์และคำนวณอินทิกรัลของคุณเป็นตัวเลข ในความเป็นจริงเรามักจะทำตามลำดับชั้นและรวมผลลัพธ์มากกว่า meta-priors ที่เกี่ยวข้องกับกลไกการเก็บข้อมูลการออกแบบการทดลองที่ไม่น่าสนใจ ฯลฯ
ฉันแนะนำหนังสือการวิเคราะห์ข้อมูลแบบเบส์สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ แม้ว่าผู้เขียน Andrew Gelman ดูเหมือนว่าจะไม่สนใจปัจจัยเบย์มากนัก นอกจากนี้ฉันเห็นด้วยกับ Gelman หากคุณกำลังจะไป Bayesian แล้วใช้ประโยชน์จากด้านหลังเต็มรูปแบบ การเลือกแบบจำลองด้วยวิธีเบย์นั้นเปรียบเสมือนการแฮนดิแคปเพราะการเลือกแบบจำลองเป็นวิธีการอนุมานที่อ่อนแอและไร้ประโยชน์ส่วนใหญ่ ฉันอยากรู้ว่าการกระจายตัวเลือกโมเดลถ้าฉันทำได้ ... ใครจะสนใจปริมาณมันลงไปที่ "model A ดีกว่า model B" เรียงลำดับงบเมื่อคุณไม่ต้อง?
นอกจากนี้เมื่อคำนวณปัจจัย Bayes จะใช้การแก้ไขสำหรับความซับซ้อน (โดยอัตโนมัติผ่านการตรวจสอบความน่าจะเป็นหรือการวิเคราะห์ผ่าน AIC) โดยอัตโนมัติเช่นเดียวกับอัตราส่วนความน่าจะเป็นหรือไม่
M1M2d1d2d1< วัน2ยังไม่มีข้อความ
B1 , 2M1M1ยังไม่มีข้อความ→ ∞B1 , 2∞
B1 , 2= O ( N12( d2- d1))
ฉันคุ้นเคยกับที่มานี้และการสนทนาจากหนังสือFinite Mixture และ Markov Switching Modelsโดย Sylvia Frühwirth-Schnatter แต่มีแนวโน้มว่าจะมีสถิติทางบัญชีโดยตรงที่ดำดิ่งลงไปในญาณวิทยาพื้นฐานมากกว่า
ฉันไม่ทราบรายละเอียดที่ดีพอที่จะให้พวกเขาที่นี่ แต่ฉันเชื่อว่ามีการเชื่อมโยงทางทฤษฎีที่ค่อนข้างลึกซึ้งระหว่างสิ่งนี้กับการได้มาของ AIC หนังสือ The Information Theory โดย Cover และ Thomas บอกใบ้อย่างน้อย
นอกจากนี้อะไรคือความแตกต่างทางปรัชญาระหว่างอัตราส่วนความน่าจะเป็นและปัจจัย Bayes (หมายเหตุ: ฉันไม่ได้ถามเกี่ยวกับความแตกต่างทางปรัชญาระหว่างอัตราส่วนความน่าจะเป็นและวิธีการแบบเบย์โดยทั่วไป แต่ปัจจัย Bayes เป็นตัวแทนของ เราจะอธิบายลักษณะของความหมายของปัจจัย Bayes ได้อย่างไรเมื่อเทียบกับอัตราส่วนความน่าจะเป็น
ส่วนบทความวิกิพีเดียเกี่ยวกับ "การตีความ"ทำได้ดีในการอภิปรายเรื่องนี้ (โดยเฉพาะแผนภูมิแสดงความแข็งแกร่งของระดับหลักฐานของ Jeffreys)
ตามปกติไม่มีอะไรมากไปกว่าความแตกต่างพื้นฐานทางปรัชญาระหว่างวิธีเบย์และวิธีการที่ใช้บ่อย (ซึ่งคุณคุ้นเคยอยู่แล้ว)
สิ่งสำคัญคืออัตราส่วนความน่าจะเป็นไม่สอดคล้องกันในความหมายของหนังสือภาษาดัตช์ คุณสามารถปรุงสถานการณ์ที่การอนุมานการเลือกแบบจำลองจากอัตราส่วนความน่าจะเป็นจะนำไปสู่การยอมรับการเดิมพันที่เสีย วิธีการแบบเบย์นั้นเชื่อมโยงกัน แต่ดำเนินการมาก่อนซึ่งอาจแย่มากและต้องถูกเลือก ข้อตกลงการค้า
FWIW ฉันคิดว่าการเลือกรูปแบบที่มีพารามิเตอร์มากชนิดนี้ไม่ใช่การอนุมานที่ดีมาก ฉันชอบวิธีการแบบเบย์และฉันชอบที่จะจัดระเบียบแบบลำดับชั้นให้มากขึ้นและฉันต้องการการอนุมานเพื่อมุ่งเน้นไปที่การกระจายหลังแบบเต็มถ้ามันเป็นไปได้ที่จะคำนวณได้ ฉันคิดว่าปัจจัยของ Bayes มีคุณสมบัติทางคณิตศาสตร์ที่ประณีต แต่ในฐานะของตัวเองแบบเบย์ฉันไม่ประทับใจพวกเขา พวกเขาปกปิดส่วนที่เป็นประโยชน์จริงๆของการวิเคราะห์แบบเบย์ซึ่งมันบังคับให้คุณจัดการกับนักบวชของคุณในที่โล่งแทนที่จะกวาดพวกมันไว้ใต้พรมและช่วยให้คุณสามารถอนุมานผู้โพสต์เต็มรูปแบบ