แก้ไข:ฉันได้เพิ่มเป็นตัวอย่างง่ายๆอนุมานของค่าเฉลี่ยของx_iฉันยังได้ชี้แจงด้วยเล็กน้อยว่าทำไมช่วงเวลาที่น่าเชื่อถือและไม่ตรงกับช่วงความมั่นใจไม่ดี
ฉันเป็นคนเบย์เซียนที่มีใจศรัทธาอย่างยุติธรรมฉันกำลังอยู่ในช่วงวิกฤตการณ์แห่งศรัทธาแปลก ๆ
ปัญหาของฉันคือต่อไปนี้ สมมติว่าผมต้องการที่จะวิเคราะห์ข้อมูล IID บางx_iสิ่งที่ฉันจะทำคือ:
ก่อนเสนอแบบจำลองตามเงื่อนไข:
จากนั้นเลือกก่อนหน้าบน :
ในที่สุดใช้กฎของเบย์คำนวณหลัง: (หรือประมาณโดยประมาณถ้ามันไม่ควรคำนวณได้) และตอบคำถามทั้งหมดที่ฉันมีเกี่ยวกับθ
นี่เป็นวิธีการที่สมเหตุสมผล: ถ้าแบบจำลองที่แท้จริงของข้อมูลเป็น "ข้างใน" ของเงื่อนไขของฉัน (มันสอดคล้องกับค่าบางอย่างθ 0 ) จากนั้นฉันสามารถเรียกทฤษฎีการตัดสินใจทางสถิติเพื่อบอกว่าวิธีการของฉันเป็นที่ยอมรับ (ดู Robert's "ตัวเลือก Bayesian" สำหรับรายละเอียด; "สถิติทั้งหมด" ยังให้ข้อมูลที่ชัดเจนในบทที่เกี่ยวข้องด้วย)
อย่างไรก็ตามอย่างที่ทุกคนรู้ว่าสมมติว่าแบบจำลองของฉันถูกต้องค่อนข้างหยิ่ง: ทำไมธรรมชาติควรอยู่ในกล่องแบบจำลองที่ฉันได้พิจารณาอย่างเป็นธรรมชาติ มันเป็นจริงมากขึ้นที่จะคิดว่ารูปแบบที่แท้จริงของข้อมูลที่แตกต่างจากP ( X | θ )สำหรับทุกค่าของθ ซึ่งมักเรียกว่าแบบจำลอง "misspecified"
ปัญหาของฉันคือว่าในกรณีที่สะกดผิดพลาดเหมือนจริงมากขึ้นฉันไม่มีข้อโต้แย้งที่ดีสำหรับการเป็น Bayesian (เช่นการคำนวณการกระจายหลัง) กับการคำนวณค่าประมาณความน่าจะเป็นสูงสุด (MLE):
อันที่จริงตามKleijn, vd Vaart (2012)ในกรณีที่สะกดผิดการกระจายหลัง:
รวมเป็นกับการกระจาย dirac ที่ศูนย์กลางที่θ M L
ไม่ได้มีความแปรปรวนที่ถูกต้อง (ยกเว้นกรณีที่สองค่าเพียงเกิดขึ้นจะเหมือนกัน) ในการสั่งซื้อเพื่อให้แน่ใจว่าช่วงเวลาที่มีความน่าเชื่อถือของช่วงความเชื่อมั่นหลังการแข่งขันสำหรับ\(โปรดทราบว่าในขณะที่ช่วงความเชื่อมั่นเป็นสิ่งที่เห็นได้ชัดว่า Bayesians ไม่สนใจมากเกินไปในเชิงคุณภาพนี้หมายความว่าการกระจายหลังเป็นเรื่องที่ผิดอย่างยิ่งเพราะมันหมายถึงว่าช่วงเวลาที่น่าเชื่อถือไม่ได้มีความคุ้มครองที่ถูกต้อง)
ดังนั้นเราจึงชำระเบี้ยประกันภัยโดยทั่วไป (การอนุมานแบบเบย์โดยทั่วไปมีราคาแพงกว่า MLE) โดยไม่มีคุณสมบัติเพิ่มเติม
ดังนั้นในที่สุดคำถามของฉัน: มีข้อโต้แย้งใด ๆ ไม่ว่าจะเป็นทางทฤษฎีหรือเชิงประจักษ์สำหรับการใช้การอนุมานแบบเบย์กับทางเลือก MLE ที่ง่ายกว่าเมื่อแบบจำลองนี้ถูกพลาด
(เนื่องจากฉันรู้ว่าคำถามของฉันมักจะไม่ชัดเจนโปรดแจ้งให้เราทราบหากคุณไม่เข้าใจบางสิ่ง: ฉันจะพยายามใช้ถ้อยคำใหม่)
แก้ไข:ลองพิจารณาตัวอย่างง่ายๆ: อนุมานค่าเฉลี่ยของภายใต้แบบจำลองเกาส์เซียน (ด้วยความแปรปรวนที่รู้จักเพื่อทำให้ง่ายขึ้นยิ่งขึ้น) เราพิจารณาเกาส์ก่อนที่เราแสดงค่าเฉลี่ยก่อนแปรปรวนผกผันของก่อน Letเป็นค่าเฉลี่ยเชิงประจักษ์ของx_iสุดท้ายหมายเหตุ:2}) σ μ 0 β 0 ˉ X X ฉัน μ = ( β
การกระจายหลังคือ:
ในกรณีที่ระบุอย่างถูกต้อง (เมื่อมีการแจกแจงแบบเกาส์จริง ๆ ) ด้านหลังนี้มีคุณสมบัติที่ดีดังต่อไปนี้
หากถูกสร้างขึ้นจากโมเดลลำดับชั้นที่เลือกค่าเฉลี่ยที่ใช้ร่วมกันจากการแจกแจงก่อนหน้านั้นช่วงเวลาหลังที่น่าเชื่อถือจะมีความครอบคลุมที่แน่นอน เงื่อนไขกับข้อมูลความน่าจะเป็นของอยู่ในช่วงเวลาใด ๆ เท่ากับความน่าจะเป็นที่ผู้หลังกำหนดช่วงเวลานี้ θ
แม้ว่าก่อนหน้านี้จะไม่ถูกต้องช่วงเวลาที่น่าเชื่อถือมีความครอบคลุมที่ถูกต้องในวงเงินซึ่งก่อนหน้านี้มีอิทธิพลต่อหายไปหลัง
ด้านหลังมีคุณสมบัติที่ดีบ่อย ๆ : ตัวประมาณแบบเบย์ใด ๆ ที่สร้างขึ้นจากด้านหลังนั้นรับรองว่าสามารถยอมรับได้ค่าเฉลี่ยหลังนั้นเป็นตัวประมาณที่มีประสิทธิภาพ
ในกรณีที่ระบุผิดพลาดคุณสมบัติส่วนใหญ่ไม่ได้รับการประกันโดยทฤษฎี เพื่อที่จะแก้ไขความคิดลองสมมุติว่าตัวแบบที่แท้จริงสำหรับนั้นคือพวกเขาแทนการแจกแจงแบบนักเรียน คุณสมบัติเดียวที่เราสามารถรับประกัน (Kleijn, et al) คือการกระจายหลังมุ่งเน้นที่ความหมายที่แท้จริงของในวงเงิน\ โดยทั่วไปคุณสมบัติการครอบคลุมทั้งหมดจะหายไป โดยทั่วไปแล้วเราสามารถรับประกันได้ว่าในขอบเขตที่ จำกัด คุณสมบัติการรายงานข่าวนั้นผิดขั้นพื้นฐาน: การแจกแจงด้านหลังอธิบายความน่าจะเป็นที่ผิดไปยังพื้นที่ต่างๆของพื้นที่X i n → ∞