คุณจำเป็นต้องถามคำถามที่น่าสนใจเป็นอย่างยิ่ง: ฉันควรทำนายโดยใช้ "MAP Bayesian" การประมาณค่าสูงสุดหลังหรือ "Real Bayesian"
สมมติว่าคุณรู้ว่าการแจกแจงที่แท้จริงที่จากนั้นใช้การประมาณค่า MAP สมมติว่าคุณต้องการคาดคะเน 100 การพยากรณ์ในผลการค้นหา 100 ครั้งต่อไป คุณควรคาดเดาว่าฟลิปคือหางไม่ต้องเดาหัวและหาง สิ่งนี้เรียกว่า "MAP Bayesian" โดยทั่วไปคุณกำลังทำอยู่20 80P( H) = 0.22080
หาเรื่องสูงสุดθฉ( x | θ )
ไม่ยากที่จะพิสูจน์ว่าโดยการทำเช่นนั้นคุณสามารถลดข้อผิดพลาดที่คาดการณ์ไว้ (การสูญเสีย 0-1) หลักฐานที่สามารถพบได้ในหน้า ~ 53 รู้เบื้องต้นเกี่ยวกับการเรียนรู้ทางสถิติ
มีอีกวิธีหนึ่งในการทำสิ่งนี้เรียกว่าวิธี "เบย์จริง" โดยทั่วไปคุณไม่ได้พยายาม "เลือกผลลัพธ์ที่มีความน่าจะเป็นสูงที่สุด แต่ให้พิจารณาทุกกรณีที่เป็นไปได้" ดังนั้นหากมีคนขอให้คุณ "คาดการณ์ 100 ถัดไป" การพลิกคุณควรหยุดเขา / เธอเพราะเมื่อคุณได้รับ 100 ไบนารีผลลัพธ์ ข้อมูลความน่าจะเป็นของแต่ละผลลัพธ์จะหายไป แต่คุณควรถามว่าคุณต้องการทำอะไรหลังจากรู้ผลลัพธ์
สมมติว่าเขา / เธอมีฟังก์ชั่นการสูญเสียบางอย่าง (ไม่จำเป็นต้องสูญเสีย 0-1 เช่นฟังก์ชั่นการสูญเสียสามารถถ้าคุณพลาดหัวคุณต้องจ่าย$ 1 แต่ถ้าคุณพลาดหางคุณต้องจ่าย$ 5 คือการสูญเสียที่ไม่สมดุล) จากการทำนายของคุณจากนั้นคุณควรใช้ความรู้ของคุณเกี่ยวกับการแจกแจงผลลัพธ์เพื่อลดการสูญเสียการกระจายทั้งหมด
ΣxΣYp ( x , y) L ( f( x ) , y)
นั่นคือการรวมความรู้ของคุณเกี่ยวกับการแจกแจงสู่การสูญเสียแทนที่จะเป็น "วิธีการคิดแบบสเตจ" เพื่อรับการทำนายและทำขั้นตอนถัดไป
ยิ่งไปกว่านั้นคุณมีสัญชาตญาณที่ดีมากเกี่ยวกับสิ่งที่จะเกิดขึ้นเมื่อมีผลลัพธ์ที่เป็นไปได้มากมาย การประมาณค่า MAP จะไม่ทำงานได้ดีถ้าจำนวนผลลัพธ์มีขนาดใหญ่และมวลความน่าจะเป็นแพร่กระจายอย่างกว้างขวาง ลองคิดดูว่าคุณมีลูกเต๋า 100 แต้มและคุณรู้ว่าการแจกแจงที่แท้จริง ที่ไหนและPตอนนี้คุณทำอะไรกับ MAP คุณจะเดาได้เสมอว่าคุณจะได้ด้านแรกเนื่องจากมีความน่าจะเป็นที่มากที่สุดเมื่อเทียบกับคนอื่น ๆ อย่างไรก็ตามคุณจะผิดของเวลา !!P ( S 2 ) = P ( S 3 ) = P ( S 100 ) = 0.9 / 99 = 0.009090 S 1P( S1) = 0.1P( S2) = P( S3) = P( S100) = 0.9 / 99 = 0.009090S190 %