การใช้ความคาดหวังสูงสุดกับตัวอย่างเหรียญ
เมื่อเร็ว ๆ นี้ฉันได้ศึกษาด้วยตนเองถึงความคาดหวังสูงสุดและคว้าตัวอย่างง่ายๆในกระบวนการ: จากที่นี่ : มีสามเหรียญ ,และมี ,และความน่าจะเป็นที่จะลงจอดบนเฮดเมื่อถูกโยน โยนc_0หากผลลัพธ์คือ Head ให้โยนสามครั้งมิฉะนั้นจะโยนสามครั้ง ข้อมูลที่สังเกตได้ที่ผลิตโดยและเป็นดังนี้: HHH, TTT, HHH, TTT, HHH ข้อมูลที่ซ่อนอยู่เป็นผลมาจากc_0ประมาณการหน้า1 p 2c0c0c_0c1c1c_1c2c2c_2p0p0p_0p1p1p_1p2p2p_2c0c0c_0c1c1c_1c2c2c_2c1c1c_1c2c2c_2c 0 c0c0c_0p0p0p_0 ,และP_2p1p1p_1p2p2p_2 และจากที่นี่ : มีสองเหรียญcAcAc_AและcBcBc_BกับpApAp_AและpBpBp_Bเป็นความน่าจะเป็นที่จะลงจอดบนหัวเมื่อโยน ในแต่ละรอบเลือกหนึ่งเหรียญโดยการสุ่มและโยนสิบครั้ง; บันทึกผลลัพธ์ ข้อมูลที่สังเกตได้คือผลลัพธ์การโยนที่ได้จากสองเหรียญ อย่างไรก็ตามเราไม่ทราบว่าเหรียญใดถูกเลือกสำหรับรอบหนึ่ง ๆ ประมาณการpApAp_AและpBpBp_Bบี ในขณะที่ฉันสามารถคำนวณได้ แต่ฉันไม่สามารถเกี่ยวข้องกับวิธีที่พวกเขาแก้ไขกับทฤษฎี EM ดั้งเดิมได้ โดยเฉพาะอย่างยิ่งระหว่างขั้นตอน M-Step ของทั้งสองตัวอย่างฉันไม่เห็นว่าพวกเขากำลังเพิ่มประสิทธิภาพสูงสุดอย่างไร ดูเหมือนว่าพวกเขากำลังคำนวณพารามิเตอร์ใหม่และพารามิเตอร์ใหม่นั้นดีกว่าพารามิเตอร์เดิม ยิ่งไปกว่านั้น E-Steps ทั้งสองนั้นไม่ได้มีลักษณะที่เหมือนกันซึ่งไม่ต้องพูดถึง E-Step ของทฤษฎีดั้งเดิม ดังนั้นตัวอย่างเหล่านี้ทำงานอย่างไร