(คำตอบนี้ใช้ลิงค์ที่สองที่คุณให้ไว้)
L [ θ | X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5)XiZ=(Z1,…,Z5)
เป็นเหรียญที่ใช้ในการทดสอบแต่ละครั้ง
เราต้องการที่จะหาโอกาสสูงสุดประมาณการtheta} ความคาดหวัง-การเพิ่มประสิทธิภาพ (EM) ขั้นตอนวิธีการเป็นหนึ่งในวิธีการดังกล่าวเพื่อหา (อย่างน้อยท้องถิ่น)theta} มันทำงานโดยการค้นหาความคาดหวังที่มีเงื่อนไขซึ่งจะถูกใช้เพื่อเพิ่ม\แนวคิดก็คือว่าอย่างต่อเนื่องโดยการหาโอกาสมากขึ้น (เช่นน่าจะมากกว่า)
ในแต่ละซ้ำเราอย่างต่อเนื่องจะเพิ่มขึ้น θ θθPr[X,Z| θ]θ^θ^θθPr[X,Z|θ]ซึ่งจะเพิ่มฟังก์ชั่นความน่าจะเป็น มีสามสิ่งที่ต้องทำก่อนที่จะทำการออกแบบอัลกอริธึมที่อิงกับ EM
- สร้างแบบจำลอง
- คำนวณความคาดหวังตามเงื่อนไขภายใต้โมเดล (E-Step)
- เพิ่มโอกาสของเราให้มากที่สุดโดยอัปเดตประมาณการปัจจุบันของ (M-Step)θ
สร้างแบบจำลอง
ก่อนที่เราจะไปต่อกับ EM เราต้องหาว่ามันคืออะไรกันแน่ ใน E-ขั้นตอนที่เรากำลังคำนวณว่าค่าที่คาดหวังสำหรับtheta] แล้วค่านี้คืออะไรจริงเหรอ? สังเกตว่า
เหตุผลคือเรามีการทดลอง 5 รายการที่จะพิจารณาและเราไม่ทราบว่ามีการใช้เหรียญใดในแต่ละรายการ ความไม่เท่าเทียมเกิดจากล็อกPr [ X , Z | θ ]logPr[X,Z| θ] เข้าสู่ระบบ
เข้าสู่ระบบราคา[ X, Z| θ]= ∑i = 15เข้าสู่ระบบΣค∈ { A , B }ราคา[ Xผม, Zผม= C| θ]= ∑i = 15เข้าสู่ระบบΣค∈ { A , B }Pr [ Zผม= C| Xผม, θ ] ⋅ Pr [ Xผม, Zผม= C| θ]Pr [ Zผม= C| Xผม, θ ]≥ ∑i = 15Σค∈ { A , B }Pr [ Zผม= C| Xผม,θ]⋅logPr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ].
logเป็นเว้าและใช้ความไม่เท่าเทียมกันของเซ่น เหตุผลที่เราต้องการขอบเขตที่ต่ำกว่าก็คือเราไม่สามารถคำนวณหาค่า max max กับสมการดั้งเดิมได้โดยตรง อย่างไรก็ตามเราสามารถคำนวณได้สำหรับขอบเขตล่างสุดท้าย
ตอนนี้คืออะไร? มันเป็นโอกาสที่เราจะเห็นเหรียญได้รับการทดสอบและ\การใช้ความน่าจะเป็นตามเงื่อนไขที่เรามีC X i θ Pr [ Z i = C | X i , θ ] = Pr [ X i , Z i = C | θ ]Pr [ Zผม= C| Xผม, θ ]คXผมθ
Pr [ Zผม= C| Xผม, θ ] = Pr [ Xผม, Zผม= C| θ]ราคา[ Xผม| θ].
ในขณะที่เราดำเนินการไปแล้วเรายังไม่ได้ทำแบบจำลอง ความน่าจะเป็นที่เหรียญที่ได้รับพลิกเป็นลำดับอย่างไร ให้
ตอนนี้เป็นอย่างชัดเจนเพียงแค่ความเป็นไปได้ภายใต้ความเป็นไปได้ของหรือ B ตั้งแต่เรามี
h i = # heads ใน X i Pr [ X i , Z i = C | θ ] = 1Xผมชั่วโมงผม= # heads ใน Xผม
Pr[Xi| θ]Zฉัน=Zฉัน=BPr[Zฉัน=]=Pr[Zฉัน=B]=1/2
Pr[Xi,Zi=C|θ]=12⋅θhiC(1−θC)10−hi, for C∈{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2Pr[Xi|θ]=1/2⋅(Pr[Xi|Zi= A , θ ] + Pr [ Xผม| Zผม= B , θ ] )
E-ขั้นตอน
โอเค ... นั่นไม่สนุกเท่าไหร่ แต่เราสามารถเริ่มทำงาน EM ได้แล้วตอนนี้ อัลกอริทึม EM เริ่มต้นโดยการสุ่มเดาบางสำหรับ\ในตัวอย่างนี้เรามี(0.6,0.5) เราคำนวณ
ค่านี้สอดคล้องกับสิ่งที่อยู่ในกระดาษ ตอนนี้เราสามารถคำนวณจำนวนหัวที่คาดหวังในจากเหรียญ ,
ทำสิ่งเดียวกันสำหรับเหรียญθ 0 = ( 0.6 , 0.5 ) Pr [ Z 1 = | X 1 , θ ] = 1 / 2 ⋅ ( 0.6 5 ⋅ 0.4 5 )θθ0= ( 0.6 , 0.5 )X1=(H,T,T,T,H,H,T,H,T,H)AE[#หัวด้วยเหรียญ A| X1,θ]
Pr [ Z1= A | X1, θ ] = 1 / 2 ⋅ ( 0.65⋅ 0.45)1 / 2 ⋅ ( ( 0.65⋅ 0.45) + ( 0.55⋅ 0.55) )≈ 0.45
X1= ( H, T, T, T, ช, ช, T, ช, T, ช)AE [ # heads โดยเหรียญ A | X1, θ ] = ชั่วโมง1⋅ Pr [ Z1= A | X1, θ ] = 5 ⋅ 0.45 ≈ 2.2
Bเราได้มา
E [ # หัวด้วยเหรียญ B | X1, θ ] = ชั่วโมง1⋅ Pr [ Z1= B | X1, θ ] = 5 ⋅ 0.55 ≈ 2.8
เราสามารถคำนวณเหมือนกันสำหรับจำนวนหางโดยการแทนสำหรับh_1 นี้ยังคงค่าอื่น ๆ ทั้งหมดของและ5 ด้วยความเป็นเส้นตรงของความคาดหวังเราสามารถหา
ชั่วโมง110 - ชม1Xผมชั่วโมงผม 1 ≤ i ≤ 5E [ # heads โดยเหรียญ A | X, θ ] = ∑i = 15E [ # heads โดยเหรียญ A | Xผม, θ ]
M-ขั้นตอน
ด้วยค่าที่คาดหวังของเราในมือตอนนี้มาถึงขั้นตอน M ที่เราต้องการเพิ่มสูงสุด
ตามค่าที่คาดหวังของเรา สิ่งนี้ทำได้โดยการทำให้เป็นมาตรฐานแบบธรรมดา!
ในทำนองเดียวกันสำหรับBกระบวนการนี้เริ่มต้นอีกครั้งด้วย E-Step และและดำเนินต่อไปจนกว่าค่าสำหรับมารวมกัน (หรือกับบางเกณฑ์ที่อนุญาต) ในตัวอย่างนี้เรามี 10 ซ้ำและ0.52) ในแต่ละซ้ำค่าของ
θ
θ1A= E[ # หัวเหนือ X โดยเหรียญ A | X, θ ]E[ # หัวและก้อยเหนือ X โดยเหรียญ A | X, θ ]= 21.321.3 + 9.6≈ 0.71
Bθ1θθ^= θ10= ( 0.8 , 0.52 )ราคา[ X, Z| θ]เพิ่มขึ้นเนื่องจากการประมาณที่ดีขึ้น
θ\
ในกรณีนี้แบบจำลองค่อนข้างเรียบง่าย สิ่งที่ได้รับมากความซับซ้อนมากขึ้นสวยได้อย่างรวดเร็ว แต่อัลกอริทึม EM มักจะมาบรรจบกันและมักจะผลิต maxmimum โอกาสประมาณการtheta} อาจเป็นตัวประมาณท้องถิ่นแต่เพื่อให้ได้สิ่งนี้เราสามารถเริ่มกระบวนการ EM ใหม่ด้วยการเริ่มต้นที่แตกต่างกัน เราสามารถทำสิ่งนี้ได้ในจำนวนครั้งที่คงที่และรักษาผลลัพธ์ที่ดีที่สุด (เช่นผู้ที่มีโอกาสสุดท้ายที่สูงที่สุด)θ^