EM ปัญหาการปฏิบัติอัลกอริทึม


9

นี่เป็นปัญหาการปฏิบัติสำหรับการสอบกลางภาค ปัญหาคือตัวอย่างอัลกอริทึม EM ฉันกำลังมีปัญหากับส่วน (f) ฉันแสดงรายการชิ้นส่วน (a) - (e) เพื่อความสมบูรณ์และในกรณีที่ฉันทำผิดพลาดก่อนหน้านี้

ให้เป็นอิสระตัวแปรสุ่มชี้แจงที่มีอัตราการ\น่าเสียดายที่ไม่มีการตรวจสอบค่าแท้จริงและเราจะสังเกตว่าค่าอยู่ในช่วงเวลาที่กำหนดหรือไม่ ให้ ,และ สำหรับ n ข้อมูลที่สังเกตประกอบด้วย{3j})X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(a) ให้โอกาสในการสังเกตข้อมูล:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(b) ให้โอกาสในการเก็บข้อมูลอย่างสมบูรณ์

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) หาค่าความหนาแน่นทำนายของตัวแปรแฝงf(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(d) E-step ให้ฟังก์ชันQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

โดยที่N1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(จ) ให้การแสดงออกสำหรับสำหรับrE[Xj|Grj=1,θi]r=1,2,3

ฉันจะแสดงรายการผลลัพธ์ของฉันซึ่งฉันค่อนข้างแน่ใจว่าถูกต้อง แต่การพิสูจน์จะยาวไปหน่อยสำหรับคำถามที่ looong นี้:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

นี่เป็นส่วนที่ฉันติดอยู่และอาจเป็นเพราะความผิดพลาดก่อนหน้านี้:

(f) M-Step ค้นหาที่เพิ่มสูงสุดθQ(θ,θi)

จากกฎแห่งความคาดหวังทั้งหมดเรามี ดังนั้นE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

ต่อไปฉันควรตั้งค่านี้ให้เท่ากับศูนย์และแก้ปัญหาสำหรับแต่ฉันได้ลองทำสิ่งนี้เป็นเวลานานมากและฉันไม่สามารถแก้ไข !θθ


ฉันแปลความหมายในฐานะพลังของเป็นเวลาหนึ่งนาที สับสนมากที่สุด โดยปกติจำนวนซ้ำ (จำนวนขั้นตอน) จะใส่ในวงเล็บหรือวงเล็บเพื่อให้จะไม่สับสนกับอำนาจ -th{i} อย่างน้อยน่าจะดีที่สุดที่จะบอกว่านั่นคือสิ่งที่มันเป็นในคำถาม (สมมติว่าตอนนี้ฉันมีมันถูกต้อง) θiθ[i](i)θ(i)iθi
Glen_b -Reinstate Monica

1
ใช่เกลนขออภัยเกี่ยวกับที่ก็เป็นที่แน่นอน th สำทับของอัลกอริทึมอีเอ็ม i
bdeonovic

คำตอบ:


5

ความน่าจะเป็นของข้อมูลที่สมบูรณ์ไม่ควรเกี่ยวข้องกับ G! มันควรจะเป็นโอกาสของเมื่อของโปเนนเชียล โปรดทราบว่าความน่าจะเป็นของข้อมูลที่สมบูรณ์ตามที่คุณเขียนมันทำให้ความเป็นไปได้ของการยกระดับนั้นง่ายขึ้นเนื่องจากเพียงคนเดียวเท่านั้นที่สามารถเป็น 1 ได้ทิ้ง 's ในความเป็นไปได้ของข้อมูล θXGrjG

ในส่วน (d) ควรคาดหวังความเป็นไปได้ของบันทึกข้อมูลที่สมบูรณ์ไม่ใช่โอกาสในการบันทึกข้อมูลที่สังเกตได้

นอกจากนี้คุณไม่ควรใช้กฎแห่งความคาดหวังทั้งหมด! จำได้ว่า G เป็นที่สังเกตและไม่ได้เป็นแบบสุ่มดังนั้นคุณควรได้รับการปฏิบัติอย่างใดอย่างหนึ่งของความคาดหวังที่มีเงื่อนไขเหล่านั้นสำหรับแต่ละX_jเพียงแทนที่ความคาดหวังตามเงื่อนไขนี้ด้วยคำว่าจากนั้นทำขั้นตอน MXjXj(i)


@Benjamin ปัญหาเกิดขึ้นได้อย่างไร? ฉันสามารถช่วยให้คุณเข้าใจวิธีการได้หรือไม่?
jsk

ขอบคุณสำหรับความคิดเห็น @jsk ผมเหนื่อยคืนที่ผ่านมาดังนั้นผมจึงเดินไปที่เตียง แต่ฉันจะแก้ไขปัญหานี้อีกครั้งในเช้าวันนี้หลังอาหารเช้า :)
bdeonovic

ฉันคิดว่าฉันคิดออกแล้ว! ขอขอบคุณอีกครั้ง! นี่เป็นการเตรียมการขั้นสุดท้ายที่ฉันมีในวันนี้ดังนั้นมันจึงช่วยอธิบายบางสิ่งเกี่ยวกับ EM ได้อย่างแท้จริง
bdeonovic

ไม่เป็นไร หวังว่าครั้งสุดท้ายของคุณจะไปได้ดีในวันนี้!
jsk

4

จากความคิดเห็นของ @ jsk ฉันจะพยายามแก้ไขข้อผิดพลาดของฉัน:

L(θ|X,G)=j=1nθeθxj

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]=nlogθθ(j=1ng1j1eθi)(1θieθi(1+1/θi))θ(j=1ng2jeθi(1eθi))(eθi(1+1/θi)e2θi(2+1/θi))θ(j=1ng3je2θi)(e2θi(2+1/θi))=nlogθθN1AθN2BθN3CQ(θ,θi)θ=nθN1AN2BN3C=set0

กำลังหาเราจะได้θθ(i+1)=nN1A+N2B+N3C

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.