วิธีการ MLE สามารถนำไปใช้ในกรณีที่มีคนรู้ว่ารูปแบบการทำงานขั้นพื้นฐานของ pdf (เช่น Gaussian หรือ log-normal หรือ exponential หรืออะไรก็ตาม) แต่ไม่ใช่พารามิเตอร์พื้นฐาน เช่นพวกเขาไม่รู้ค่าของและใน pdf: หรือรูปแบบไฟล์ PDF อื่น ๆ งานของวิธีการ MLE คือการเลือกค่าที่ดีที่สุด (เช่นที่เป็นไปได้มากที่สุด) สำหรับพารามิเตอร์ที่ไม่รู้จักเนื่องจากการวัดข้อมูลเฉพาะซึ่งถูกสังเกตเห็นจริง . ดังนั้นเพื่อตอบคำถามแรกของคุณใช่คุณอยู่ในสิทธิ์ที่จะถามใครสักคนเสมอσ F ( x | μ , σ ) = 1μσ
f(x|μ,σ)=12πσ2−−−−√exp[−(x−μ)22σ2]
x1,x2,x3,...รูปแบบของ pdf พวกเขาอยู่ภายใต้การประมาณการความเป็นไปได้สูงสุด จริง ๆ แล้วค่าพารามิเตอร์โดยประมาณที่พวกเขาบอกคุณไม่ได้มีความหมายเว้นเสียแต่ว่าพวกเขาจะสื่อสารบริบทนั้นเป็นครั้งแรก
อัลกอริทึม EM ดังที่ฉันเคยเห็นมาก่อนหน้านี้เป็นเมตาอัลอัลกอริธึมที่มีเมตาดาต้าบางส่วนหายไปและคุณต้องประเมินด้วยเช่นกัน ตัวอย่างเช่นบางทีฉันอาจมี pdf ซึ่งเป็นส่วนผสมของ Gaussians หลายตัวอย่างเช่น: ผิวเผินยกเว้น การเพิ่มพารามิเตอร์แอมพลิจูดมันดูคล้ายกับปัญหาก่อนหน้านี้ แต่ถ้าฉันบอกคุณว่าเรายังไม่รู้ค่าของ (เช่นจำนวนโหมดในส่วนผสมแบบเกาส์) และ เราต้องการประมาณว่าจากการวัดข้อมูล
f(x|A1,...,AN,μ1,...,μN,σ1,...σN)=∑k=1NAk2πσ2k−−−−√exp[−(x−μk)22σ2k]
AkNx1,x2,x3,... เกินไป?
ในกรณีนี้คุณมีปัญหาเพราะแต่ละค่าที่เป็นไปได้ของ (นี่คือส่วน "เมตา" ที่ฉันยิ่งทำให้เหนือ) สร้างแบบจำลองที่แตกต่างกันจริง ๆ ในบางแง่มุม ถ้าว่าคุณมีโมเดลที่มีสามพารามิเตอร์ ( , , ) ในขณะที่ถ้าว่าคุณมีโมเดลที่มีหกพารามิเตอร์ ( , , , , , ) ค่าความพอดีที่ดีที่สุดที่คุณได้รับ ( , , ) ในNN=1A1μ1σ1N=2A1A2μ1μ2σ1σ2A1μ1σ1N=1รุ่นไม่สามารถนำมาเปรียบเทียบกับค่าที่ดีที่สุดพอดีที่คุณได้รับสำหรับพารามิเตอร์เดียวกันผู้ที่อยู่ในรุ่นเพราะพวกเขามีรูปแบบที่แตกต่างกันมีจำนวนแตกต่างกันขององศาอิสระN=2
บทบาทของอัลกอริทึม EM คือการให้กลไกสำหรับการทำชนิดที่ของการเปรียบเทียบ (โดยปกติการจัดเก็บภาษี"โทษซับซ้อน"ที่ชอบค่าขนาดเล็กของ ) เพื่อที่เราสามารถเลือกมูลค่าโดยรวมที่ดีที่สุดสำหรับNNN
ดังนั้นเพื่อตอบคำถามเดิมของคุณอัลกอริทึม EM ต้องการข้อมูลจำเพาะที่แม่นยำน้อยกว่าในรูปแบบของ pdf บางคนอาจบอกว่ามันพิจารณาช่วงของตัวเลือกทางเลือก (เช่นตัวเลือกที่ , , , ฯลฯ ) แต่มันก็ยังต้องการให้คุณระบุบางอย่างเกี่ยวกับรูปแบบทางคณิตศาสตร์พื้นฐานของตัวเลือกเหล่านั้น - คุณยังคงต้องระบุ "ครอบครัว" ของไฟล์ PDF ที่เป็นไปได้ในบางกรณีแม้ว่าคุณจะปล่อยให้อัลกอริทึมเป็นตัวตัดสินว่าคุณ "สมาชิก" ของครอบครัวคนใดให้ข้อมูลที่เหมาะสมที่สุดN=1N=2N=3