ฉันสงสัยว่าการประเมินความน่าจะเป็นสูงสุดที่เคยใช้ในสถิติหรือไม่
แน่นอน! จริง ๆ แล้วค่อนข้างมาก - แต่ไม่เสมอไป
เราเรียนรู้แนวคิดของมัน แต่ฉันสงสัยว่ามันถูกใช้จริงเมื่อใด
เมื่อคนมีรูปแบบการกระจายแบบพารามิเตอร์พวกเขามักเลือกที่จะใช้การประเมินความเป็นไปได้สูงสุด เมื่อแบบจำลองนั้นถูกต้องจะมีคุณสมบัติที่มีประโยชน์จำนวนหนึ่งของตัวประมาณความน่าจะเป็นสูงสุด
ตัวอย่างหนึ่ง - การใช้ตัวแบบเชิงเส้นแบบทั่วไปค่อนข้างแพร่หลายและในกรณีนั้นพารามิเตอร์ที่อธิบายค่าเฉลี่ยจะถูกประเมินโดยความน่าจะเป็นสูงสุด
อาจเกิดขึ้นได้ว่ามีการประมาณค่าพารามิเตอร์บางอย่างโดยความน่าจะเป็นสูงสุดและอื่น ๆ ไม่ใช่ ตัวอย่างเช่นพิจารณา Poisson GLM ที่มีการกระจายตัวมากเกินไป - พารามิเตอร์การกระจายจะไม่ถูกประเมินโดยความน่าจะเป็นสูงสุดเนื่องจาก MLE ไม่มีประโยชน์ในกรณีนั้น
หากเราถือว่าการกระจายของข้อมูลเราพบสองพารามิเตอร์
ทีนี้บางครั้งคุณอาจมีสองตัว แต่บางครั้งคุณมีพารามิเตอร์หนึ่งตัวบางครั้งก็สามหรือสี่อย่างหรือมากกว่านั้น
หนึ่งอันสำหรับค่าเฉลี่ยและอีกอันสำหรับความแปรปรวน
คุณกำลังคิดของรูปแบบเฉพาะหรือไม่? นี่ไม่ใช่กรณีเสมอไป พิจารณาการประเมินพารามิเตอร์ของการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปัวซองหรือการแจกแจงแบบทวินาม ในแต่ละกรณีมีพารามิเตอร์หนึ่งตัวและค่าความแปรปรวนเป็นฟังก์ชันของพารามิเตอร์ที่อธิบายค่าเฉลี่ย
หรือพิจารณาการแจกแจงแกมมาทั่วไปซึ่งมีสามพารามิเตอร์ หรือการกระจายเบต้าสี่พารามิเตอร์ซึ่งมี (อาจไม่น่าแปลกใจ) สี่พารามิเตอร์ โปรดทราบว่า (ขึ้นอยู่กับการกำหนดพารามิเตอร์เฉพาะ) ความหมายหรือความแปรปรวนหรือทั้งสองอย่างอาจไม่ได้แสดงด้วยพารามิเตอร์เดียว แต่โดยฟังก์ชั่นของหลาย ๆ
ตัวอย่างเช่นการแจกแจงแกมม่าซึ่งมีการกำหนดพารามิเตอร์สามแบบที่เห็นการใช้งานทั่วไป - ทั้งสองที่พบบ่อยที่สุดซึ่งมีทั้งค่าเฉลี่ยและความแปรปรวนเป็นฟังก์ชันของพารามิเตอร์สองตัว
โดยทั่วไปแล้วในแบบจำลองการถดถอยหรือ GLM หรือแบบจำลองการอยู่รอด (ในประเภทแบบจำลองอื่น ๆ อีกมากมาย) แบบจำลองอาจขึ้นอยู่กับตัวทำนายหลายตัวซึ่งในกรณีนี้การกระจายที่เกี่ยวข้องกับการสังเกตแต่ละครั้งภายใต้แบบจำลองอาจมีหนึ่งในพารามิเตอร์ของตัวเอง แม้แต่พารามิเตอร์หลายตัว) ที่เกี่ยวข้องกับตัวแปรทำนายหลายตัว ("ตัวแปรอิสระ")