ถ้ามีคนพูดว่า
"วิธีการนั้นใช้การประเมินจุดMLEสำหรับพารามิเตอร์ที่เพิ่มสูงสุดดังนั้นจึงเป็นสิ่งที่เกิดขึ้นบ่อยครั้งและยิ่งไม่ใช่ Bayesian"
คุณจะเห็นด้วยไหม
- อัปเดตบนพื้นหลัง : เมื่อเร็ว ๆ นี้ฉันอ่านกระดาษที่อ้างว่าใช้บ่อย ฉันไม่เห็นด้วยกับการเรียกร้องของพวกเขาที่ดีที่สุดฉันรู้สึกว่ามันคลุมเครือ กระดาษไม่ได้กล่าวถึง MLE อย่างชัดเจน (หรือMAPสำหรับเรื่องนั้น) พวกเขาใช้การประมาณค่าจุดและพวกเขาก็ดำเนินการราวกับว่าการประเมินจุดนี้เป็นจริง พวกเขาทำไม่ได้ทำการวิเคราะห์การกระจายตัวตัวอย่างของตัวประมาณค่านี้หรืออะไรทำนองนั้น แบบจำลองค่อนข้างซับซ้อนและดังนั้นการวิเคราะห์ดังกล่าวอาจเป็นไปไม่ได้ พวกเขาไม่ใช้คำว่า 'หลัง' ที่จุดใดก็ได้ พวกเขาเพียงแค่ใช้การประเมินจุดนี้ที่มูลค่าหน้าและดำเนินการในหัวข้อหลักที่น่าสนใจ - อนุมานข้อมูลที่ขาดหายไป ฉันไม่คิดว่าจะมีอะไรในแนวทางของพวกเขาที่ชี้ให้เห็นว่าปรัชญาของพวกเขาคืออะไร พวกเขาอาจจะตั้งใจที่จะเป็นประจำ (เพราะพวกเขารู้สึกว่าจำเป็นต้องสวมปรัชญาบนแขนเสื้อของพวกเขา) แต่วิธีการที่แท้จริงของพวกเขาค่อนข้างง่าย / สะดวก / ขี้เกียจ / คลุมเครือ ตอนนี้ฉันอยากบอกว่าการวิจัยไม่มีปรัชญาใด ๆ อยู่เบื้องหลัง แต่ฉันคิดว่าทัศนคติของพวกเขาในทางปฏิบัติหรือสะดวกกว่า:
"ฉันสังเกตุข้อมูล, , และฉันต้องการประเมินข้อมูลที่ขาดหายไป, . มีพารามิเตอร์ที่ควบคุมความสัมพันธ์ระหว่างและ . ฉันไม่สนใจยกเว้นเรื่องที่จะจบ ถ้าฉันมีค่าประมาณสำหรับมันจะทำให้ง่ายต่อการทำนายจากฉันจะเลือกการประมาณค่าของเพราะสะดวกโดยเฉพาะฉันจะเลือกที่เพิ่ม "Z θ Z x θ θ Z x θ θ P ( x | θ )
ในวิธีการแบบเบย์บทบาทของข้อมูลและพารามิเตอร์เรียงกลับกัน โดยเฉพาะอย่างยิ่งตอนนี้เรามีเงื่อนไขกับข้อมูลที่สังเกตได้และดำเนินการเพื่อหาข้อสรุปเกี่ยวกับค่าของพารามิเตอร์ สิ่งนี้ต้องมีก่อน
จนถึงตอนนี้ดีมาก แต่MLE (การประมาณความน่าจะเป็นสูงสุด) จะพอดีกับสิ่งนี้ทั้งหมดที่ไหน? ฉันได้รับความประทับใจที่หลายคนรู้สึกว่ามันเป็นผู้นิยม (หรือมากกว่านั้นอย่างแน่นอนว่าไม่ใช่เบย์) แต่ฉันรู้สึกว่ามันเป็นแบบเบย์เพราะมันเกี่ยวข้องกับการรับข้อมูลที่สังเกตแล้วหาพารามิเตอร์ที่ทำให้สูงสุด MLE นั้นจะใช้รูปแบบที่เหมือนกันมาก่อนและการปรับสภาพข้อมูลและการเพิ่มสูงสุด มันยุติธรรมหรือไม่ที่จะบอกว่า MLE ดูทั้งผู้ใช้บ่อยและไบเซียน? หรือเครื่องมือง่าย ๆ ทุกอย่างจะต้องตกอยู่ในหมวดหมู่หนึ่งในสองอย่างนั้นเหรอ?P ( p a r a m e t e r | d a t a )
MLE นั้นสอดคล้องกันแต่ฉันรู้สึกว่าสามารถนำเสนอความสอดคล้องเป็นแนวคิดของ Bayesian ได้ เมื่อได้รับตัวอย่างขนาดใหญ่โดยพลการค่าประมาณจะมาบรรจบกับคำตอบที่ถูกต้อง คำสั่ง "การประมาณจะเท่ากับค่าที่แท้จริง" ถือเป็นจริงสำหรับค่าทั้งหมดของพารามิเตอร์ สิ่งที่น่าสนใจคือคำแถลงนี้ยังคงเป็นจริงหากคุณกำหนดเงื่อนไขของข้อมูลที่สังเกตได้ทำให้มันเป็นแบบเบย์ สิ่งที่น่าสนใจนอกเหนือจากนี้สำหรับ MLE แต่ไม่ใช่สำหรับผู้ประเมินที่เป็นกลาง
นี่คือเหตุผลที่ฉันรู้สึกว่า MLE เป็น 'Bayesian ที่สุด' ของวิธีการที่อาจถูกอธิบายว่าเป็นผู้ใช้บ่อย
อย่างไรก็ตามคุณสมบัติของผู้ใช้บ่อยที่สุด (เช่นความเป็นกลาง) จะมีผลในทุกกรณีรวมถึงขนาดตัวอย่างที่แน่นอน ความจริงที่ว่าความสอดคล้องมีเพียงในสถานการณ์ที่เป็นไปไม่ได้ (ตัวอย่างที่ไม่มีที่สิ้นสุดภายในการทดสอบหนึ่งครั้ง) แสดงให้เห็นว่าความสอดคล้องนั้นไม่ใช่คุณสมบัติที่มีประโยชน์
เมื่อให้ตัวอย่างที่เป็นจริง (เช่น จำกัด ) มีคุณสมบัติของผู้ใช้บ่อยซึ่งมีคุณสมบัติเป็น MLE จริงหรือไม่? ถ้าไม่ใช่ MLE นั้นไม่ใช่ผู้ให้กำเนิด