มักจะมี maximizer สำหรับปัญหา MLE หรือไม่?


23

ฉันสงสัยว่าจะมี maximizer สำหรับปัญหาการประมาณโอกาสสูงสุด (บันทึก -) หรือไม่? กล่าวอีกนัยหนึ่งมีการแจกแจงบางส่วนและพารามิเตอร์บางอย่างซึ่งปัญหา MLE ไม่มี maximizer หรือไม่

คำถามของฉันมาจากการอ้างสิทธิ์ของวิศวกรว่าฟังก์ชั่นค่าใช้จ่าย (ความน่าจะเป็นหรือความเป็นไปได้ในการบันทึกฉันไม่แน่ใจว่ามีจุดประสงค์ใด) ใน MLE มักจะเป็นแบบเว้าเสมอและดังนั้นจึงมี maximizer เสมอ

ขอบคุณและขอแสดงความนับถือ!


8
(+1) คุณแน่ใจหรือว่าไม่มีคุณสมบัติบางอย่างที่ไม่ได้ระบุไว้ในคำถามของคุณ คำแถลงของวิศวกรเป็นเท็จในหลาย ๆ วิธีซึ่งแทบจะไม่รู้ว่าจะเริ่มจากตรงไหน :)
สำคัญ

@ cardinal: โดยทั่วไปฉันเขียนสิ่งที่ฉันได้ยิน แต่ฉันยอมรับว่าฉันอาจพลาดบางสิ่ง
ทิม

5
counterexample (นูน): Let จะ IID N ( 0 , σ 2 ) แม้ว่าจะมี MLE ที่ไม่เหมือนใครก็ตาม แต่ความน่าจะเป็นและความไม่น่าจะเป็นใน log- eli 2นั้น X1,X2,,XnN(0,σ2)σ2
พระคาร์ดินัล

3
@Tim Logistic regressionเป็นตัวอย่างพื้นฐานที่ MLE ไม่มีอยู่จริง นอกจากนี้สำหรับฟังก์ชั่นลิงก์บางตัวความน่าจะเป็นบันทึกไม่ได้เว้า

คำตอบ:


30

บางทีวิศวกรที่มีอยู่ในใจครอบครัวที่เป็นที่ยอมรับบัญญัติ: ในพารามิเตอร์ธรรมชาติของพวกเขาพื้นที่พารามิเตอร์เป็นนูนและความน่าจะเป็นบันทึกเป็นเว้า (ดู Thm 1.6.3 ใน Bickel & Doksum ของคณิตศาสตร์สถิติเล่ม 1 ) ยิ่งไปกว่านั้นภายใต้เงื่อนไขทางเทคนิคที่ไม่รุนแรง (โดยพื้นฐานแล้วว่าแบบจำลองนั้นเป็น "เต็มยศ" หรือเทียบเท่าว่าพารามิเตอร์ตามธรรมชาติโดยสามารถระบุได้) ฟังก์ชันบันทึกความน่าจะเป็นคือเว้าอย่างเข้มงวดซึ่งแสดงว่ามี maximizer เฉพาะ (ข้อสรุป 1.6.2 ในการอ้างอิงเดียวกัน) [นอกจากนี้บันทึกการบรรยายที่อ้างถึงโดย @biostat ก็ทำเช่นเดียวกัน]

โปรดทราบว่า parametrization ตามธรรมชาติของครอบครัวเลขชี้กำลังเป็นที่ยอมรับมักจะแตกต่างจาก parametrization มาตรฐาน ดังนั้นในขณะที่ @ cardinal ชี้ให้เห็นว่าบันทึกความน่าจะเป็นของครอบครัวไม่ได้มีการนูนในσ 2มันจะเป็นเว้าในพารามิเตอร์ธรรมชาติซึ่งคือη 1 = μ / σ 2และη 2 = - 1 / σ 2 N(μ,σ2)σ2η1=μ/σ2η2=1/σ2


2
(+1) คำตอบที่ดี ดังที่ได้กล่าวไว้ในความคิดเห็นของฉันต่อ OP นี่คือคำตอบที่ฉันหวังว่าจะโพสต์ (แม้ตัวอย่างที่เลือกนั้นจะถูกเลือกอย่างระมัดระวัง) :)
พระคาร์ดินัล

2
คุณสามารถแสดงสิ่งนี้ในโมเดลหลายตัวแปรเกาส์เซียนได้ไหม
Royi

6

ฟังก์ชันความเป็นไปได้มักจะบรรลุสูงสุดสำหรับการประมาณค่าพารามิเตอร์ที่น่าสนใจ อย่างไรก็ตามบางครั้ง MLE ไม่มีอยู่เช่นสำหรับการแจกแจงแบบเกาส์หรือฟังก์ชั่นที่ไม่ใช่พารามิเตอร์ซึ่งมียอดเขามากกว่าหนึ่งจุด (bi หรือ multi-modal) ฉันมักประสบปัญหาในการประมาณค่าพารามิเตอร์ทางพันธุศาสตร์ประชากรที่ไม่ทราบ ได้แก่ อัตราการรวมตัวกันอีกครั้งผลของการคัดเลือกโดยธรรมชาติ

เหตุผลหนึ่งที่ @ cardinal ชี้ให้เห็นว่าเป็นพื้นที่พาราเมตริกที่ไม่มีขอบเขต

ยิ่งกว่านั้นฉันอยากจะแนะนำบทความต่อไปนี้ดูหัวข้อ 3 (สำหรับฟังก์ชั่น) และรูปที่ 3 อย่างไรก็ตามมีเอกสารที่มีประโยชน์และค่อนข้างสะดวกข้อมูลเกี่ยวกับ MLE


3
ฉันคิดว่าฉันต้องเข้าใจตัวอย่างที่คุณระบุไว้ผิด ฟังก์ชันกำลังสองมีอะไรมากกว่าหนึ่งจุดสูงสุด?
พระคาร์ดินัล

@cardinal: ให้ฉันพยายามอธิบาย คุณกำลังชี้เกี่ยวกับพารามิเตอร์ที่ไม่ได้ จำกัด เป็นหนึ่งในเหตุผลที่ฟังก์ชันความน่าจะเป็นไม่ถึงค่าสูงสุดแม้ในตัวอย่างง่ายๆของการแจกแจงแบบปกติ อย่างไรก็ตามจุดของฉันมาจากมุมมองการเพิ่มประสิทธิภาพที่มีปัญหาที่เป็นที่นิยมของ maxima ท้องถิ่นและทั่วโลก ฉันประสบปัญหานี้บ่อยครั้งในพันธุศาสตร์ประชากรขณะประเมินอัตราการรวมตัวกันอีกครั้ง ยิ่งไปกว่านั้นดูบทความนี้ส่วนที่ 3 (สำหรับฟังก์ชั่น) และรูปที่ 3 URL ของบทความ: citeseerx.ist.psu.edu/viewdoc/…
Biostat

คุณกำลังพูดว่า "ฟังก์ชั่นสมการกำลังสองที่มีจุดสูงสุดมากกว่าหนึ่งจุด" คือการอ้างอิงถึงเช่นแบบจำลองการผสมแบบเกาส์หรืออาจ? ถ้าเป็นเช่นนั้นการแก้ไขอาจทำให้สับสนได้บ้าง
พระคาร์ดินัล

ตอนนี้มันมีการปรับปรุง
Biostat

2
(+1) สำหรับการอัพเดท โปรดทราบว่าในแบบจำลองการผสมแบบเกาส์มีทั้งโอกาสที่ไม่ จำกัดและจำนวนสูงสุดในพื้นที่หลายรายการโดยทั่วไป เพื่อทำให้เรื่องแย่ลงความเป็นไปได้นั้นจะกลายเป็นสิ่งที่ไร้ขีด จำกัด ในการแก้ปัญหาทางพยาธิวิทยาโดยเฉพาะ โดยทั่วไป maxima หลายรายการอาจไม่เป็นปัญหาที่ไม่ดี ในบางกรณี maxima เหล่านี้มาบรรจบกันอย่างรวดเร็วเพียงพอที่การเลือกใด ๆ ของพวกเขายังสามารถให้ผลการประมาณค่าที่สมเหตุสมผล (แม้กระทั่งมีประสิทธิภาพ) ของพารามิเตอร์ที่น่าสนใจ
พระคาร์ดินัล

3

ฉันยอมรับว่าฉันอาจจะพลาดอะไรบางอย่าง แต่ -

หากนี่คือปัญหาการประมาณค่าและเป้าหมายคือการประมาณค่าพารามิเตอร์ที่ไม่รู้จักและพารามิเตอร์นั้นมาจากชุดที่ปิดและล้อมรอบบางส่วนและฟังก์ชันความน่าจะเป็นต่อเนื่องนั้นจะต้องมีค่าสำหรับพารามิเตอร์นี้ที่ขยายให้ใหญ่ที่สุด ฟังก์ชั่นความน่าจะเป็น กล่าวอีกนัยหนึ่งต้องมีค่าสูงสุด (ไม่จำเป็นต้องไม่ซ้ำกัน แต่ต้องมีอย่างน้อยหนึ่งสูงสุดไม่มีการรับประกันว่า maxima ท้องถิ่นทั้งหมดจะเป็น maxima ระดับโลก แต่นั่นไม่ใช่เงื่อนไขที่จำเป็นสำหรับการมีอยู่สูงสุด)

ฉันไม่รู้ว่าฟังก์ชันความน่าจะเป็นต้องนูนหรือไม่ แต่นั่นไม่ใช่เงื่อนไขที่จำเป็นสำหรับการมีอยู่สูงสุด

หากฉันมองข้ามบางสิ่งไปฉันยินดีต้อนรับเมื่อได้ยินว่าเป็นอะไรที่ฉันขาดหายไป


4
ไม่มีสมมติฐานเพิ่มเติมข้อความที่ให้ไว้เกี่ยวกับ maxima เป็นเท็จ ตัวอย่างเช่นหากพื้นที่พารามิเตอร์ถูกปิดและล้อมรอบและฟังก์ชั่นความน่าจะเป็นอย่างต่อเนื่องในพารามิเตอร์นั้นจะต้องมีค่าสูงสุด ขาดเงื่อนไขเพิ่มเติมเหล่านี้อย่างใดอย่างหนึ่งผลลัพธ์ไม่จำเป็นต้องมี เกี่ยวกับการนูนมันล้มเหลวแม้ในตัวอย่างที่ง่ายที่สุดและทั่วไป :)
สำคัญ

2
(+1) Boundedness of the parameter space doesn't hold in a lot of simple cases, even. But, for practical purposes, we generally know our parameters are bounded. :)
cardinal

3

Perhaps someone will find the following simple example useful.

Consider flipping a coin once. Let θ denote the probability of heads. If it is known that the coin can come up either heads or tails then θ(0,1). Since the set (0,1) is open, the parameter space is not compact. The likelihood for θ is given by

{θheads1θtails.
In neither case is there a maximum for θ on (0,1).
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.