เราเคยใช้การประมาณโอกาสสูงสุดหรือไม่


14

ฉันสงสัยว่าการประเมินความน่าจะเป็นสูงสุดที่เคยใช้ในสถิติหรือไม่ เราเรียนรู้แนวคิดของมัน แต่ฉันสงสัยว่ามันถูกใช้จริงเมื่อใด หากเราถือว่าการกระจายของข้อมูลเราพบสองพารามิเตอร์หนึ่งสำหรับค่าเฉลี่ยและอีกหนึ่งสำหรับความแปรปรวน แต่คุณใช้จริงในสถานการณ์จริง?

ใครสามารถบอกกรณีง่าย ๆ ที่ใช้สำหรับฉันได้


33
มันเป็นมากที่สุดวิธีการประมาณค่าที่แพร่หลาย the
JohnK

3
ฉันพยายามถามว่าเมื่อใดที่เราไม่ใช้ MLE
Haitao Du

4
การถดถอยโลจิสติก. การถดถอยปัวซอง OLS เป็น MLE เมื่อข้อผิดพลาดถือว่าเป็นเรื่องปกติ การถดถอยของแกมม่า คลาสสิก GLM ใด ๆ จริงๆ การประมาณค่าเฉลี่ยจากประชากรปกติ การประมาณความน่าจะเป็นที่สำเร็จจากชุดการทดลองทวินาม การประมาณอัตราเหตุการณ์ปัวซอง ฉันสามารถไป ...
GoF_Logistic

4
การค้นหาในไซต์ของเราที่แคบมากนี้ผลิตตัวอย่างของการใช้งานจริงหลายร้อยตัวอย่าง
whuber

6
@ hxd1011 คุณไม่ได้ใช้ MLE เมื่อคุณไม่ได้ใช้วิธีการเพื่อหาค่าความแปรปรวนของการประมาณค่าหรือเพื่อคำนวณความเชื่อมั่นการทำนายหรือช่วงเวลาที่ยอมรับได้แม้ในกรณีที่ตัวประมาณที่คุณกำลังใช้อยู่อาจเห็นด้วยกับตัวประมาณ MLE ตัวอย่างเช่นคุณไม่ได้ใช้ MLE เมื่อคุณรันการทดสอบ t คุณมักจะไม่ใช้มันเมื่อคุณใช้ตัวประมาณที่ไม่เอนเอียง ในทางปรัชญาคุณจะไม่ใช้ MLE เมื่อคุณสนใจฟังก์ชั่นการสูญเสียหรือคุณมีการกระจายก่อนหน้านี้
whuber

คำตอบ:


25

ฉันสงสัยว่าการประเมินความน่าจะเป็นสูงสุดที่เคยใช้ในสถิติหรือไม่

แน่นอน! จริง ๆ แล้วค่อนข้างมาก - แต่ไม่เสมอไป

เราเรียนรู้แนวคิดของมัน แต่ฉันสงสัยว่ามันถูกใช้จริงเมื่อใด

เมื่อคนมีรูปแบบการกระจายแบบพารามิเตอร์พวกเขามักเลือกที่จะใช้การประเมินความเป็นไปได้สูงสุด เมื่อแบบจำลองนั้นถูกต้องจะมีคุณสมบัติที่มีประโยชน์จำนวนหนึ่งของตัวประมาณความน่าจะเป็นสูงสุด

ตัวอย่างหนึ่ง - การใช้ตัวแบบเชิงเส้นแบบทั่วไปค่อนข้างแพร่หลายและในกรณีนั้นพารามิเตอร์ที่อธิบายค่าเฉลี่ยจะถูกประเมินโดยความน่าจะเป็นสูงสุด

อาจเกิดขึ้นได้ว่ามีการประมาณค่าพารามิเตอร์บางอย่างโดยความน่าจะเป็นสูงสุดและอื่น ๆ ไม่ใช่ ตัวอย่างเช่นพิจารณา Poisson GLM ที่มีการกระจายตัวมากเกินไป - พารามิเตอร์การกระจายจะไม่ถูกประเมินโดยความน่าจะเป็นสูงสุดเนื่องจาก MLE ไม่มีประโยชน์ในกรณีนั้น

หากเราถือว่าการกระจายของข้อมูลเราพบสองพารามิเตอร์

ทีนี้บางครั้งคุณอาจมีสองตัว แต่บางครั้งคุณมีพารามิเตอร์หนึ่งตัวบางครั้งก็สามหรือสี่อย่างหรือมากกว่านั้น

หนึ่งอันสำหรับค่าเฉลี่ยและอีกอันสำหรับความแปรปรวน

คุณกำลังคิดของรูปแบบเฉพาะหรือไม่? นี่ไม่ใช่กรณีเสมอไป พิจารณาการประเมินพารามิเตอร์ของการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปัวซองหรือการแจกแจงแบบทวินาม ในแต่ละกรณีมีพารามิเตอร์หนึ่งตัวและค่าความแปรปรวนเป็นฟังก์ชันของพารามิเตอร์ที่อธิบายค่าเฉลี่ย

หรือพิจารณาการแจกแจงแกมมาทั่วไปซึ่งมีสามพารามิเตอร์ หรือการกระจายเบต้าสี่พารามิเตอร์ซึ่งมี (อาจไม่น่าแปลกใจ) สี่พารามิเตอร์ โปรดทราบว่า (ขึ้นอยู่กับการกำหนดพารามิเตอร์เฉพาะ) ความหมายหรือความแปรปรวนหรือทั้งสองอย่างอาจไม่ได้แสดงด้วยพารามิเตอร์เดียว แต่โดยฟังก์ชั่นของหลาย ๆ

ตัวอย่างเช่นการแจกแจงแกมม่าซึ่งมีการกำหนดพารามิเตอร์สามแบบที่เห็นการใช้งานทั่วไป - ทั้งสองที่พบบ่อยที่สุดซึ่งมีทั้งค่าเฉลี่ยและความแปรปรวนเป็นฟังก์ชันของพารามิเตอร์สองตัว

โดยทั่วไปแล้วในแบบจำลองการถดถอยหรือ GLM หรือแบบจำลองการอยู่รอด (ในประเภทแบบจำลองอื่น ๆ อีกมากมาย) แบบจำลองอาจขึ้นอยู่กับตัวทำนายหลายตัวซึ่งในกรณีนี้การกระจายที่เกี่ยวข้องกับการสังเกตแต่ละครั้งภายใต้แบบจำลองอาจมีหนึ่งในพารามิเตอร์ของตัวเอง แม้แต่พารามิเตอร์หลายตัว) ที่เกี่ยวข้องกับตัวแปรทำนายหลายตัว ("ตัวแปรอิสระ")


5
"เมื่อคนมีรูปแบบการกระจายแบบพารามิเตอร์ อย่าลืมการประมาณค่าความน่าจะเป็นสูงสุดที่ไม่ใช่พารามิเตอร์เพื่อรวมโอกาสเชิงประจักษ์
Mark L. Stone

3
@ Mark ค่อนข้างหายากกว่านี้ ฉันจะเพิ่มคำลงในคำตอบของฉัน
Glen_b -Reinstate Monica

เราสามารถใช้การประมาณความเป็นไปได้สูงสุดแม้ว่าเราจะถือว่าการแจกแจงเป็นเรื่องปกติหรือไม่? ฉันคิดว่าเราไม่จำเป็นต้องทำ แต่เรายังสามารถใช้มันได้ใช่ไหม
user122358

@ user122358 Glen and Mark ตอบคุณแล้ว คุณสามารถรับการกระจายได้หรือไม่ เวลาส่วนใหญ่ที่คุณใช้ในการกระจายและฟังก์ชันความน่าจะเป็น
HelloWorld

3
"เมื่อคนมีรูปแบบการกระจายแบบพารามิเตอร์ อย่าลืมการประมาณค่าความน่าจะเป็นสูงสุดแบบกึ่งพารามิเตอร์เพื่อรวมความน่าจะเป็นบางส่วน ;)
Scortchi - Reinstate Monica

8

ในขณะที่การประมาณความน่าจะเป็นสูงสุดสามารถดูได้อย่างน่าสงสัยเนื่องจากข้อสันนิษฐานเกี่ยวกับการกระจายข้อมูล แต่มักใช้ตัวประมาณความน่าจะเป็นสูงสุด แนวคิดก็คือเริ่มต้นด้วยการสมมติการกระจายและแก้ปัญหาสำหรับ MLE จากนั้นลบสมมติฐานการกระจายอย่างชัดเจนและดูที่วิธีการประมาณค่าของคุณดำเนินการภายใต้เงื่อนไขทั่วไปมากขึ้น ดังนั้น Quasi MLE จึงกลายเป็นวิธีที่ชาญฉลาดในการรับตัวประมาณค่าและจากนั้นงานจำนวนมากจะได้รับคุณสมบัติของตัวประมาณ เนื่องจากข้อสันนิษฐานการกระจายลดลง MLE เสมือนจึงไม่มีคุณสมบัติประสิทธิภาพที่ดี

ตัวอย่างเช่นของเล่นสมมติว่าคุณมีตัวอย่าง IID และคุณต้องการสำหรับการประมาณการความแปรปรวนของที่X คุณสามารถเริ่มต้นด้วยการสมมติว่าX ~ N ( μ , σ 2 )เขียนโอกาสโดยใช้รูปแบบไฟล์ PDF ปกติและแก้ปัญหาสำหรับ argmax ที่จะได้รับσ 2 = n - 1 Σ ( x ฉัน - ˉ x ) 2 จากนั้นเราสามารถถามคำถามเช่นภายใต้เงื่อนไขว่าอะไรx1,x2,...,xnXXN(μ,σ2)σ^2=n1(xix¯)2ประมาณการที่สอดคล้องกันคือมันเป็นกลาง (มันไม่ได้) เป็นรากมันสอดคล้อง n สิ่งที่เป็นมันกระจาย asypmtotic ฯลฯσ^2


1
นอกจากนี้คุณสามารถตรวจสอบกระทู้นี้ในสัญชาตญาณที่อยู่เบื้องหลัง Quasi MLE
Richard Hardy

5

การประมาณความน่าจะเป็นสูงสุดมักใช้ในการเรียนรู้ของเครื่องเพื่อฝึก

โปรดทราบว่าในบางกรณีเราต้องการเพิ่มการทำให้เป็นมาตรฐานซึ่งบางครั้งก็เทียบเท่ากับการประมาณหลังสูงสุดเช่นเหตุใดบทลงโทษของ Lasso จึงเทียบเท่ากับเลขชี้กำลังสองเท่า (Laplace) มาก่อน? .


3

ใครสามารถบอกกรณีง่าย ๆ ที่ใช้สำหรับฉันได้

กรณีทั่วไปมากคือในการถดถอยโลจิสติก การถดถอยโลจิสติกเป็นเทคนิคที่ใช้บ่อยในการเรียนรู้ของเครื่องเพื่อจำแนกจุดข้อมูล ตัวอย่างเช่นการถดถอยโลจิสติกสามารถใช้ในการจำแนกว่าอีเมลเป็นสแปมหรือไม่เป็นสแปมหรือจำแนกว่าบุคคลมีหรือไม่มีโรค

xihθ(xi)=P[yi=1]=11+eθTxi

θ

θ^i=1nyilog(hθ^(xi))+(1yi)log(1hθ^(xi))


1

เราใช้ MLE อยู่ตลอดเวลา แต่เราอาจไม่รู้สึก ฉันจะยกตัวอย่างง่ายๆสองตัวอย่างเพื่อแสดง

ตัวอย่างที่ 1

810θθ=0.8

ทำไมต้องใช้การนับ นี่คือการใช้ MLE! ปัญหาอยู่ที่ไหน

เพิ่มθ   θ8(1-θ)2

ในการแก้สมการเราต้องแคลคูลัสบ้าง แต่ข้อสรุปกำลังนับ

ตัวอย่างที่ 2

เราจะประเมินพารามิเตอร์การกระจายแบบเกาส์จากข้อมูลได้อย่างไร เราใช้ค่าเฉลี่ยเชิงประจักษ์เป็นค่าเฉลี่ยโดยประมาณและความแปรปรวนเชิงประจักษ์เป็นค่าความแปรปรวนโดยประมาณซึ่งมาจาก MLE!


6
ตัวอย่างที่ 1 ยังเป็นโซลูชันของ Bayes และวิธีการแก้ไขปัญหาช่วงเวลา (MM) (และอาจเป็นโซลูชันที่ใช้ขั้นตอนอื่นด้วยเช่นกัน) ตัวอย่างที่ 2 เป็นวิธีการแก้ปัญหา MM มันจะน่าเชื่อถือมากขึ้นในการแสดงขั้นตอนที่มีเฉพาะ MLE - มิฉะนั้นจะไม่ต้องการ MLE
whuber

เหตุใดตัวอย่างที่ 1 กลายเป็นโซลูชัน Bayes และตัวอย่างที่ 2 กลายเป็นโซลูชัน MM MM คืออะไร?
user122358

@ user122358 MM เป็นวิธีการของช่วงเวลา ดูที่นี่เช่น: en.wikipedia.org/wiki/Method_of_moments_(statistics)
jld

0

โอกาสสูงสุดที่ใช้ในการสื่อสารไร้สาย:

  • การถอดรหัสข้อมูลดิจิตอลจากสัญญาณที่ได้รับมีเสียงดังมีหรือไม่มีรหัสซ้ำซ้อน
  • การประมาณเวลา - เฟสและความถี่ - ออฟเซ็ตในตัวรับ
  • การประมาณของ (พารามิเตอร์ของ) ช่องทางการเผยแพร่
  • การประมาณความล่าช้ามุมของการมาถึงและการเลื่อนแบบ Doppler (เช่นเรดาร์)
  • การประมาณตำแหน่งมือถือ (เช่น GPS)
  • การประมาณค่าออฟเซ็ตนาฬิกาสำหรับการซิงโครไนซ์การตั้งค่าแบบกระจายทุกชนิด
  • ขั้นตอนการสอบเทียบที่หลากหลาย
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.