วิธีความน่าจะเป็นสูงสุดเทียบกับวิธีกำลังสองน้อยที่สุด


42

อะไรคือความแตกต่างหลักระหว่างการประมาณค่าความน่าจะเป็นสูงสุด (MLE) กับการประมาณกำลังสองน้อยที่สุด (LSE)?

เหตุใดเราไม่สามารถใช้ MLE เพื่อทำนายค่าในการถดถอยเชิงเส้นและในทางกลับกันได้Y

ความช่วยเหลือใด ๆ ในหัวข้อนี้จะได้รับการชื่นชมอย่างมาก


8
คุณสามารถใช้ MLE ในการถดถอยเชิงเส้นได้หากต้องการ วิธีนี้อาจสมเหตุสมผลถ้าการกระจายข้อผิดพลาดนั้นไม่ปกติและเป้าหมายของคุณคือการได้รับ "การประเมิน" ที่น่าจะเป็นไปได้มากกว่าที่จะเป็นการลดผลรวมของกำลังสอง
Richard Hardy

16
ภายใต้สมมติฐานข้อผิดพลาดปกติตามปกติในการถดถอยเชิงเส้น MLE และ LSE จะเหมือนกัน!
TrynnaDoStat

1
ค้นหาเว็บไซต์ของเราสำหรับทฤษฎีบท Gauss-มาร์คอฟ
whuber

ขอบคุณสำหรับคำตอบทั้งหมด ตอนนี้มันสมเหตุสมผลแล้ว ในขณะที่ค้นหาหัวข้อนี้ในเน็ตฉันเจอบทความนี้ อาจนี้ยังช่วย: radfordneal.wordpress.com/2008/08/09/...
เอเวอ

1
คำตอบนอกจากนี้ยังมีที่stats.stackexchange.com/questions/12562/...
whuber

คำตอบ:


19

ฉันต้องการให้คำตอบที่ตรงไปตรงมา

อะไรคือความแตกต่างหลักระหว่างการประมาณค่าความน่าจะเป็นสูงสุด (MLE) กับการประมาณกำลังสองน้อยที่สุด (LSE)?

ตามที่ @TrynnaDoStat แสดงความคิดเห็นการลดข้อผิดพลาดกำลังสองน้อยที่สุดจะเท่ากับการเพิ่มโอกาสสูงสุดในกรณีนี้ ตามที่กล่าวในวิกิพีเดีย ,

ในโมเดลเชิงเส้นหากความผิดพลาดเป็นของการแจกแจงแบบปกติตัวประมาณกำลังสองน้อยที่สุดก็เป็นตัวประมาณค่าความน่าจะเป็นสูงสุดด้วย

พวกเขาสามารถดูได้เช่นเดียวกันในกรณีของคุณ

ขอผมดูรายละเอียดหน่อย เนื่องจากเรารู้ว่าตัวแปรตอบสนอง ( y )

Yผม=λ1Xผม+λ2+εผม ที่ไหน ε~ยังไม่มีข้อความ(0,σ2)
มีรูปแบบการแจกแจงข้อผิดพลาดปกติ ฟังก์ชันความน่าจะเป็นคือ L ( Y 1 , , Y n ; λ 1 , λ 2 , σ 2 ) = 1
ป้อนคำอธิบายรูปภาพที่นี่
L(Y1,...,Yn;λ1,λ2,σ2)=1(2π)n2σnอีxพี(-12σ2(Σผม=1n(Yผม-λ1Xผม-λ2)2))
เพิ่ม L เห็นได้ชัดว่าเทียบเท่ากับการลด
Σผม=1n(Yผม-λ1Xผม-λ2)2
นั่นคือ วิธีกำลังสองน้อยที่สุด

เหตุใดเราไม่สามารถใช้ MLE เพื่อทำนายค่าYในการถดถอยเชิงเส้นและในทางกลับกันได้

Y


3
คุณอาจต้องการกำหนด "กรณีนี้" ให้ชัดเจนยิ่งขึ้นเนื่องจากโดยทั่วไปโอกาสสูงสุดและกำลังสองน้อยที่สุดนั้นไม่เหมือนกัน
Matthew Gunn

2
@ MatthewGunn ใช่ฉันใช้ "เทียบเท่า" นอกเหนือจาก "เดียวกัน"
Lerner Zhang

จะดีมากถ้าคุณจะให้ตัวอย่างแก่เราซึ่งโมเดลเชิงเส้นตรงตามการแจกแจงข้อผิดพลาดที่ไม่ปกติและวิธีที่คุณใช้ MLE ในกรณีเช่นนี้เพื่อประเมินค่าสัมประสิทธิ์ที่ดีที่สุด ถ้าเป็นไปไม่ได้อย่างน้อยคุณสามารถชี้เราไปยังแหล่งข้อมูลที่ถูกต้องซึ่งสาธิตสิ่งนี้โดยใช้แบบจำลองเชิงเส้นเช่นการถดถอยปัวซอง
VM_AI

12

L1L2

L2L2

  • การสอดแนมข้อมูล
  • พารามิเตอร์สุ่ม
  • ข้อ จำกัด ที่อ่อนแอ

แอปพลิเคชันระดับมืออาชีพไม่เพียง แต่พอดีกับข้อมูลเท่านั้น แต่ยังตรวจสอบ:

  • ถ้าพารามิเตอร์มีความสำคัญ
  • ถ้าชุดข้อมูลของคุณมีค่าผิดปกติ
  • ซึ่งสามารถทนต่อค่าผิดปกติได้เนื่องจากไม่ทำให้ประสิทธิภาพพิการ
  • การวัดใดที่ควรลบออกเนื่องจากไม่ได้มีส่วนช่วยในระดับของเสรีภาพ

นอกจากนี้ยังมีการทดสอบสถิติเฉพาะจำนวนมากสำหรับสมมติฐาน สิ่งนี้ไม่จำเป็นต้องใช้กับผู้ประเมิน ML ทุกคนหรือควรระบุอย่างน้อยพร้อมหลักฐาน

L2

Xβ=L+R(XTX)-1L2

อย่าลังเลที่จะสอบถามรายละเอียด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.