ความสัมพันธ์ระหว่าง MLE และกำลังสองน้อยที่สุดในกรณีของการถดถอยเชิงเส้น


9

Hastie และ Tibshirani พูดถึงในหัวข้อ 4.3.2 ของหนังสือของพวกเขาว่าในการตั้งค่าการถดถอยเชิงเส้นแนวทางสแควร์สน้อยที่สุดในความเป็นจริงเป็นกรณีพิเศษของความน่าจะเป็นสูงสุด เราจะพิสูจน์ผลลัพธ์นี้ได้อย่างไร?

PS: อะไหล่ไม่มีรายละเอียดทางคณิตศาสตร์


2
ไม่ใช่กรณีพิเศษ: มันเหมือนกันเมื่อการกระจายข้อผิดพลาดเป็นเรื่องปกติ
Zhanxiong

คำตอบ:


13

ตัวแบบการถดถอยเชิงเส้น

Y=Xβ+ϵโดยที่ϵN(0,Iσ2)

YRn ,และXRn×pβRp

โปรดทราบว่าข้อผิดพลาดรูปแบบของเรา (ที่เหลือ) เป็นเบต้า} เป้าหมายของเราคือการหาเวกเตอร์ของ s ที่ลดค่า norm กำลังสองของข้อผิดพลาดนี้ให้น้อยที่สุดϵ=YXββL2

กำลังสองน้อยที่สุด

ข้อมูลที่ให้โดยที่เป็นมิติเราพยายามค้นหา:(x1,y1),...,(xn,yn)xip

β^LS=argminβ||ϵ||2=argminβ||YXβ||2=argminβi=1n(yixiβ)2

โอกาสสูงสุด

การใช้แบบจำลองด้านบนเราสามารถตั้งค่าความน่าจะเป็นของข้อมูลที่ได้รับพารามิเตอร์เป็น:β

L(Y|X,β)=i=1nf(yi|xi,β)

ที่เป็นรูปแบบไฟล์ PDF ของการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และความแปรปรวน 2 เสียบเข้ากับ:f(yi|xi,β)σ2

L(Y|X,β)=i=1n12πσ2e(yixiβ)22σ2

ตอนนี้โดยทั่วไปเมื่อต้องจัดการกับความน่าจะเป็นในการบันทึกทางคณิตศาสตร์ง่ายขึ้นก่อนดำเนินการต่อ (ผลิตภัณฑ์กลายเป็นผลรวม exponentials หายไป) ดังนั้นลองทำเช่นนั้น

logL(Y|X,β)=i=1nlog(12πσ2)(yixiβ)22σ2

เนื่องจากเราต้องการให้ประมาณการโอกาสสูงสุดที่เราต้องการที่จะหาสูงสุดของสมการข้างต้นด้วยความเคารพ\คำแรกไม่ส่งผลกระทบต่อการประมาณการเราดังนั้นเราจึงไม่สนใจ:ββ

β^MLE=argmaxβi=1n(yixiβ)22σ2

โปรดทราบว่าตัวหารเป็นค่าคงที่เกี่ยวกับ\ในที่สุดสังเกตว่ามีเครื่องหมายลบหน้าผลรวม ดังนั้นการหาจำนวนลบสูงสุดก็เหมือนกับการหาจำนวนต่ำสุดโดยไม่ลบ ในคำอื่น ๆ :β

β^MLE=argminβi=1n(yixiβ)2=β^LS

จำได้ว่าสำหรับสิ่งนี้ในการทำงานเราต้องตั้งสมมติฐานแบบจำลองบางอย่าง (ปกติของข้อผิดพลาด, 0 หมายถึง, ความแปรปรวนคงที่) สิ่งนี้ทำให้สี่เหลี่ยมน้อยที่สุดเทียบเท่ากับ MLE ภายใต้เงื่อนไขบางประการ ดูที่นี่และที่นี่สำหรับการสนทนาเพิ่มเติม

เพื่อความสมบูรณ์โปรดทราบว่าโซลูชันสามารถเขียนเป็น:

β=(XTX)1XTy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.