Hastie และ Tibshirani พูดถึงในหัวข้อ 4.3.2 ของหนังสือของพวกเขาว่าในการตั้งค่าการถดถอยเชิงเส้นแนวทางสแควร์สน้อยที่สุดในความเป็นจริงเป็นกรณีพิเศษของความน่าจะเป็นสูงสุด เราจะพิสูจน์ผลลัพธ์นี้ได้อย่างไร?
PS: อะไหล่ไม่มีรายละเอียดทางคณิตศาสตร์
Hastie และ Tibshirani พูดถึงในหัวข้อ 4.3.2 ของหนังสือของพวกเขาว่าในการตั้งค่าการถดถอยเชิงเส้นแนวทางสแควร์สน้อยที่สุดในความเป็นจริงเป็นกรณีพิเศษของความน่าจะเป็นสูงสุด เราจะพิสูจน์ผลลัพธ์นี้ได้อย่างไร?
PS: อะไหล่ไม่มีรายละเอียดทางคณิตศาสตร์
คำตอบ:
ตัวแบบการถดถอยเชิงเส้น
โดยที่
,และ
โปรดทราบว่าข้อผิดพลาดรูปแบบของเรา (ที่เหลือ) เป็นเบต้า} เป้าหมายของเราคือการหาเวกเตอร์ของ s ที่ลดค่า norm กำลังสองของข้อผิดพลาดนี้ให้น้อยที่สุด
กำลังสองน้อยที่สุด
ข้อมูลที่ให้โดยที่เป็นมิติเราพยายามค้นหา:
โอกาสสูงสุด
การใช้แบบจำลองด้านบนเราสามารถตั้งค่าความน่าจะเป็นของข้อมูลที่ได้รับพารามิเตอร์เป็น:
ที่เป็นรูปแบบไฟล์ PDF ของการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และความแปรปรวน 2 เสียบเข้ากับ:
ตอนนี้โดยทั่วไปเมื่อต้องจัดการกับความน่าจะเป็นในการบันทึกทางคณิตศาสตร์ง่ายขึ้นก่อนดำเนินการต่อ (ผลิตภัณฑ์กลายเป็นผลรวม exponentials หายไป) ดังนั้นลองทำเช่นนั้น
เนื่องจากเราต้องการให้ประมาณการโอกาสสูงสุดที่เราต้องการที่จะหาสูงสุดของสมการข้างต้นด้วยความเคารพ\คำแรกไม่ส่งผลกระทบต่อการประมาณการเราดังนั้นเราจึงไม่สนใจ:
โปรดทราบว่าตัวหารเป็นค่าคงที่เกี่ยวกับ\ในที่สุดสังเกตว่ามีเครื่องหมายลบหน้าผลรวม ดังนั้นการหาจำนวนลบสูงสุดก็เหมือนกับการหาจำนวนต่ำสุดโดยไม่ลบ ในคำอื่น ๆ :
จำได้ว่าสำหรับสิ่งนี้ในการทำงานเราต้องตั้งสมมติฐานแบบจำลองบางอย่าง (ปกติของข้อผิดพลาด, 0 หมายถึง, ความแปรปรวนคงที่) สิ่งนี้ทำให้สี่เหลี่ยมน้อยที่สุดเทียบเท่ากับ MLE ภายใต้เงื่อนไขบางประการ ดูที่นี่และที่นี่สำหรับการสนทนาเพิ่มเติม
เพื่อความสมบูรณ์โปรดทราบว่าโซลูชันสามารถเขียนเป็น: