สมมติว่าเรามีจุดข้อมูลอินพุต (ตัวทำนายผล) และเอาต์พุต (ตอบกลับ) A, B, C, D, E และเราต้องการให้เส้นตรงผ่านจุดต่างๆ นี่เป็นปัญหาง่าย ๆ ในการอธิบายคำถาม แต่สามารถขยายไปยังมิติที่สูงขึ้นได้เช่นกัน
คำชี้แจงปัญหา
แบบที่ดีที่สุดในปัจจุบันหรือสมมติฐานจะถูกแสดงด้วยเส้นสีดำด้านบน ลูกศรสีน้ำเงิน ( ) แสดงระยะทางแนวตั้งระหว่างจุดข้อมูลกับจุดที่เหมาะสมที่สุดในปัจจุบันโดยการวาดเส้นแนวตั้งจากจุดจนถึงจุดตัดกับเส้น
ลูกศรสีเขียว ( ) ถูกวาดเช่นนั้นในแนวตั้งฉากกับสมมติฐานปัจจุบันที่จุดตัดดังนั้นจึงแสดงระยะห่างน้อยที่สุดระหว่างจุดข้อมูลและสมมติฐานปัจจุบัน สำหรับจุด A และ B เส้นที่ลากขึ้นมานั้นจะเป็นแนวตั้งกับการคาดเดาที่ดีที่สุดในปัจจุบันและคล้ายกับเส้นที่แนวตั้งกับแกน x สำหรับจุดสองจุดนี้เส้นสีฟ้าและสีเขียวทับซ้อนกัน แต่ไม่ใช้สำหรับจุด C, D และ E
หลักการกำลังสองน้อยสุดกำหนดฟังก์ชันต้นทุนสำหรับการถดถอยเชิงเส้นโดยการลากเส้นแนวตั้งผ่านจุดข้อมูล (A, B, C, D หรือ E) ไปยังสมมติฐานที่คาดการณ์ ( ) ในรอบการฝึกอบรมที่กำหนดและแสดงด้วย
ที่นี่แสดงถึงจุดข้อมูลและหมายถึงแบบที่ดีที่สุดh θ ( x i )
ระยะห่างต่ำสุดระหว่างจุด (A, B, C, D หรือ E) แสดงด้วยเส้นตั้งฉากที่ลากจากจุดนั้นไปยังการคาดเดาที่ดีที่สุดในปัจจุบัน (ลูกศรสีเขียว)
เป้าหมายของฟังก์ชันกำลังสองน้อยที่สุดคือการกำหนดฟังก์ชันวัตถุประสงค์ซึ่งเมื่อย่อเล็กสุดจะทำให้เกิดระยะห่างน้อยที่สุดระหว่างสมมติฐานและจุดรวมทั้งหมด แต่ไม่จำเป็นต้องลดระยะห่างระหว่างสมมติฐานและจุดอินพุตเพียงจุดเดียว
**คำถาม**
เหตุใดเราจึงไม่กำหนดฟังก์ชันต้นทุนสำหรับการถดถอยเชิงเส้นเป็นระยะทางน้อยที่สุดระหว่างจุดข้อมูลอินพุตและสมมติฐาน (กำหนดโดยเส้นตั้งฉากกับสมมติฐาน) ที่ส่งผ่านอินพุตดาต้าพอยน์ที่กำหนดโดย ( )?