ในบันทึกการบรรยาย 3 สัปดาห์ของชั้นเรียน Coursera Machine LearningของAndrew Ngจะมีการเพิ่มคำศัพท์ในฟังก์ชั่นค่าใช้จ่ายเพื่อทำให้เป็นมาตรฐาน
บันทึกการบรรยายพูดว่า:
เรายังสามารถทำให้พารามิเตอร์ theta ทั้งหมดของเราเป็นปกติในการสรุปเดียว:
ถูกนำไปใช้กับเทอม normalization ของเครือข่ายประสาท :
จำได้ว่าฟังก์ชั่นค่าใช้จ่ายสำหรับการถดถอยโลจิสติกปกติ:
สำหรับเครือข่ายประสาทมันจะซับซ้อนกว่าเล็กน้อย:
- ทำไมค่าครึ่งหนึ่งคงที่ใช้ที่นี่? แล้วมันจะถูกยกเลิกในอนุพันธ์ ?
- ทำไมการแบ่งตัวอย่างการฝึกอบรมจำนวนตัวอย่างการฝึกอบรมมีผลต่อสิ่งต่าง ๆ อย่างไร