ประมาณอันดับที่สองของฟังก์ชั่นการสูญเสีย (หนังสือการเรียนรู้ลึก, 7.33)


11

ในหนังสือ Goodfellow (ปี 2559) เกี่ยวกับการเรียนรู้อย่างลึกซึ้งเขาได้พูดคุยเกี่ยวกับความเท่าเทียมกันของการหยุดการเข้าสู่ช่วงปกติของ L2 ( https://www.deeplearningbook.org/contents/regularization.htmlหน้า 247)

การประมาณกำลังสองของฟังก์ชันต้นทุนถูกกำหนดโดย:j

J^(θ)=J(w)+12(ww)TH(ww)

โดยที่คือเมทริกซ์ของ Hessian (Eq. 7.33) สิ่งนี้หายไปในระยะกลางหรือไม่ การขยายตัวของเทย์เลอร์ควรเป็น: H

f(w+ϵ)=f(w)+f(w)ϵ+12f(w)ϵ2

คำตอบ:


15

พวกเขาพูดถึงน้ำหนักที่เหมาะสม:

เราสามารถสร้างแบบจำลองฟังก์ชั่นค่าใช้จ่ายด้วยการประมาณกำลังสองในพื้นที่ใกล้เคียงของค่าที่เหมาะสมเชิงประจักษ์ของน้ำหนักJw

ณ จุดนั้นอนุพันธ์อันดับแรกคือศูนย์ - เทอมกลางจึงถูกปล่อยออกมา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.