สมมติว่าเราอยู่ในสถานการณ์ต่อไปนี้ เรามีข้อมูลซึ่งแต่ละสามารถเป็นตัวเลขหรือเวกเตอร์ได้และเราต้องการพิจารณาฟังก์ชันที่ใกล้เคียงกับความสัมพันธ์ในแง่ที่ว่ากำลังสองน้อยที่สุด ข้อผิดพลาด:{xi,yi}xiff(xi)≈yi
12Σผม(Yผม- ฉ(xผม))2
เล็ก.
ทีนี้คำถามก็เข้าสู่สิ่งที่เราต้องการให้โดเมนของเป็น ทางเลือกที่เลวลงสำหรับโดเมนเป็นเพียงจุดสำคัญในข้อมูลการฝึกอบรมของเรา ในกรณีนี้เราอาจกำหนดครอบคลุมทั้งโดเมนที่ต้องการและทำได้ด้วย รอบเกี่ยวกับวิธีที่จะมาถึงคำตอบนี้คือการทำลาดลงทางลาดด้วยการแยกพื้นที่เป็นโดเมน นี่เป็นการเปลี่ยนแปลงมุมมองเล็กน้อย ลองดูการสูญเสียเป็นฟังก์ชันของจุดที่แท้จริงและการทำนาย (ในขณะนี้ไม่ใช่ฟังก์ชัน แต่เป็นเพียงค่าของการทำนาย)ff(xi)=yy ff
L(f;y)=12(y−f)2
จากนั้นใช้การไล่ระดับสีด้วยความเคารพต่อการทำนาย
∇fL(f;y)=f−y
จากนั้นการไล่ระดับสีอัปเดตเริ่มต้นจากค่าเริ่มต้นที่คือy0
y1=y0−∇f(y0,y)=y0−(y0−y)=y
ดังนั้นเราจึงกู้คืนการทำนายที่สมบูรณ์แบบของเราในขั้นตอนไล่ระดับสีด้วยการตั้งค่านี้ซึ่งดีมาก!
แน่นอนข้อบกพร่องที่นี่คือแน่นอนว่าเราต้องการให้ถูกกำหนดมากกว่าจุดข้อมูลการฝึกอบรมของเรา ในการทำเช่นนี้เราจะต้องทำการลดหย่อนเล็กน้อยเพราะเราไม่สามารถประเมินฟังก์ชั่นการสูญเสียหรือการไล่ระดับสีได้ที่จุดอื่นใดนอกเหนือจากชุดข้อมูลการฝึกอบรมของเรา f
ความคิดที่ยิ่งใหญ่คือการอ่อนตัวอย่างL ∇L
Start
ด้วยการเดาเริ่มต้นที่เกือบทุกฟังก์ชันคงที่แบบง่ายสิ่งนี้ถูกกำหนดทุกที่ ตอนนี้สร้างชุดข้อมูลการทำงานใหม่โดยการประเมินความลาดชันของฟังก์ชั่นการสูญเสียที่ข้อมูลการฝึกอบรมโดยใช้การเดาเริ่มต้นสำหรับ :ff(x)=f0f
W={xi,f0−y}
Now approximate
∇Lโดยการปรับเรียนอ่อนแอWบอกว่าเราจะได้รับประมาณL เราได้รับส่วนขยายของข้อมูลทั่วทั้งโดเมนในรูปแบบของแม้ว่าเราจะสูญเสียความแม่นยำที่จุดฝึกอบรมเนื่องจากเรามีผู้เรียนขนาดเล็กWF≈∇LWF(X)
Finally
ใช้แทนในการไล่ระดับสีของทั่วทั้งโดเมน:F∇Lf0
f1(x)=f0(x)−F(x)
เราออกมาได้การประมาณใหม่ของดีกว่าเล็กน้อย เริ่มต้นใหม่ด้วยและวนซ้ำจนกว่าจะพอใจf1ff0f1
หวังว่าคุณจะเห็นว่าสิ่งที่สำคัญจริงๆคือประมาณความชันของการสูญเสีย ในกรณีที่มีกำลังสองน้อยที่สุดการย่อตัวนี้จะอยู่ในรูปของเศษซากดิบ แต่ในกรณีที่ซับซ้อนกว่านี้ก็ไม่ได้ เครื่องจักรยังคงใช้งานได้ ตราบใดที่เราสามารถสร้างอัลกอริทึมสำหรับการคำนวณการสูญเสียและการไล่ระดับสีของการสูญเสียที่ข้อมูลการฝึกอบรมเราสามารถใช้อัลกอริทึมนี้เพื่อประมาณฟังก์ชั่นการลดการสูญเสียนั้น