[หมายเหตุ 5 เมษายน 2019: เอกสารฉบับใหม่ได้รับการอัปเดตใน arXiv พร้อมผลลัพธ์ใหม่มากมาย เราแนะนำเวอร์ชั่นย้อนกลับของโมเมนตัมและ NAG และพิสูจน์การบรรจบกันภายใต้สมมติฐานเดียวกันกับ Backtracking Gradient Descent
รหัสที่มามีอยู่ใน GitHub ที่ลิงค์: https://github.com/hank-nguyen/MBT-optimizer
เราปรับปรุงอัลกอริทึมสำหรับการใช้กับ DNN และรับประสิทธิภาพที่ดีกว่าอัลกอริทึมที่ล้ำสมัยเช่น MMT, NAG, Adam, Adamax, Adagrad, ...
คุณสมบัติพิเศษที่สุดของอัลกอริทึมของเราคือพวกเขาเป็นไปโดยอัตโนมัติคุณไม่จำเป็นต้องทำการปรับอัตราการเรียนรู้ด้วยตนเองเหมือนการปฏิบัติทั่วไป การปรับจูนอัตโนมัติของเรานั้นแตกต่างจากในธรรมชาติจาก Adam, Adamax, Adagrad, ... และอื่น ๆ รายละเอียดเพิ่มเติมอยู่ในกระดาษ
]
ขึ้นอยู่กับผลล่าสุด: ในการทำงานร่วมกันของฉันในบทความนี้https://arxiv.org/abs/1808.05160
เราแสดงให้เห็นว่าการไล่ระดับสีย้อนรอยย้อนกลับเมื่อนำไปใช้กับฟังก์ชัน C ^ 1 ตามอำเภอใจ ซึ่งมีจำนวนจุดวิกฤตินับได้เท่านั้นจะรวมเข้าด้วยกันเป็นจุดวิกฤติ เงื่อนไขนี้เป็นที่พอใจสำหรับฟังก์ชั่นทั่วไปเช่นสำหรับฟังก์ชั่นมอร์สทั้งหมด นอกจากนี้เรายังแสดงให้เห็นว่าในแง่หนึ่งมันเป็นเรื่องยากมากสำหรับจุด จำกัด ที่จะเป็นจุดอาน ดังนั้นหากจุดวิกฤตทั้งหมดของคุณไม่เสื่อมถอยดังนั้นในแง่หนึ่งคะแนน จำกัด นั้นต่ำสุดทั้งหมด [โปรดดูเอกสารอ้างอิงในเอกสารอ้างอิงสำหรับผลลัพธ์ที่ทราบในกรณีของการไล่ระดับสีมาตรฐาน]ฉ
จากที่กล่าวมาข้างต้นเราเสนอวิธีการใหม่ในการเรียนรู้อย่างลึกล้ำซึ่งเป็นวิธีการที่ล้ำสมัยและไม่จำเป็นต้องปรับอัตราการเรียนรู้ด้วยตนเอง (โดยสรุปความคิดก็คือคุณใช้การไล่ระดับสีไล่ระดับย้อนรอยตามระยะเวลาจนกว่าคุณจะเห็นว่าอัตราการเรียนรู้ซึ่งเปลี่ยนไปตามการทำซ้ำแต่ละครั้งจะมีเสถียรภาพเราคาดหวังว่าการรักษาเสถียรภาพนี้โดยเฉพาะในจุดวิกฤติที่ C ^ 2 และไม่เสื่อมถอยเนื่องจากผลลัพธ์การบรรจบกันที่ฉันกล่าวถึงข้างต้น ณ จุดนั้นคุณเปลี่ยนไปใช้วิธีการไล่ระดับสีแบบไล่ระดับมาตรฐานโปรดดูกระดาษที่อ้างถึงเพื่อดูรายละเอียดเพิ่มเติมวิธีนี้ยังสามารถนำไปใช้กับอัลกอริทึมที่เหมาะสมอื่น ๆ .)
ป.ล. เกี่ยวกับคำถามดั้งเดิมของคุณเกี่ยวกับวิธีการไล่ระดับสีมาตรฐานเพื่อความรู้ของฉันเฉพาะในกรณีที่อนุพันธ์ของแผนที่เป็น Lipschitz ทั่วโลกและอัตราการเรียนรู้มีขนาดเล็กพอที่วิธีการไล่ระดับสีไล่ระดับมาตรฐานได้รับการพิสูจน์ว่ามาบรรจบกัน [หากเงื่อนไขเหล่านี้ไม่เป็นที่พอใจมีตัวอย่างเคาน์เตอร์ธรรมดาที่แสดงว่าไม่มีผลลัพธ์การบรรจบกันเป็นไปได้ดูกระดาษที่อ้างถึงสำหรับบางคน] ในกระดาษที่อ้างถึงข้างต้นเราแย้งว่าในระยะยาววิธีการไล่ระดับสีย้อนรอยจะกลายเป็น วิธีการไล่ระดับสีแบบมาตรฐานซึ่งให้คำอธิบายว่าทำไมวิธีการไล่ระดับสีแบบไล่ระดับมาตรฐานมักใช้งานได้ดีในทางปฏิบัติ