การไล่ระดับสีเมื่อการฝึกอบรมเครือข่ายประสาทลึก


10

เมื่อใดที่ต้องการจะทำการไล่ระดับสีเมื่อฝึก RNN หรือ CNN ฉันสนใจเป็นพิเศษ สิ่งที่จะเป็นค่าเริ่มต้นที่ดีสำหรับการตัด? (แน่นอนสามารถปรับได้)

คำตอบ:


4

คุณต้องการที่จะทำการไล่สีไล่ระดับเมื่อคุณได้รับปัญหาของการหายไปไล่ระดับสีหรือการไล่ระดับสีระเบิด อย่างไรก็ตามสำหรับทั้งสองสถานการณ์มีวิธีแก้ปัญหาที่ดีกว่า:

  • การไล่ระดับสีแบบระเบิดเกิดขึ้นเมื่อการไล่ระดับสีใหญ่เกินไปและคุณได้รับตัวเลขล้น สิ่งนี้สามารถแก้ไขได้อย่างง่ายดายโดยการเริ่มต้นน้ำหนักของเครือข่ายเป็นค่าที่น้อยลง หากวิธีนี้ใช้ไม่ได้อาจเป็นไปได้ว่ามีข้อผิดพลาดในรหัส

  • การไล่ระดับสีแบบหายไปเกิดขึ้นเมื่อการปรับให้เหมาะสมติดอยู่ที่จุดอานการไล่ระดับสีจะเล็กเกินไปสำหรับการปรับให้เหมาะสมเพื่อความคืบหน้า สิ่งนี้สามารถแก้ไขได้โดยใช้การไล่ระดับสีด้วยโมเมนตัมหรือ RMS prop หรือทั้งสองอย่าง (ซึ่งรู้จักกันในนาม Adam optimizer)

ค่าเริ่มต้นสำหรับขอบเขตของการตัดการไล่ระดับสีจะเป็นสิ่งที่เล็กกว่าจำนวนที่มากที่สุดที่ตัวแปรสามารถรับได้ สำหรับขอบเขตล่างฉันจะบอกว่ามันเป็นปัญหาที่เฉพาะเจาะจง แต่อาจเริ่มต้นด้วยบางสิ่งบางอย่างเช่น 1e-10


1
ฉันไม่แน่ใจว่าบริบทของคำตอบนี้ควรจะแยก RNNs ออกหรือไม่ แต่หากไม่เป็นเช่นนั้นทั้งสองวิธีที่เสนอนั้นไม่ดีไปกว่าการไล่ระดับสีโดยเฉพาะอย่างยิ่งในกรณีของ RNN
Alex R.

ขออภัยฉันคิดเพิ่มเติมเกี่ยวกับบริบทของ CNNs รู้สึกฟรีเพื่อแก้ไข
Miguel
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.