ประโยชน์หลักที่อ้างว่า:
(1)ไม่จำเป็นต้องส่งมอบคุณสมบัติวิศวกรสำหรับปัญหาการเรียนรู้ที่ไม่ใช่เชิงเส้น (ประหยัดเวลาและปรับขนาดได้ในอนาคตเนื่องจากวิศวกรรมมือบางคนมองว่าเป็นวงช่วยเหลือระยะสั้น)
(2)ฟีเจอร์ที่เรียนรู้บางครั้งดีกว่าฟีเจอร์ที่ได้รับการออกแบบด้วยมือที่ดีที่สุดและอาจซับซ้อน (การมองเห็นของคอมพิวเตอร์ - เช่นคุณสมบัติที่คล้ายกัน) ที่จะใช้เวลาในการสร้างวิศวกรมากเกินไป
(3)สามารถใช้ข้อมูลที่ไม่มีป้ายกำกับเพื่อฝึกอบรมเครือข่ายล่วงหน้า สมมติว่าเรามีภาพที่ไม่มีป้ายกำกับ 1000000 ภาพและมีป้ายกำกับ 1,000 ภาพ ตอนนี้เราสามารถปรับปรุงอัลกอริทึมการเรียนรู้ภายใต้การดูแลอย่างมากโดยการฝึกอบรมล่วงหน้าเกี่ยวกับภาพที่ไม่มีป้ายกำกับ 1000000 ภาพพร้อมการเรียนรู้ลึก นอกจากนี้ในบางโดเมนเรามีข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก แต่ข้อมูลที่ติดป้ายกำกับนั้นหายาก อัลกอริทึมที่สามารถใช้ข้อมูลที่ไม่มีป้ายกำกับนี้เพื่อปรับปรุงการจำแนกประเภทมีค่า
(4)เชิงประจักษ์ทุบมาตรฐานมากมายที่ได้เห็นการปรับปรุงที่เพิ่มขึ้นจนกระทั่งการแนะนำวิธีการเรียนรู้ลึก
(5)อัลกอริทึมเดียวกันทำงานในหลายพื้นที่ด้วยอินพุต (อาจมีการประมวลผลล่วงหน้าเล็กน้อย)
(6) ยังคงปรับปรุงเนื่องจากมีการป้อนข้อมูลเพิ่มเติมในเครือข่าย (สมมติว่ามีการแจกแจงแบบคงที่และอื่น ๆ )