การเรียนรู้ของเครื่องมักจะเกี่ยวข้องกับการเพิ่มประสิทธิภาพของฟังก์ชั่นที่มีมินิมัลท้องถิ่น เครือข่ายนิวรัลของ Feedforward พร้อมหน่วยที่ซ่อนอยู่เป็นตัวอย่างที่ดี ไม่ว่าฟังก์ชั่นเหล่านี้จะแยกหรือต่อเนื่องไม่มีวิธีใดที่ทำให้ได้ค่าต่ำสุดและหยุดได้ มันง่ายที่จะพิสูจน์ว่าไม่มีอัลกอริธึมทั่วไปในการค้นหาฟังก์ชันขั้นต่ำทั่วโลกแม้ว่ามันจะเป็นมิติเดียวและราบรื่น (มีอนุพันธ์จำนวนมากมาย) ในทางปฏิบัติอัลกอริทึมทั้งหมดสำหรับการเรียนรู้เครือข่ายประสาทติดอยู่ในระดับต่ำสุดในท้องถิ่น มันง่ายที่จะตรวจสอบสิ่งนี้: สร้างเครือข่ายนิวรัลสุ่มสร้างชุดใหญ่ของการตอบสนองต่ออินพุตสุ่มจากนั้นลองเรียนรู้เครือข่ายนิวรัลอื่นด้วยสถาปัตยกรรมเดียวกันเพื่อคัดลอกคำตอบ ในขณะที่มีวิธีการแก้ปัญหาที่สมบูรณ์แบบทั้งการ backpropagation ไม่มีอัลกอริทึมการเรียนรู้อื่น ๆ จะสามารถค้นพบ
วิธีการเรียนรู้บางอย่างเช่นการจำลองการอบอ่อนหรืออัลกอริทึมทางพันธุกรรมสำรวจมินิมัลท้องถิ่นจำนวนมาก สำหรับฟังก์ชั่นต่อเนื่องมีวิธีการเช่นการไล่ระดับสีแบบลาดชัน พวกมันเร็วกว่ามากนั่นเป็นเหตุผลว่าทำไมพวกมันจึงถูกใช้อย่างกว้างขวางในทางปฏิบัติ แต่ให้เวลาเพียงพอกลุ่มวิธีการเดิมมีประสิทธิภาพสูงกว่าข้อผิดพลาดของชุดฝึกอบรมในภายหลัง แต่ด้วยข้อ จำกัด ด้านเวลาที่สมเหตุสมผลสำหรับปัญหาในโลกแห่งความเป็นจริงกลุ่มหลังมักจะดีกว่า
สำหรับบางรุ่นเช่นการถดถอยโลจิสติกมีหนึ่งขั้นต่ำในท้องถิ่นฟังก์ชั่นนูน, การย่อเล็กสุดมาบรรจบกับขั้นต่ำ แต่รูปแบบตัวเองง่าย
นั่นคือความจริงที่ขมขื่น
โปรดทราบว่าการพิสูจน์การบรรจบกันและการพิสูจน์การลู่เข้าสู่ทางออกที่ดีที่สุดนั้นเป็นสองสิ่งที่แตกต่างกัน K-mean algorithm เป็นตัวอย่างของสิ่งนี้
ในที่สุดสำหรับบางรุ่นเราไม่ทราบวิธีการเรียนรู้เลย ตัวอย่างเช่นหากผลลัพธ์เป็นฟังก์ชั่นที่คำนวณได้โดยพลการของอินพุตเราไม่ทราบอัลกอริทึมที่ดีซึ่งในเวลาที่เหมาะสมให้ค้นหาเครื่องทัวริงหรือเทียบเท่าที่ใช้ฟังก์ชันนี้ ตัวอย่างเช่นถ้า f (1) = 2, f (2) = 3, f (3) = 5, f (4) = 7, ... , f (10) = 29 (สิบช่วงแรก) เราไม่ ไม่รู้อัลกอริทึมการเรียนรู้ใด ๆ ซึ่งจะสามารถทำนายได้ในเวลาที่เหมาะสมว่า f (11) = 31 เว้นแต่ว่ามันจะรู้แนวคิดของจำนวนเฉพาะแล้ว