ตัวอย่างที่ใช้ง่ายที่สุดในการอธิบายสิ่งนี้คือปัญหา XOR (ดูภาพด้านล่าง) ลองนึกภาพว่าคุณได้รับข้อมูลที่ประกอบด้วยการประสานงานและyและคลาสไบนารีเพื่อทำนาย คุณสามารถคาดหวังว่าอัลกอริทึมการเรียนรู้เครื่องของคุณจะค้นหาขอบเขตการตัดสินใจที่ถูกต้องด้วยตัวเอง แต่ถ้าคุณสร้างฟีเจอร์เพิ่มเติมz = x yปัญหาจะกลายเป็นเรื่องไม่สำคัญเนื่องจากz > 0ให้เกณฑ์การตัดสินใจเกือบสมบูรณ์แบบสำหรับการจัดหมวดหมู่ เลขคณิต!xyz=xyz>0
ดังนั้นในหลายกรณีคุณอาจคาดหวังได้จากอัลกอริทึมในการค้นหาวิธีแก้ปัญหาหรือโดยการใช้คุณสมบัติทางวิศวกรรมคุณสามารถทำให้ปัญหาง่ายขึ้น ปัญหาง่าย ๆ คือการแก้ปัญหาที่ง่ายขึ้นและเร็วขึ้นและต้องการอัลกอริทึมที่ซับซ้อนน้อยลง อัลกอริทึมแบบง่ายมักจะมีประสิทธิภาพมากขึ้นผลลัพธ์มักจะสามารถตีความได้มากขึ้นพวกเขาสามารถปรับขนาดได้มากขึ้น (ทรัพยากรการคำนวณน้อยกว่าเวลาในการฝึกอบรม ฯลฯ ) และพกพา คุณสามารถหาตัวอย่างและคำอธิบายเพิ่มเติมในการพูดคุยที่ยอดเยี่ยมโดยVincent D. Warmerdam ที่ได้รับจากการประชุม PyData ในลอนดอนในลอนดอน
ยิ่งกว่านั้นอย่าเชื่อทุกสิ่งที่นักการเรียนรู้ของเครื่องบอกคุณ ในกรณีส่วนใหญ่อัลกอริทึมจะไม่ "เรียนรู้ด้วยตนเอง" คุณมักจะมีเวลา จำกัด ทรัพยากรกำลังการคำนวณและข้อมูลมักมีขนาด จำกัด และมีเสียงดังไม่ได้ช่วยอะไร
การทำสิ่งนี้ให้สุดขีดคุณสามารถให้ข้อมูลของคุณเป็นภาพถ่ายบันทึกย่อที่เขียนด้วยลายมือของผลการทดสอบและส่งต่อไปยังเครือข่ายประสาทที่ซับซ้อน ก่อนอื่นมันจะต้องเรียนรู้ที่จะรับรู้ข้อมูลบนรูปภาพจากนั้นเรียนรู้ที่จะเข้าใจและทำการทำนาย ในการทำเช่นนั้นคุณจะต้องใช้คอมพิวเตอร์ที่ทรงพลังและใช้เวลานานในการฝึกฝนและปรับรูปแบบและต้องการข้อมูลจำนวนมากเนื่องจากการใช้เครือข่ายประสาทที่ซับซ้อน ให้ข้อมูลในรูปแบบที่คอมพิวเตอร์สามารถอ่านได้ (เป็นตารางตัวเลข) ทำให้ปัญหาง่ายขึ้นอย่างมากเนื่องจากคุณไม่ต้องการการจดจำอักขระทั้งหมด คุณสามารถนึกถึงคุณสมบัติทางวิศวกรรมเป็นขั้นตอนต่อไปที่ซึ่งคุณแปลงข้อมูลด้วยวิธีดังกล่าวเพื่อสร้างความหมายฟีเจอร์ดังนั้นอัลกอริทึมของคุณจึงมีน้อยกว่าที่จะคิดออกเอง เพื่อให้การเปรียบเทียบมันเป็นเหมือนที่คุณต้องการอ่านหนังสือในภาษาต่างประเทศเพื่อให้คุณจำเป็นต้องเรียนรู้ภาษาก่อนเมื่อเทียบกับการอ่านมันแปลในภาษาที่คุณเข้าใจ
ในตัวอย่างข้อมูลไททานิคอัลกอริทึมของคุณจะต้องเข้าใจว่าการรวมสมาชิกในครอบครัวเข้ากันได้ดีเพื่อให้ได้คุณสมบัติ "ขนาดครอบครัว" (ใช่ฉันกำลังกำหนดให้เป็นแบบส่วนตัวในที่นี่) นี่เป็นคุณสมบัติที่ชัดเจนสำหรับมนุษย์ แต่ไม่ชัดเจนหากคุณเห็นข้อมูลว่าเป็นเพียงบางคอลัมน์ของตัวเลข หากคุณไม่ทราบว่าคอลัมน์ใดที่มีความหมายเมื่อพิจารณาพร้อมกับคอลัมน์อื่น ๆ อัลกอริทึมสามารถคิดได้โดยลองใช้ชุดค่าผสมแต่ละคอลัมน์ที่เป็นไปได้ แน่นอนว่าเรามีวิธีการที่ชาญฉลาดในการทำสิ่งนี้ แต่ก็ยังง่ายกว่ามากหากข้อมูลนั้นมอบให้กับอัลกอริทึมทันที