สำหรับข้อมูลเชิงเส้นแน่นอนว่าไม่มีประโยชน์ แต่สำหรับข้อมูลที่ไม่ใช่เชิงเส้นสิ่งนี้ดูเหมือนจะมีประโยชน์เสมอ การใช้ตัวจําแนกเชิงเส้นเป็นเรื่องง่ายกว่าที่ไม่ใช่เชิงเส้นในแง่ของเวลาการฝึกอบรมและความยืดหยุ่น
@BartoszKP ได้อธิบายแล้วว่าทำไมเคอร์เนลจึงมีประโยชน์ เพื่อตอบคำถามของคุณอย่างเต็มที่ แต่ฉันต้องการชี้ให้เห็นว่าการสร้างเคอร์เนลนั้นไม่ใช่ตัวเลือกเดียวที่จะจัดการกับข้อมูลที่ไม่สามารถแบ่งแยกได้แบบเชิงเส้น
มีอย่างน้อยสามดีทางเลือกทั่วไปสำหรับเป็นdelinearizationของรูปแบบ:
- วิธีการตามเครือข่าย Neutal ซึ่งคุณเพิ่มหน่วยประมวลผลหนึ่งเลเยอร์ (หรือมากกว่า) สามารถแปลงข้อมูลของคุณให้เป็นกรณีที่แยกได้เป็นเชิงเส้น ในกรณีที่ง่ายที่สุดคือเลเยอร์ sigmoid ซึ่งเพิ่มความไม่เป็นเชิงเส้นให้กับกระบวนการ เมื่อเริ่มต้นแบบสุ่มพวกเขาจะได้รับการปรับปรุงในระหว่างการเพิ่มประสิทธิภาพการไล่ระดับสีของชั้นบน (ซึ่งจริง ๆ แล้วแก้ปัญหาเชิงเส้น)
- โดยเฉพาะ - เทคนิคการเรียนรู้ลึกสามารถใช้ที่นี่เพื่อเตรียมข้อมูลสำหรับการจำแนกเชิงเส้นเพิ่มเติม เป็นความคิดที่คล้ายกันมากกับหน้าที่ก่อนหน้านี้ แต่ที่นี่คุณฝึกอบรมเลเยอร์การประมวลผลของคุณเป็นครั้งแรกเพื่อหาจุดเริ่มต้นที่ดีสำหรับการปรับแต่งเพิ่มเติมตามการฝึกอบรมของตัวแบบเชิงเส้นบางส่วน
- การฉายแบบสุ่ม - คุณสามารถสุ่มตัวอย่าง (ไม่ใช่เชิงเส้น) จากพื้นที่ที่กำหนดไว้ล่วงหน้าและฝึกฝนตัวจําแนกเชิงเส้นที่อยู่ด้านบน ความคิดนี้ถูกนำไปใช้อย่างหนักในการเรียนรู้ของเครื่องจักรขั้นสูงโดยใช้ตัวแก้ปัญหาเชิงเส้นที่มีประสิทธิภาพมากในการฝึกอบรมตัวจําแนกอย่างง่าย ๆ บนเครื่องฉายภาพแบบสุ่มและบรรลุผลงานที่ดีมาก เครื่องจักร )
เพื่อสรุปผล - การทำให้เป็นเคอร์เนลเป็นเทคนิคการลดแรงตึงผิวที่ยอดเยี่ยมและคุณสามารถใช้เมื่อปัญหาไม่ได้เป็นเชิงเส้น แต่สิ่งนี้ไม่ควรตาบอด "ถ้าเป็นเช่นนั้น" ประเมินค่า นี่เป็นหนึ่งในวิธีการที่น่าสนใจอย่างน้อยหนึ่งวิธีซึ่งสามารถนำไปสู่ผลลัพธ์ที่หลากหลายขึ้นอยู่กับปัญหาและข้อกำหนด โดยเฉพาะอย่างยิ่ง ELM มีแนวโน้มที่จะหาวิธีการแก้ปัญหาที่คล้ายกันมากกับที่ได้รับจาก kernelized SVM ในขณะเดียวกันก็สามารถฝึกให้มีขนาดของแถวได้เร็วขึ้น (ดังนั้นจึงขยายขนาดได้ดีกว่า SVM แบบเคอร์เนล)