เมื่อทำการจัดหมวดหมู่ SVM แบบเส้นตรงมักจะเป็นประโยชน์ในการทำให้ข้อมูลการฝึกอบรมเป็นปกติเช่นการลบค่าเฉลี่ยและหารด้วยค่าเบี่ยงเบนมาตรฐาน ทำไมกระบวนการนี้จึงเปลี่ยนประสิทธิภาพการจำแนกอย่างรวดเร็ว?
เมื่อทำการจัดหมวดหมู่ SVM แบบเส้นตรงมักจะเป็นประโยชน์ในการทำให้ข้อมูลการฝึกอบรมเป็นปกติเช่นการลบค่าเฉลี่ยและหารด้วยค่าเบี่ยงเบนมาตรฐาน ทำไมกระบวนการนี้จึงเปลี่ยนประสิทธิภาพการจำแนกอย่างรวดเร็ว?
คำตอบ:
ฉันคิดว่ามันสามารถทำให้ชัดเจนขึ้นผ่านตัวอย่าง สมมุติว่าคุณมีเวกเตอร์อินพุตสองตัว: X1 และ X2 และสมมุติว่า X1 มีช่วง (0.1 ถึง 0.8) และ X2 มีช่วง (3000 ถึง 50,000) ตอนนี้ตัวจําแนก SVM ของคุณจะเป็นขอบเขตเชิงเส้นซึ่งอยู่ในระนาบ X1-X2 การเรียกร้องของฉันคือความชันของขอบเขตการตัดสินใจเชิงเส้นไม่ควรขึ้นอยู่กับช่วงของ X1 และ X2 แต่ขึ้นอยู่กับการกระจายของคะแนน
ทีนี้ลองทำการทำนายจุด (0.1, 4000) และ (0.8, 4000) จะมีความแตกต่างเล็กน้อยในค่าของฟังก์ชั่นดังนั้นจึงทำให้ SVM มีความแม่นยำน้อยลงเนื่องจากจะมีความไวต่อคะแนนในทิศทาง X1 น้อยลง
SVM พยายามที่จะเพิ่มระยะห่างระหว่างระนาบที่แยกและเวกเตอร์สนับสนุน หากหนึ่งคุณลักษณะ (เช่นหนึ่งมิติในพื้นที่นี้) มีค่าที่สูงมากมันจะครอบงำคุณสมบัติอื่น ๆ เมื่อคำนวณระยะทาง หากคุณขายฟีเจอร์ทั้งหมด (เช่น [0, 1]) ฟีเจอร์ทั้งหมดนั้นจะมีผลเหมือนกันกับการวัดระยะทาง