Support Vector Machine มีความไวต่อความสัมพันธ์ระหว่างคุณลักษณะหรือไม่


11

ฉันต้องการฝึกอบรม SVM เพื่อจำแนกกรณีและปัญหา (TRUE / FALSE) ตาม 20 คุณลักษณะ ฉันรู้ว่าคุณลักษณะเหล่านั้นบางอย่างมีความสัมพันธ์สูง ดังนั้นคำถามของฉันคือ: SVM มีความไวต่อความสัมพันธ์หรือความซ้ำซ้อนระหว่างคุณสมบัติหรือไม่ การอ้างอิงใด ๆ


ฉันเดาว่าจะไม่ใช่เพราะการสร้างการแยกตามตัวแปรหนึ่งตัวจะทำให้ตัวแปรที่มีความสัมพันธ์อื่น ๆ อ่อนแอลงเมื่อแยกออกไปอีก อาจมีความไม่แน่นอนบางประการเกี่ยวกับตัวแปรที่ถูกเลือกอย่างไรก็ตาม
mandata

คุณกำลังพูดถึง SVM เชิงเส้นหรือเคอร์เนล RBF หรือ ... ?
Dougal

อืมฉันไม่รู้ ... คำตอบนั้นขึ้นอยู่กับสิ่งนั้นเหรอ?
user7064

ใช่แล้ว คุณสามารถออกแบบเคอร์เนลเพื่อจัดการกับความสัมพันธ์อย่างชัดเจนหากคุณต้องการ
Dougal

1
@Dougal: หากมีวิธีการกำจัดผลกระทบของความสัมพันธ์นั่นไม่ได้หมายความว่า SVM มาตรฐานนั้นไวต่อความสัมพันธ์หรือไม่?
cfh

คำตอบ:


12

เคอร์เนลเชิงเส้น:เอฟเฟกต์ที่นี่คล้ายกับที่มีหลายค่าความสัมพันธ์ในการถดถอยเชิงเส้น โมเดลที่เรียนรู้ของคุณอาจไม่คงที่โดยเฉพาะกับชุดรูปแบบขนาดเล็กในชุดฝึกอบรมเนื่องจากเว็กเตอร์น้ำหนักต่างกันจะมีเอาต์พุตเหมือนกัน แม้ว่าชุดการฝึกอบรมจะมีความเสถียรพอสมควรและจะทำการทดสอบการคาดการณ์หากมาจากการแจกแจงแบบเดียวกัน

เคอร์เนล RBF: เคอร์เนล RBF ดูที่ระยะทางระหว่างจุดข้อมูลเท่านั้น ดังนั้นจินตนาการว่าคุณมี 11 คุณลักษณะ แต่หนึ่งในนั้นถูกทำซ้ำ 10 ครั้ง (เป็นกรณีที่ค่อนข้างสุดขีด) จากนั้นแอตทริบิวต์ที่ทำซ้ำจะส่งผลต่อระยะทางไกลกว่าคุณลักษณะอื่น ๆ 10 เท่าและโมเดลที่เรียนรู้อาจได้รับผลกระทบจากฟีเจอร์นั้นมากขึ้น

d(x,y)=(xy)TS1(xy)SxCxCS1=CTCS1


นี่เป็นคำตอบที่น่าสนใจมาก ฉันต้องการอ่านเพิ่มเติมเกี่ยวกับวิธีบรรเทาปัญหาเหล่านี้ คุณสามารถเพิ่มการอ้างอิงหรือสองหรือไม่
Sycorax พูดว่า Reinstate Monica

ฉันไม่รู้จักมือดี แต่ฉันจะมองไปรอบ ๆ สักหน่อยบางทีคืนนี้
Dougal

! น่ากลัว ส่งข้อความถึงฉันหากคุณพบบทความดีๆ ฉันดีใจที่ (+1) ของฉันทำให้คุณได้มากกว่า 3k (-:
Sycorax พูดว่า Reinstate Monica

1
ความผกผันของเมทริกซ์ความแปรปรวนร่วมในระยะทาง Mahalanobis เป็นกุญแจสำคัญ หากคุณสามารถประเมินได้อย่างน่าเชื่อถือผลกระทบนี้สามารถนำมาใช้
Vladislavs Dovgalecs
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.