คุณสมบัติของชุดข้อมูลสองชุดของคุณคือ ความสามารถในการแยกเชิงเส้นอย่างง่าย ๆ นั่นคือมีเส้นที่คั่นพวกมัน การเรียนรู้ของเครื่องจำนวนมากมุ่งเน้นไปที่การค้นหาตัวแยกประเภทแบบเส้นตรงซึ่งเป็นเส้นที่ทำการแยกส่วนที่คุณสนใจ
ขณะที่คุณกำลังพูดถึงเส้นฉันจะสมมติว่าคะแนนของคุณอยู่ในระนาบ สิ่งที่คุณต้องการทำคือค้นหาค่า , w 2และw 3เช่นนั้นสำหรับทุกจุด( a 1 , a 2 )ในเซตA , w 1 a 1 + w 2 a 2 ≥ w 3และสำหรับทุกจุด( b 1 , b 2 )ในB , w 1 b 1 +w1w2w3(a1,a2)Aw1a1+w2a2≥w3(b1,b2)B 3 ดังนั้นอสมการ W 1 x + W 2ปี≥ W 3สามารถมองเห็นเป็นลักษณนามสำหรับชุดw1b1+w2b2<w3w1x+w2y≥w3A
มีอัลกอริทึมการเรียนรู้ของเครื่องมากมายสำหรับการกำหนดเส้นที่เหมาะสม (การถดถอยเชิงเส้นการถดถอยโลจิสติกและอื่น ๆ ) สิ่งเหล่านี้จะค้นหาค่าสำหรับตามเมตริกข้อผิดพลาดบางอย่าง จากนั้นคุณสามารถทดสอบได้ว่าคะแนนทั้งหมดจำแนกอย่างถูกต้องหรือไม่ นั่นคือไม่ว่าค่าทั้งหมดในA จะเป็นไปตามสมการข้างต้นและคล้ายกันสำหรับBหรือไม่w1,w2,w3AB
ในขณะที่คุณสนใจเพียงแค่ว่าบรรทัดนั้นมีอยู่หรือไม่คุณจำเป็นต้องใช้เทคนิคที่มีอยู่ (แม้ว่าอาจจะง่ายกว่า) เพียงแค่ติดตั้งคอลเลกชันต่อไปนี้ equalities ในแง่ของตัวแปรฟรี 3w1,w2,w3
สำหรับแต่ละฉัน= 1 , . , | A | ที่ = { ( 1 1 , 1 2 ) , ... , ( | | 1 , | | 2 ) }w1ai1+w2ai2≥w3i=1,..,|A|A={(a11,a12),…,(a|A|1,a|A|2)}
สำหรับแต่ละ J = 1 , . , | B | ที่ B = { ( ข1 1 , ข1 2 ) , ... , ( ข| B | 1 , ข| B | 2 ) }w1bj1+w2bj2<w3j=1,..,|B|B={(b11,b12),…,(b|B|1,b|B|2)}
หากข้อ จำกัด เหล่านี้สอดคล้องกันจะมีบรรทัดอยู่