หากคุณสามารถใช้งาน SVM ได้คุณสามารถกำหนดคุณสมบัติได้ :)
โดยทั่วไปแล้วคุณสมบัติต่างๆจะถูกทำปริมาณโดยใช้การจัดกลุ่ม k-mean ก่อนอื่นคุณต้องตัดสินใจว่า "ขนาดคำศัพท์" ของคุณควรเป็นอะไร (พูดคำว่า "200 คำด้วยสายตา") จากนั้นคุณเรียกใช้การจัดกลุ่ม k-mean สำหรับกลุ่มนั้น (200) SIFT descriptors เป็นพาหะขององค์ประกอบที่ 128 นั่นคือจุดในพื้นที่ 128- มิติ ดังนั้นคุณสามารถลองจัดกลุ่มพวกเขาเช่นจุดอื่น ๆ คุณแยกตัวบ่งชี้ SIFT จากรูปภาพจำนวนมากคล้ายกับภาพที่คุณต้องการจัดประเภทโดยใช้คุณสมบัติถุง (โดยหลักการแล้วควรเป็นชุดภาพแยกต่างหาก แต่ในทางปฏิบัติผู้คนมักจะได้รับคุณสมบัติจากชุดภาพการฝึกอบรม) จากนั้นคุณเรียกใช้การจัดกลุ่ม k-mean ในชุดตัวบ่งชี้ SIFT ขนาดใหญ่นี้เพื่อแบ่งเป็น 200 (หรืออะไรก็ตาม) คือการกำหนด descriptor แต่ละตัวให้กับคลัสเตอร์ k-mean จะให้ 200 ศูนย์คลัสเตอร์
จากนั้นคุณใช้ตัวบ่งชี้ SIFT แต่ละอันในภาพของคุณและตัดสินใจว่ามันอยู่ในกลุ่มใด 200 กลุ่มโดยการหาจุดศูนย์กลางของคลัสเตอร์ที่อยู่ใกล้ที่สุด จากนั้นคุณก็นับจำนวนฟีเจอร์จากแต่ละคลัสเตอร์ที่คุณมี ดังนั้นสำหรับภาพใด ๆ ที่มีฟีเจอร์ SIFT จำนวนเท่าใดก็ตามคุณจะมีฮิสโตแกรม 200 ถัง นั่นคือเวกเตอร์ฟีเจอร์ของคุณที่คุณให้กับ SVM (หมายเหตุคำว่าคุณลักษณะนั้นมีการใช้งานมากเกินไป)
เมื่อฉันจำได้มีการทำงานหลายอย่างเกี่ยวกับวิธีการฮิสโตแกรมเหล่านี้ควรเป็นมาตรฐาน ฉันอาจจะผิด แต่ดูเหมือนว่าฉันจะเรียกคืนกระดาษที่อ้างว่ามีคุณสมบัติเวกเตอร์ไบนารี (เช่น 1 ถ้ามีอย่างน้อย 1 คุณสมบัติจากคลัสเตอร์นี้มีอยู่และ 0 เป็นอย่างอื่น) ทำงานได้ดีกว่าฮิสโตแกรม คุณจะต้องตรวจสอบวรรณกรรมเพื่อดูรายละเอียดและรายละเอียดนั้นสำคัญ
แก้ไข:กล่องเครื่องมือระบบการมองเห็นด้วยคอมพิวเตอร์สำหรับ MATLAB ในขณะนี้มีฟังก์ชั่นการใช้งานมากมาย