ฉันพยายามค้นหารายการคุณลักษณะภาพที่เป็นไปได้เช่นสีขอบที่มุ่งเน้นและอื่น ๆ สำหรับการวัดการใช้งานของพวกเขาในกรณีที่ค้นหาวัตถุที่คล้ายกัน / คล้ายกันในภาพ ไม่มีใครรู้รายการดังกล่าวหรืออย่างน้อยคุณสมบัติบางอย่าง?
ฉันพยายามค้นหารายการคุณลักษณะภาพที่เป็นไปได้เช่นสีขอบที่มุ่งเน้นและอื่น ๆ สำหรับการวัดการใช้งานของพวกเขาในกรณีที่ค้นหาวัตถุที่คล้ายกัน / คล้ายกันในภาพ ไม่มีใครรู้รายการดังกล่าวหรืออย่างน้อยคุณสมบัติบางอย่าง?
คำตอบ:
สนามนั้นกว้างใหญ่เกินไป ดังนั้นฉันสงสัยว่าคุณสามารถมีรายการครบถ้วนสมบูรณ์ที่นี่ อย่างไรก็ตามMPEG 7เป็นหนึ่งในความพยายามหลักในการทำให้พื้นที่นี้เป็นมาตรฐาน ดังนั้นสิ่งที่รวมอยู่ที่นี่จึงไม่ใช่สากล - แต่อย่างน้อยก็เป็นสิ่งที่สำคัญที่สุด
นี่คือบางส่วนชุดคุณลักษณะที่สำคัญซึ่งมีการระบุไว้ใน MPEG7 (ผมสามารถพูดคุยเฉพาะเกี่ยวกับ Visual อธิบายไม่ได้ที่คนอื่นเห็นนี้สำหรับขอบเขตเต็ม)
Visual Descriptors มี 4 ประเภท:
1. Color Descriptorsซึ่งรวมถึง:
สีที่โดดเด่น
เค้าโครงสี (สีหลักโดยพื้นฐานแบบบล็อกต่อบล็อก)
สีที่ปรับขนาดได้ (โดยทั่วไปคือฮิสโตแกรมสี),
โครงสร้างสี (สีฮิสโตแกรมสีในพื้นที่)
และพื้นที่สี
2. เนื้ออธิบาย (ดูเพิ่มเติมที่นี่ ) ซึ่งรวมถึง:
เนื้อ Browsing อธิบาย - ซึ่งได้กำหนดเมล็ด / เลว, ความสม่ำเสมอและทิศทาง ตัวบ่งชี้เนื้อเดียวกัน - ซึ่งขึ้นอยู่กับธนาคารกรอง Gabor และ
Edge Histogram
3. Shape Descriptorsซึ่งรวมถึง: Descriptorsที่
อิงตามภูมิภาคเป็นคุณลักษณะแบบสเกลาร์ของรูปร่างภายใต้การพิจารณา - เช่นพื้นที่, ecentricities ฯลฯ
Contour based ที่รวบรวมคุณสมบัติรูปร่างที่แท้จริงและ
3D descriptors
4. ตัวอธิบายการเคลื่อนไหวสำหรับการ
เคลื่อนไหวของกล้องวิดีโอ (พารามิเตอร์การเคลื่อนไหวของกล้อง 3 มิติ) การ
เคลื่อนที่แบบเคลื่อนที่ (ของวัตถุในฉาก) [เช่นถูกสกัดโดยอัลกอริธึมการติดตาม] การเคลื่อนไหวแบบ Parametric (เช่นการเคลื่อนไหวเวกเตอร์ซึ่งช่วยให้คำอธิบาย เป็นแบบจำลองที่ซับซ้อนมากขึ้นในวัตถุต่าง ๆ )
กิจกรรมที่เป็นตัวบ่งชี้ความหมายมากกว่า
MPEG 7 ไม่ได้กำหนด "วิธีการแตกไฟล์" - เพียงกำหนดความหมายและวิธีการแสดง / จัดเก็บ ดังนั้นการวิจัยจึงมีอยู่เกี่ยวกับวิธีการแยกและใช้งาน
นี่เป็นอีกบทความที่ดีที่ให้ข้อมูลเชิงลึกในเรื่องนี้
แต่ใช่คุณสมบัติเหล่านี้จำนวนมากค่อนข้างพื้นฐานและอาจมีการวิจัยมากกว่านี้จะสร้างชุดคุณลักษณะ (และซับซ้อน) ที่ซับซ้อนยิ่งขึ้น
ตกลงฉันคิดว่าฉันพบรายการที่เหมาะสมโดยค้นหาเพียงเล็กน้อย มีกระดาษจาก Deselaers และอัล ซึ่งตะเข็บเป็นสิ่งที่ฉันกำลังมองหา!
นอกจากนี้ยังมีหนังสือที่รวบรวมชุดเอกสารที่เกี่ยวข้องกับหัวข้อนี้ มันเรียกว่าหลักการของข้อมูลที่ดึงภาพ
@Dipan Mehta ครอบคลุมตัวอธิบายคุณลักษณะที่สามารถใช้ได้ ผมขอตอนนี้พยายามและครอบคลุมในด้านอื่น ๆ ของเหรียญโดยกล่าวถึงบางวิธีการตรวจสอบคุณสมบัติว่าสารสกัดให้บริการที่ดีสำหรับCBIR
การอ้างอิงของฉันสำหรับฉันCBIRการวิจัยพบเอกสารโดยSivic, ZissermanและNister, Stewenius มีเอกสารที่เป็นปัจจุบันมากขึ้นจากผู้เขียนเหล่านี้ แต่สิ่งเหล่านี้นำเสนอแนวคิดที่เกี่ยวข้องทั้งหมด
พวกเขายืนยันว่าการใช้วิธีการCBIR ที่มีประสิทธิภาพควรใช้คุณสมบัติของคุณสมบัติเสริม :
ปรับรูปร่างภูมิภาค - มีแนวโน้มที่จะอยู่กึ่งกลางที่คุณสมบัติเหมือนมุม
ตัวอย่าง: มุมของแฮร์ริส, แฮร์ริสหลายระดับ, DoG (ความแตกต่างของ Gaussians - แต่ยังตอบสนองต่อขอบ!)
ภูมิภาคที่มีเสถียรภาพสูงสุด - มีแนวโน้มที่จะอยู่กึ่งกลางที่คุณสมบัติที่เหมือนหยด
ตัวอย่าง: MSER (ขอบเขต Extermal เสถียรสูงสุด), DoG
น่าแปลกที่Wikipediaยังมีการจำแนกประเภทฟีเจอร์ (ตัวตรวจจับ) ที่ดีซึ่งระบุประเภทของพื้นที่ที่น่าสนใจที่ตรวจพบสำหรับฟีเจอร์ที่ใช้กันอย่างแพร่หลายในปัจจุบัน:
บทความปัจจุบันส่วนใหญ่ที่ฉันได้อ่านสาบานว่าตัวบ่งชี้SIFT (การแปลงคุณลักษณะแบบไม่แปรปรวน)จะสั่นสะเทือนและมีความแข็งแรงเพียงพอที่จะใช้ร่วมกับเครื่องตรวจจับคุณลักษณะที่เลือก การอ้างอิงรวมถึง:
บันทึก! เอกสารเหล่านี้ไม่ได้เกี่ยวข้องกับCBIRอย่างเคร่งครัดแต่ใช้เพื่ออ้างอิงในงานที่เกี่ยวข้องกับCBIR
ในที่สุดมันเป็นสาโทกล่าวถึงวิธีการที่ประสบความสำเร็จของCBIRไม่เพียง แต่ขึ้นอยู่กับเครื่องตรวจจับคุณสมบัติและตัวอธิบายที่ใช้ แต่ยัง:
นอกจากนี้ฉันยังได้ตอบคำถามบางอย่างเกี่ยวกับCBIRในDSPและstackoverflowซึ่งทั้งคู่มีการอ้างอิงและคำอธิบายและฉันคิดว่าพวกเขาอาจเกี่ยวข้องกันดังนั้นคุณอาจต้องการดู: