รายการคุณสมบัติภาพที่เป็นไปได้สำหรับการดึงภาพตามเนื้อหา


15

ฉันพยายามค้นหารายการคุณลักษณะภาพที่เป็นไปได้เช่นสีขอบที่มุ่งเน้นและอื่น ๆ สำหรับการวัดการใช้งานของพวกเขาในกรณีที่ค้นหาวัตถุที่คล้ายกัน / คล้ายกันในภาพ ไม่มีใครรู้รายการดังกล่าวหรืออย่างน้อยคุณสมบัติบางอย่าง?


สิ่งนี้อยู่นอกหัวข้อ แต่ CBIR สามารถแยกฟีเจอร์จากชุดข้อมูล Open Image หรือไม่ เป็นไปได้ที่จะดึงคุณสมบัติของภาพแม้ว่าภาพจะไม่ได้รับการบันทึกลงในดิสก์ภายในเครื่องหรือไม่?
Quix0te

คำตอบ:


25

สนามนั้นกว้างใหญ่เกินไป ดังนั้นฉันสงสัยว่าคุณสามารถมีรายการครบถ้วนสมบูรณ์ที่นี่ อย่างไรก็ตามMPEG 7เป็นหนึ่งในความพยายามหลักในการทำให้พื้นที่นี้เป็นมาตรฐาน ดังนั้นสิ่งที่รวมอยู่ที่นี่จึงไม่ใช่สากล - แต่อย่างน้อยก็เป็นสิ่งที่สำคัญที่สุด

นี่คือบางส่วนชุดคุณลักษณะที่สำคัญซึ่งมีการระบุไว้ใน MPEG7 (ผมสามารถพูดคุยเฉพาะเกี่ยวกับ Visual อธิบายไม่ได้ที่คนอื่นเห็นนี้สำหรับขอบเขตเต็ม)

Visual Descriptors มี 4 ประเภท:

1. Color Descriptorsซึ่งรวมถึง:
สีที่โดดเด่น
เค้าโครงสี (สีหลักโดยพื้นฐานแบบบล็อกต่อบล็อก)
สีที่ปรับขนาดได้ (โดยทั่วไปคือฮิสโตแกรมสี),
โครงสร้างสี (สีฮิสโตแกรมสีในพื้นที่)
และพื้นที่สี

2. เนื้ออธิบาย (ดูเพิ่มเติมที่นี่ ) ซึ่งรวมถึง:
เนื้อ Browsing อธิบาย - ซึ่งได้กำหนดเมล็ด / เลว, ความสม่ำเสมอและทิศทาง ตัวบ่งชี้เนื้อเดียวกัน - ซึ่งขึ้นอยู่กับธนาคารกรอง Gabor และ
Edge Histogram

3. Shape Descriptorsซึ่งรวมถึง: Descriptorsที่
อิงตามภูมิภาคเป็นคุณลักษณะแบบสเกลาร์ของรูปร่างภายใต้การพิจารณา - เช่นพื้นที่, ecentricities ฯลฯ
Contour based ที่รวบรวมคุณสมบัติรูปร่างที่แท้จริงและ
3D descriptors

4. ตัวอธิบายการเคลื่อนไหวสำหรับการ
เคลื่อนไหวของกล้องวิดีโอ (พารามิเตอร์การเคลื่อนไหวของกล้อง 3 มิติ) การ
เคลื่อนที่แบบเคลื่อนที่ (ของวัตถุในฉาก) [เช่นถูกสกัดโดยอัลกอริธึมการติดตาม] การเคลื่อนไหวแบบ Parametric (เช่นการเคลื่อนไหวเวกเตอร์ซึ่งช่วยให้คำอธิบาย เป็นแบบจำลองที่ซับซ้อนมากขึ้นในวัตถุต่าง ๆ )
กิจกรรมที่เป็นตัวบ่งชี้ความหมายมากกว่า


MPEG 7 ไม่ได้กำหนด "วิธีการแตกไฟล์" - เพียงกำหนดความหมายและวิธีการแสดง / จัดเก็บ ดังนั้นการวิจัยจึงมีอยู่เกี่ยวกับวิธีการแยกและใช้งาน

นี่เป็นอีกบทความที่ดีที่ให้ข้อมูลเชิงลึกในเรื่องนี้

แต่ใช่คุณสมบัติเหล่านี้จำนวนมากค่อนข้างพื้นฐานและอาจมีการวิจัยมากกว่านี้จะสร้างชุดคุณลักษณะ (และซับซ้อน) ที่ซับซ้อนยิ่งขึ้น



6

นอกจากนี้ยังมีหนังสือที่รวบรวมชุดเอกสารที่เกี่ยวข้องกับหัวข้อนี้ มันเรียกว่าหลักการของข้อมูลที่ดึงภาพ


Google เกี่ยวกับหนังสือไม่ได้เปิดเผยความเห็นเชิงบวกมากมาย ร้องเรียนมากกว่าแง่บวกจริง คุณยังคิดว่ามันเป็นข้อมูลอ้างอิงที่ดีและถ้าเป็นเช่นนั้นคุณอาจบอกเราได้ว่ามันมีประโยชน์กับคุณเมื่อใด :)
Penelope

เหตุผลหลักที่จะนำมาไว้ที่นี่ไม่ใช่ว่าฉันใช้มันมาก แต่ครูของฉันแนะนำมัน (และฉันเห็นคุณค่าของความคิดเห็นของเขา) Googleing เกี่ยวกับเรื่องนี้แสดงให้เห็นว่าเป็นกลุ่มของเอกสารไม่ใช่หนังสือ มันยังแสดงให้เห็นว่ามันค่อนข้างเก่า แต่ยังเป็นหนึ่งในหนังสือไม่กี่เล่มในหัวข้อ ดังนั้นฉันคิดว่าคำตอบของฉันยังเหมาะสม
Geerten

3

@Dipan Mehta ครอบคลุมตัวอธิบายคุณลักษณะที่สามารถใช้ได้ ผมขอตอนนี้พยายามและครอบคลุมในด้านอื่น ๆ ของเหรียญโดยกล่าวถึงบางวิธีการตรวจสอบคุณสมบัติว่าสารสกัดให้บริการที่ดีสำหรับCBIR

การอ้างอิงของฉันสำหรับฉันCBIRการวิจัยพบเอกสารโดยSivic, ZissermanและNister, Stewenius มีเอกสารที่เป็นปัจจุบันมากขึ้นจากผู้เขียนเหล่านี้ แต่สิ่งเหล่านี้นำเสนอแนวคิดที่เกี่ยวข้องทั้งหมด

พวกเขายืนยันว่าการใช้วิธีการCBIR ที่มีประสิทธิภาพควรใช้คุณสมบัติของคุณสมบัติเสริม :

  • ปรับรูปร่างภูมิภาค - มีแนวโน้มที่จะอยู่กึ่งกลางที่คุณสมบัติเหมือนมุม

    ตัวอย่าง: มุมของแฮร์ริส, แฮร์ริสหลายระดับ, DoG (ความแตกต่างของ Gaussians - แต่ยังตอบสนองต่อขอบ!)

  • ภูมิภาคที่มีเสถียรภาพสูงสุด - มีแนวโน้มที่จะอยู่กึ่งกลางที่คุณสมบัติที่เหมือนหยด

    ตัวอย่าง: MSER (ขอบเขต Extermal เสถียรสูงสุด), DoG

น่าแปลกที่Wikipediaยังมีการจำแนกประเภทฟีเจอร์ (ตัวตรวจจับ) ที่ดีซึ่งระบุประเภทของพื้นที่ที่น่าสนใจที่ตรวจพบสำหรับฟีเจอร์ที่ใช้กันอย่างแพร่หลายในปัจจุบัน:

  • เครื่องตรวจจับขอบ
  • เครื่องตรวจจับมุม
  • เครื่องตรวจจับหยด
  • เครื่องตรวจจับสัน

บทความปัจจุบันส่วนใหญ่ที่ฉันได้อ่านสาบานว่าตัวบ่งชี้SIFT (การแปลงคุณลักษณะแบบไม่แปรปรวน)จะสั่นสะเทือนและมีความแข็งแรงเพียงพอที่จะใช้ร่วมกับเครื่องตรวจจับคุณลักษณะที่เลือก การอ้างอิงรวมถึง:

  • ลิงก์ที่ให้ไว้แล้ว
  • Mikolajczyk, Schmidเกี่ยวข้องกับการเปรียบเทียบของdescriptors ท้องถิ่น
  • Dahlประเมินการรวมกันของตัวตรวจจับ - อธิบาย

บันทึก! เอกสารเหล่านี้ไม่ได้เกี่ยวข้องกับCBIRอย่างเคร่งครัดแต่ใช้เพื่ออ้างอิงในงานที่เกี่ยวข้องกับCBIR

ในที่สุดมันเป็นสาโทกล่าวถึงวิธีการที่ประสบความสำเร็จของCBIRไม่เพียง แต่ขึ้นอยู่กับเครื่องตรวจจับคุณสมบัติและตัวอธิบายที่ใช้ แต่ยัง:

  • โครงสร้างการค้นหาที่มีประสิทธิภาพ (การหาปริมาณของคุณสมบัติทางภาพ)
  • วิธีการสร้างdescriptor ภาพ - ไม่ว่าจะโดยอิงจากคุณสมบัติการมองเห็นทั่วไป (local descriptors) หรือการเปรียบเทียบ descriptor รูปภาพทั่วโลก (นี่เป็นแนวคิดใหม่มากดังนั้นจึงไม่มีการอ้างอิงในปัจจุบัน)
  • วัดระยะทางระหว่าง descriptor รูปภาพ

นอกจากนี้ฉันยังได้ตอบคำถามบางอย่างเกี่ยวกับCBIRในDSPและstackoverflowซึ่งทั้งคู่มีการอ้างอิงและคำอธิบายและฉันคิดว่าพวกเขาอาจเกี่ยวข้องกันดังนั้นคุณอาจต้องการดู:

  • DSP: 1
  • stackoverflow: 1 , 2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.