การจดจำรูปภาพ


11

กำลังมองหาระบบโอเพนซอร์ซที่อนุญาตให้ใช้ในเชิงพาณิชย์เพื่อทำการจดจำรูปภาพในคอลเล็กชั่นภาพขนาดใหญ่และเติบโตแบบออร์แกนิกของภาพสองมิติ

  • ปรับขนาดของภาพ
  • มุมที่ใช้ในการถ่ายภาพ
  • การซิงค์สีออฟเซ็ตหมายความว่าเนื่องจากความผิดปกติในการจับภาพและการแสดงผลสีของภาพต้นฉบับนั้นแตกต่างกันไปในแต่ละอินสแตนซ์
  • การครอบตัดภาพ
  • การเพิ่มลายน้ำหรือข้อความ
  • รูปแบบการโฟกัสที่เป็นไปได้ซึ่งหมายความว่าการจับภาพไม่ได้อยู่ในโฟกัสไม่ใช่ว่ามีการใช้ตัวกรองการปรับแต่งภาพ

ฉันโอเคกับการต้องฝึกอบรมแอปพลิเคชันตราบใดที่ผลตอบแทนจากการทำเช่นนั้นจะลดลง - กล่าวว่าในระยะยาวฉันคาดว่าจำนวนอินสแตนซ์ 2-D จะเติบโตมากกว่าสองสามพันครั้งแรกถึงร้อย จากหลายพัน แต่นั่นเป็นระยะยาวและฉันมีความสุขที่จะมีวิธีแก้ปัญหาที่ใช้งานได้ดีกับชุดฝึกอบรม 1,000 ตัวอย่างและ 10 ตัวอย่างต่อตัวอย่าง

UPDATE:สิทธิ์ใช้งานจะต้องสามารถใช้สำหรับการแจกจ่ายภายในเชิงพาณิชย์โดยไม่ต้องปล่อยซอร์สโค้ดแม้แต่ภายในสำหรับผู้ที่มีไบนารี รหัสจะไม่ถูกขายเพียงใช้ภายใน แต่ไม่ใช่ผู้ใช้ทุกคนจะสามารถเข้าถึงซอร์สโค้ดได้เพียงแค่ส่วนต่อประสาน


2
คุณพิจารณา OpenCV หรือไม่

+1 @pwny: ขอบคุณ - ไม่ฉันไม่เคยลองใช้ระบบการมองเห็นด้วยคอมพิวเตอร์ (CV) ใด ๆ เพียงแค่พยายามหาแนวคิดว่าวิธีที่ฉันคิดเกี่ยวกับปัญหานั้นถูกต้องหรือไม่ ฉันจะระบุว่าภาพใดเป็นของ แต่เนื่องจากเกี่ยวข้องกับการดำเนินธุรกิจและระบบ CV จะใช้ภายในเท่านั้นฉันพยายามไม่ระบุว่าระบบจะประมวลผลอย่างไร แต่จะต้องเผชิญกับความท้าทาย หาก OpenCV เป็นไปตามข้อกำหนดในปัจจุบันโปรดโพสต์เป็นคำตอบและพยายามเชื่อมโยงไปยังเอกสารที่เกี่ยวข้องซึ่งครอบคลุมถึงข้อกำหนดการทำงานที่มีให้หากเป็นไปได้ ขอขอบคุณอีกครั้ง!

1
ไม่มีสิ่งเช่น "การแจกจ่ายภายใน" ตามกฎหมายลิขสิทธิ์ ดังนั้นใบอนุญาตส่วนใหญ่ (ทั้งหมดที่ฉันรู้) ไม่ต้องกังวลกับข้อ จำกัด ในเรื่องนั้น
MSalters

+1 @MSalters: ขอบคุณคุณมีลิงก์ไปยัง "ตามกฎหมายลิขสิทธิ์" - หมายถึงดูเหมือนว่าคุณกำลังพูดถึงสิ่งนี้อยู่ภายใต้กฎหมายลิขสิทธิ์ของสหรัฐอเมริกาแม้ว่าฉันจะอ่านความคิดเห็นของคุณก็ตาม

1
@blunders: ในทางเทคนิคมันมาจากทริปส์ (ข้อ 1.3) ซึ่งกำหนดว่าบุคคลตามกฎหมาย (เช่น บริษัท ) จะได้รับการปฏิบัติเหมือนเป็นบุคคลธรรมดา
MSalters

คำตอบ:


10

อาจเป็นระดับต่ำ แต่OpenCVอาจมอบเครื่องมือที่คุณจำเป็นต้องใช้ในการสร้างซอฟต์แวร์จดจำภาพดังกล่าว แน่นอนว่า OpenCV ไม่ได้ให้สิ่งที่คุณต้องการ (ฉันคิดว่าฉันไม่ใช่มืออาชีพ) แต่มันมีจุดมุ่งหมายที่จะให้สิ่งที่จำเป็นสำหรับการมองเห็นคอมพิวเตอร์แบบเรียลไทม์

คุณสามารถเริ่มต้นการอ่านในเอกสารที่นี่ หนังสือดี ๆ บางเล่มมีอยู่ในหน้านั้นด้วย

หวังว่าจะช่วยโชคดี!


ใบอนุญาต GPLV2 ของ OpenCV หมายความว่าไม่สามารถแจกจ่ายภายในระบบแหล่งข้อมูลปิดได้หรือไม่ ขอบคุณ!

คุณเห็นใบอนุญาต GPLV2 อยู่ที่ไหน ในย่อหน้าแรกของโฮมเพจมันอยู่ในรายการใบอนุญาต BSD

@deterb: ในส่วนท้ายที่ด้านล่างสุดของหน้า

@deterb: ปรากฏลิงค์ GPL สำหรับMoinMoin Wiki Engine ที่ใช้สำหรับ wiki สำหรับ OpenCV ไม่ใช่ OpenCV - ขอบคุณที่ชี้ให้เห็นข้อผิดพลาดของฉัน!

+1 @pwny: ตามที่กล่าวไว้ OpenCV อยู่ภายใต้ใบอนุญาต BSD ซึ่งระบุไว้ในหน้าแรกของเว็บไซต์ (ปรากฏว่าส่วนท้ายของใบอนุญาต GPLV2 ไม่ได้ใช้กับ OpenCV) และพยายามยืนยันสิ่งนี้โดยการดาวน์โหลด OpenCV และค้นหาใบอนุญาตค้นหาภายใน มันคือไฟล์ทั้งหมด; ซึ่งส่งคืนใบอนุญาตของบุคคลที่สามอื่น ๆ ซึ่งเป็นใบอนุญาตที่ปรากฏสำหรับ OpenCV ในรูปแบบของใบอนุญาต BSD แม้ว่าจะไม่ได้ระบุว่าเป็นใบอนุญาต BSD ดังนั้นการทำเช่นนั้นคำตอบของคุณคือการช่วยเหลืออย่างมากและดูเหมือนดีพอที่จะก้าวไปข้างหน้า ขอบคุณ!


2

เพียงเพิ่มการสนทนาฉันกำลังทำงานกับการจับคู่ภาพและฉันพบว่าORBของ OpenCV นั้นฟรี อย่างไรก็ตามSURF และ SIFTไม่ใช่ คุณสามารถดูตัวอย่างนี้เป็นจุดเริ่มต้นที่เป็นไปได้


1

Pastec http://www.pastec.ioควรตอบสนองความต้องการของคำถามเริ่มต้น

เป็นดัชนีโอเพ่นซอร์สและเครื่องมือค้นหาสำหรับการจดจำรูปภาพที่เผยแพร่ภายใต้ LGPL อนุญาตให้เพิ่มลบและค้นหาภาพที่ตรงกันในดัชนีได้อย่างง่ายดายโดยใช้ HTTP API อย่างง่าย มันใช้ OpenCV และใช้ ORB descriptor ซึ่งไม่มีสิทธิบัตรซึ่งแตกต่างจาก SURF และ SIFT

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.