อะไรคือทางเลือกฟรีของ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้?


66

เท่าที่ฉันเข้าใจทั้ง SURF และ SIFT นั้นได้รับการคุ้มครองสิทธิบัตร
มีวิธีการอื่นใดที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้อย่างอิสระหรือไม่?

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตรวจสอบสิทธิบัตร: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html


7
โปรดจำไว้ว่าพวกเขาได้รับการจดสิทธิบัตรเฉพาะในประเทศที่อนุญาตสิทธิบัตรซอฟต์แวร์ซึ่งยังไม่รวมถึงสหภาพยุโรป
Martin Beckett

1
@MartinBeckett ครอบคลุมการพัฒนาปรับใช้หรือทั้งสองอย่างใช่ไหม
Andrey Rubshtein

2
นั่นเป็นเรื่องยุ่งยากเกี่ยวกับสิทธิบัตรซอฟต์แวร์ สิทธิบัตรหยุดการผลิตหรือจำหน่ายในประเทศ แต่ไม่ใช่การวิจัยหรือการพัฒนา ตอนนี้การพัฒนาซอฟต์แวร์คืออะไร?
Martin Beckett

สิ่งที่จดสิทธิบัตรใน SIFT คืออะไร? SIFT มีสามขั้นตอน: (i) การสร้างสเกลพื้นที่, (ii) Keypoint Detector และ (iii) Descriptor generator ความรู้สึกของฉันคือมีเพียงเครื่องสร้าง Descriptor เท่านั้นที่ได้รับการจดสิทธิบัตร ฉันถูกไหม? ขอบคุณ

นี่ไม่ใช่คำตอบสำหรับคำถามที่ถามและเป็นเช่นนี้ในความคิดเห็นมากกว่าคำตอบ
ThP

คำตอบ:


62

ผู้เขียนทั้ง SIFT และ SURF ต้องการค่าธรรมเนียมใบอนุญาตสำหรับการใช้อัลกอริทึมดั้งเดิมของพวกเขา

ฉันได้ทำการวิจัยเกี่ยวกับสถานการณ์และนี่เป็นทางเลือกที่เป็นไปได้:

เครื่องตรวจจับจุดสำคัญ:

  • เครื่องตรวจจับมุมของ Harris
  • Harris-Laplace - เครื่องตรวจจับแฮร์ริสรุ่นมาตราส่วน (มีเครื่องลอกเลียนแบบยังคงมีอยู่นำเสนอโดย Mikolajczyk และ Schmidt และฉันเชื่อว่าไม่มีสิทธิบัตร)
  • Multi-Scale Oriented patches (MOPs) - แข็งแรงพอที่ได้รับการจดสิทธิบัตรเครื่องตรวจจับนั้นเป็น multi-scale Harris ดังนั้นจะไม่มีปัญหากับสิ่งนั้น (ตัวบ่งชี้คือแพทช์ภาพที่แปลงเวฟเล็ต 2D)
  • ตัวกรอง LoG - เนื่องจาก SIFT ที่จดสิทธิบัตรใช้การประมาณ DoG (ความแตกต่างของ Gaussian) ของ LoG (Laplacian ของ Gaussian) เพื่อ จำกัด วงจุดสนใจในวง จำกัด LoG เพียงอย่างเดียวสามารถใช้ในการแก้ไขอัลกอริธึมที่ปลอดสิทธิบัตร
  • FAST
  • บริสก์ (รวมถึงตัวบ่งชี้)
  • ORB (รวมถึง descriptor)
  • KAZE - ใช้งานได้ฟรี M-SURF descriptor (แก้ไขสำหรับพื้นที่ไม่เชิงเส้นของ KAZE) มีประสิทธิภาพเหนือกว่า SIFT และ SURF
  • A-KAZE - เวอร์ชันเร่งของ KAZE อิสระในการใช้ M-LDB descriptor (แก้ไข fast binary descriptor)

ตัวบ่งชี้ Keypoint:

  • การไล่ระดับสีปกติ - วิธีแก้ปัญหาที่ง่ายและใช้งานได้
  • PCA แปลงภาพแพทช์
  • แพทช์ภาพที่แปลงเวฟเล็ต - ให้รายละเอียดในกระดาษ MOPs แต่สามารถนำไปใช้ต่างกันเพื่อหลีกเลี่ยงปัญหาสิทธิบัตร (เช่นการใช้เวฟเล็ตพื้นฐานที่แตกต่างกันหรือการจัดทำดัชนีที่แตกต่างกัน)
  • ฮิสโตแกรมของการไล่ระดับสีเชิง
  • GLOH
  • เลช
  • คล่อง
  • ลูกโลก
  • FREAK
  • LDB

โปรดทราบว่าหากคุณกำหนดการวางแนวไปยังจุดสนใจและหมุนแพทช์ภาพตามนั้นคุณจะได้รับค่าคงที่แบบหมุนได้ฟรี แม้แต่มุมของแฮร์ริสก็ไม่เปลี่ยนแปลงและผู้บรรยายอาจทำได้เช่นกัน

วิธีแก้ปัญหาที่สมบูรณ์กว่านั้นเกิดขึ้นใน Hugin เพราะพวกเขายังพยายามที่จะใช้เครื่องตรวจจับจุดสนใจที่ปลอดสิทธิบัตร


ขอบคุณสำหรับคำตอบ. พวกเขาต้องการค่าลิขสิทธิ์หรือไม่
Andrey Rubshtein

1
ใช่ทั้งคู่ต้องการค่าลิขสิทธิ์ ราคาจะต้องมีการเจรจาต่อรอง แต่จะไปประมาณ 20.000 USD / ปีและค่าลิขสิทธิ์ประมาณ 5% ขณะนี้ MOP ได้รับการจดสิทธิบัตรโดย Microsoft (ฉันได้ติดต่อ Richard Szeliski เพื่อขอข้อมูลเพิ่มเติมเกี่ยวกับสิทธิบัตร)
Libor

1
สิทธิบัตรเป็นสาธารณะในหลักการดังนั้นหากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ดูมันขึ้นในฐานข้อมูลสิทธิบัตร (เช่นยุโรปฐานข้อมูล .
Geerten

มีผู้อธิบายประเด็นสำคัญเหล่านี้ที่ไม่แปรเปลี่ยนขนาดหรือไม่?
Diego

1
Harris-Laplace มีขนาดคงที่ หรือคุณสามารถทำให้เครื่องตรวจจับขนาดอื่นไม่แปรเปลี่ยนได้โดยการกรอง maxima space สเกลสูงสุดและคำนวณสเกลคุณลักษณะสำหรับแต่ละจุดที่ตรวจพบ
Libor

26

มีวิธีการที่ค่อนข้างใหม่คุณอาจต้องการตรวจสอบ: BRISK , Binary Robust Invalidant Scalable Keypoints:

ในบทความนี้เราขอนำเสนอ BRISK ซึ่งเป็นวิธีการใหม่สำหรับการตรวจจับจุดสำคัญรายละเอียดและการจับคู่ การประเมินที่ครอบคลุมเกี่ยวกับชุดข้อมูลมาตรฐานแสดงให้เห็นถึงประสิทธิภาพที่ปรับได้และคุณภาพสูงของ BRISK เช่นเดียวกับอัลกอริธึมที่ล้ำสมัยแม้ว่าจะมีค่าใช้จ่ายในการคำนวณที่ต่ำกว่ามาก กุญแจสู่ความเร็วนั้นอยู่ในการประยุกต์ใช้เครื่องตรวจจับแบบ FAST บนสเกลพื้นที่ร่วมกับการประกอบของตัวอธิบายบิตสตริงจากการเปรียบเทียบความเข้มที่ดึงมาโดยการสุ่มตัวอย่างเฉพาะของแต่ละจุดสำคัญของละแวกนั้น

มันเป็นสิทธิบัตรฟรีและใช้งานฟรี (ตามที่ผู้เขียนบอกอัลกอริทึม)


12

อย่าไว้ใจใครเลยที่นี่คุยกับทนายความ โลกทางกฎหมายนั้นแตกต่างจากเราอย่างละเอียดถ้าฉันอาจจะพูดว่า ขึ้นอยู่กับว่าคุณต้องการทำอะไร (และที่ไหน ฯลฯ ) อาจมีวิธีแก้ปัญหาที่คุณสามารถใช้ SURF หรือ SIFT ฉันรู้สึกประหลาดใจในอดีตที่ดูเหมือนว่าใบอนุญาตที่แข็งแกร่งจะสามารถเอาชนะได้


8

ฉันอยากดู KAZE / AKAZE ซึ่งทำงานได้ดีพอ ๆ กันกับการเร่งความเร็วอย่างมีนัยสำคัญ กรณีความผิดปกติจะได้รับการยอมรับ OpenCV เมื่อเร็ว ๆ นี้ได้รับการดำเนินการผ่าน GSoC 2014 คุณสามารถค้นหาได้ที่นี่ กวดวิชา OpenCV มันยังเป็นปัจจุบันที่นี่


ขอบคุณ KAZE ดูมีแนวโน้ม - มีประสิทธิภาพโดยรวมที่ดีกว่า SIFT / SURF แม้ว่าการคำนวณมาตราส่วนแบบไม่เชิงเส้นอาจทำได้ยาก แต่ก็คุ้มค่ากับความพยายาม
Libor
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.