คำถามติดแท็ก sift

4
อะไรคือทางเลือกฟรีของ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้?
เท่าที่ฉันเข้าใจทั้ง SURF และ SIFT นั้นได้รับการคุ้มครองสิทธิบัตร มีวิธีการอื่นใดที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้อย่างอิสระหรือไม่? สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตรวจสอบสิทธิบัตร: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html

5
คำอธิบายคุณลักษณะการปรับขนาดและการหมุน
คุณสามารถแสดงคำอธิบายคุณลักษณะของมาตราส่วนและตัวชี้การหมุนแบบคงที่เพื่อใช้ในการตรวจจับคุณสมบัติหรือไม่ แอปพลิเคชั่นนี้ใช้สำหรับตรวจจับรถยนต์และมนุษย์ในวิดีโอที่ถ่ายโดย UAV โดยใช้ตัวจําแนกหลายคลาส จนถึงตอนนี้ฉันได้ดู SIFT และ MSER (ซึ่งเลียนแบบค่าคงที่) ฉันยังดูที่ LESH, LESH ขึ้นอยู่กับแบบจำลองพลังงานในท้องที่ แต่คำนวณด้วยวิธีที่ไม่แปรเปลี่ยนแบบหมุนได้ฉันพยายามคิดหาวิธีที่จะใช้ประโยชน์จากพลังงานในท้องถิ่นเพื่อสร้างค่าคงที่แบบหมุนได้ คำอธิบายคุณลักษณะฉันอ่านที่นี่มีทางเลือกฟรีอะไรบ้างสำหรับ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้ ว่า "ถ้าคุณกำหนดทิศทางไปยังจุดสนใจและหมุนแผ่นภาพตามนั้นคุณจะได้ค่าความแปรปรวนแบบหมุนได้ฟรี" แต่ไม่รู้ว่าสิ่งนี้จะช่วยบรรเทาได้อย่างไรหรือฉันจะนำสิ่งนี้ไปใช้กับปัญหาของฉันได้อย่างไร ชื่นชมขอบคุณ

2
ทำไมความแตกต่างของ gaussians มาตราส่วนสเกลอวกาศคงที่?
ฉันจะใช้อัลกอริทึมการแปลงคุณสมบัติไม่แปรเปลี่ยนเป็นตัวอย่างที่นี่ SIFT สร้างพื้นที่ขนาดตามการกรองแบบเกาส์ปรับขนาดของภาพแล้วคำนวณความแตกต่างของ Gaussian เพื่อตรวจหาจุดสนใจที่อาจเกิดขึ้น คะแนนเหล่านี้ถูกกำหนดให้เป็น minima ท้องถิ่นและ maxima ข้ามความแตกต่างของ gaussians มันก็อ้างว่าวิธีนี้เป็นขนาดคงที่ (ในหมู่ invariances งงอื่น ๆ ) ทำไมนี้ มันไม่ชัดเจนสำหรับฉันว่าทำไมในกรณีนี้

3
ร่อนเป็นวิธีที่ดีในการแยกฟีเจอร์จากรูปภาพหรือไม่?
ฉันกำลังพยายามดึงคุณสมบัติต่าง ๆ จากรูปภาพ แต่ฉันไม่สามารถรับคะแนนที่ต้องการแยกได้และทำให้รูปภาพของฉันไม่สามารถจับคู่กับแม่แบบได้ มีจุดตรวจที่ฉันต้องทำก่อนที่จะใช้ SIFT กับภาพของฉันเพื่อให้ได้ผลลัพธ์ที่ดีหรือไม่? ตัวอย่างเช่นภาพเทมเพลตคือ; รูปภาพเป้าหมาย

1
การจำแนกภาพโดยใช้คุณสมบัติ SIFT และ SVM
ฉันหวังว่าใครบางคนสามารถอธิบายวิธีการใช้ถุงรูปแบบคำในการจำแนกภาพโดยใช้คุณสมบัติ SIFT / SURF / ORB และเครื่องเวกเตอร์สนับสนุน ในขณะนี้ฉันสามารถคำนวณเวกเตอร์ฟีเจอร์ SIFT สำหรับรูปภาพและนำ SVM มาใช้อย่างไรก็ตามฉันพบว่ามันยากที่จะเข้าใจวรรณกรรมเกี่ยวกับวิธีใช้รูปแบบคำในกระเป๋าเพื่อ 'vector quantize' คุณสมบัติ SIFT และสร้างฮิสโตแกรมที่ให้ เวกเตอร์ขนาดคงที่สามารถใช้ในการฝึกอบรมและทดสอบ SVM ยินดีต้อนรับทุกลิงก์ไปยังบทเรียนหรือวรรณกรรมในหัวข้อ

3
ตรวจจับวัตถุที่ทำจากแก้ว
ฉันถูกส่งมาที่นี่จากคำถามนี้ใน stackoverflowโปรดยกโทษให้ฉันหากคำถามนั้นเจาะจงเกินไปและไม่ใช่ในลักษณะที่นี่ :) ภารกิจคือการหาแก้วที่มีของเหลวเฉพาะในนั้น ให้ฉันแสดงภาพแล้วอธิบายสิ่งที่ฉันพยายามบรรลุและวิธีที่ฉันพยายามบรรลุจนถึงในคำอธิบายด้านล่างภาพ รูปภาพ : (ดูเหมือนว่าฉันต้องการอย่างน้อย 10 ชื่อเสียงในการโพสต์รูปภาพและลิงก์ดังนั้นลิงก์จะต้องทำ :( มิฉะนั้นคุณสามารถดูคำถามล้นสแต็คได้) คำอธิบายโดยละเอียด : ฉันพยายามใช้อัลกอริทึมที่จะตรวจจับแก้วที่มีรูปร่างเฉพาะใน opencv (แก้วอาจถูกเปลี่ยนโดยมุมถ่าย / ระยะทางของกล้องที่แตกต่างกัน) นอกจากนี้ยังจะมีแว่นตาอื่น ๆ ของรูปร่างอื่น ๆ แก้วที่ฉันกำลังค้นหาจะเต็มไปด้วยของเหลวสีบางอย่างที่จะแยกความแตกต่างจากแก้วที่มีสีอื่น ถึงตอนนี้ฉันได้ลองใช้ตัวแยกฟีเจอร์ SIFT เพื่อพยายามค้นหาฟีเจอร์บางอย่างในกระจกแล้วจับคู่พวกมันกับรูปอื่น ๆ ที่มีกระจกอยู่ วิธีการนี้ใช้งานได้เฉพาะในสภาพที่เฉพาะเจาะจงซึ่งฉันจะมีกระจกในตำแหน่งที่เฉพาะเจาะจงมากและพื้นหลังจะคล้ายกับภาพการเรียนรู้ ปัญหาก็คือว่าแก้วเป็นวัตถุ 3 มิติและฉันไม่รู้วิธีแยกฟีเจอร์จากสิ่งนั้น (อาจมีภาพถ่ายหลายภาพจากมุมที่แตกต่างกันที่เชื่อมโยงอย่างใด?) ตอนนี้ฉันไม่รู้ว่าฉันจะใช้วิธีการอื่นได้อย่างไร ฉันได้พบเบาะแสบางอย่างเกี่ยวกับเรื่องนี้ (ที่นี่/programming/10168686/algorithm-improvement-for-coca-cola-cola-can-shape-recognition#answer-10219338 ) แต่ดูเหมือนว่าลิงก์จะใช้งานไม่ได้ ปัญหาอีกประการหนึ่งก็คือการตรวจสอบ "ระดับความว่างเปล่า" ที่แตกต่างกันในแก้วนั้น แต่ฉันก็ไม่สามารถที่จะค้นหาตัวกระจกได้อย่างถูกต้อง คำแนะนำของคุณเกี่ยวกับวิธีการในงานนี้คืออะไร? จะเป็นการดีกว่าถ้าใช้วิธีอื่นเพื่อค้นหาคุณลักษณะวัตถุ 3 มิติในพื้นที่ หรือจะเป็นการดีกว่าถ้าใช้วิธีอื่นทั้งหมด? ฉันเคยได้ยินเกี่ยวกับอัลกอริทึม "เรียนรู้" …

1
เรื่องราวเบื้องหลังของ SIFT descriptor คืออะไร
ต่อไปนี้มาจากกระดาษ Lowe 2004 ( http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf ) วิธีการหนึ่งที่เห็นได้ชัดคือการทดสอบความเข้มของภาพในพื้นที่รอบ ๆ จุดสำคัญในระดับที่เหมาะสม อย่างไรก็ตามความสัมพันธ์อย่างง่ายของแพทช์ภาพมีความไวสูงต่อการเปลี่ยนแปลงที่ทำให้เกิดการลงทะเบียนตัวอย่างผิดพลาดเช่นการเปลี่ยนมุมมอง 3 มิติหรือมุมมอง 3D หรือการเปลี่ยนรูปแบบไม่เข้มงวด Edelman, Intrator และ Poggio (1997) แสดงให้เห็นถึงวิธีการที่ดีกว่า การนำเสนอที่เสนอของพวกเขาขึ้นอยู่กับรูปแบบของการมองเห็นทางชีวภาพโดยเฉพาะอย่างยิ่งเซลล์ประสาทที่ซับซ้อนในเยื่อหุ้มสมองภาพหลักเซลล์ประสาทที่ซับซ้อนเหล่านี้ตอบสนองต่อการไล่ระดับสีในทิศทางที่เฉพาะเจาะจงและความถี่เชิงพื้นที่ แต่ตำแหน่งของการไล่ระดับสีบนเรตินาได้รับอนุญาตให้เลื่อนไปที่ช่องรับแสงขนาดเล็กแทนที่จะเป็นหน่วงอย่างแม่นยำ Edelman และคณะ ตั้งสมมติฐานว่าหน้าที่ของเซลล์ประสาทที่ซับซ้อนเหล่านี้คือการอนุญาตให้จับคู่และรับรู้วัตถุ 3 มิติจากมุมมองที่หลากหลาย ฉันกำลังพยายามทำความเข้าใจกับ descriptor ของ SIFT ฉันเข้าใจขั้นตอนก่อนหน้า (เครื่องตรวจจับจุดสำคัญ) ฉันไม่รู้ว่าทำไมมันถึงถูกใช้อย่างนั้น ฉันอยากรู้เรื่องเบื้องหลัง
9 sift 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.