คำอธิบายคุณลักษณะการปรับขนาดและการหมุน


16

คุณสามารถแสดงคำอธิบายคุณลักษณะของมาตราส่วนและตัวชี้การหมุนแบบคงที่เพื่อใช้ในการตรวจจับคุณสมบัติหรือไม่

แอปพลิเคชั่นนี้ใช้สำหรับตรวจจับรถยนต์และมนุษย์ในวิดีโอที่ถ่ายโดย UAV โดยใช้ตัวจําแนกหลายคลาส

จนถึงตอนนี้ฉันได้ดู SIFT และ MSER (ซึ่งเลียนแบบค่าคงที่) ฉันยังดูที่ LESH, LESH ขึ้นอยู่กับแบบจำลองพลังงานในท้องที่ แต่คำนวณด้วยวิธีที่ไม่แปรเปลี่ยนแบบหมุนได้ฉันพยายามคิดหาวิธีที่จะใช้ประโยชน์จากพลังงานในท้องถิ่นเพื่อสร้างค่าคงที่แบบหมุนได้ คำอธิบายคุณลักษณะฉันอ่านที่นี่มีทางเลือกฟรีอะไรบ้างสำหรับ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้ ว่า "ถ้าคุณกำหนดทิศทางไปยังจุดสนใจและหมุนแผ่นภาพตามนั้นคุณจะได้ค่าความแปรปรวนแบบหมุนได้ฟรี" แต่ไม่รู้ว่าสิ่งนี้จะช่วยบรรเทาได้อย่างไรหรือฉันจะนำสิ่งนี้ไปใช้กับปัญหาของฉันได้อย่างไร ชื่นชมขอบคุณ


ใช้ ORB (Oriented FAST และ BRIEF แบบหมุน) จากไลบรารี OpenCV
Harsh Wardhan

คำตอบ:


9

หากคุณเลือกใช้ SIFT / SURF แล้วคำถามที่คุณเชื่อมโยงจะให้คำตอบที่ดีมาก

มีคำถามอีกสองข้อที่ฉันสามารถอ่านได้:

  • "ฉันจะสร้างตัวอธิบายคุณลักษณะที่มีประโยชน์ (เช่นการหมุนไม่แปร) ได้อย่างไร"
  • "เกี่ยวกับคำแถลงจากคำถามที่เชื่อมโยงเขาจะบรรลุความแปรปรวนแบบอิสระได้อย่างไร"

อธิบายลักษณะอาคาร

นี่คือหัวข้อการวิจัยที่ถูกต้อง คำอธิบายคุณลักษณะที่ดีไม่ใช่สิ่งที่ทุกคนสามารถสร้างได้ในช่วงบ่าย ผู้คนเผยแพร่บทความเมื่อประสบความสำเร็จในการสร้างแบบจำลองตัวบอกคุณสมบัติพร้อมคุณสมบัติที่พึงประสงค์ นี่คือเหตุผลว่าปัจจุบันมีเพียงไม่กี่คนของรัฐของศิลปะอธิบายถูกนำมาใช้และที่ยังเป็นสิ่งที่ผมแนะนำให้คุณต้องทำ: หาอธิบายคุณลักษณะที่ดีสำหรับความต้องการของคุณ

บรรลุค่าคงที่การหมุน "ฟรี"

คุณสามารถกำหนดการไล่ระดับสีที่โดดเด่นหรือการวางแนวที่แพทช์ภาพ (พื้นที่คุณสมบัติของคุณ) จากนั้นหมุนแพทช์ภาพเพื่อให้การไล่ระดับสีอยู่ในทิศทางเดียวกันเสมอเช่น (ขึ้นไป) เช่นถ้าคุณมี a และรูปภาพ, การไล่ระดับสีที่โดดเด่นของพวกเขาจะชี้ไปทางซ้าย ( - 90 ) และขวา ( 90 ) ตามลำดับและเมื่อคุณหมุนพวกเขาด้วยจำนวนนี้คุณจะได้ภาพเดียวกัน0|black->gray->white||white->gray->black|9090

วิธีนี้คุณจะคำนวณ descriptor บนแพทช์ภาพด้วยการวางแนวที่เหมือนกัน (แพทช์ที่หมุน) เสมอและทำให้คุณได้ค่าความแปรปรวนของการหมุน


4

อีกวิธีหนึ่งในการรับค่าคงที่แบบหมุนได้ฟรีคือเลือกวัตถุที่ไม่เปลี่ยนแปลงแบบหมุนได้ ยกตัวอย่างเช่นวงกลมหรือแหวนนั้นไม่แปรเปลี่ยนไปตามการหมุน

ตัวแยกคุณลักษณะ : เรียกใช้การตรวจจับขอบ สำหรับพื้นที่ใกล้เคียงของNxNพิกเซลให้คำนวณทิศทางของขอบและขนาดฮิสโตแกรม 2 มิติ ค้นหาทุกจุดที่มีขนาดรวมสูงและการแพร่กระจายมุมสูง ลบจุดทั้งหมดที่ไม่มีสมมาตรรัศมี

Feature descriptor : ค้นหาศูนย์กลางของวัตถุทรงกลมแต่ละอัน เนื่องจากวัตถุเป็นแบบวงกลมจึงไม่มีมุมไล่ระดับสีที่โดดเด่น ทุกมุมเท่ากัน ดังนั้นโปรไฟล์เรเดียล (ผลรวมของค่าพิกเซลในพิกัดเชิงขั้ว) จึงเป็นตัวบ่งชี้มุมคงที่


โดยวิธีการที่เป็นหนึ่งในเหตุผลที่ fiducials ผลิตเป็นวงกลมบนแผงวงจรไฟฟ้า:

ป้อนคำอธิบายรูปภาพที่นี่


เรากำลังพูดถึง Keypoint (คุณลักษณะ) อธิบาย หากเรากำลังพูดถึงคุณสมบัติ (จุดสนใจ)การตรวจสอบแพตช์แบบวงกลมอาจมีประโยชน์ - พวกมันเป็นค่าคงที่ในการหมุนร่วมกับคำอธิบายทุกตัว แต่บ่งคำนวณในแพทช์วงกลมไม่ได้ - วงกลมสีขาวที่มีขนาดเส้นผ่าศูนย์กลางแนวนอนในสีดำและมีแนวหนึ่งจะผลิตอธิบายที่แตกต่างกันมากถ้าวิธีการคง rotationally ไม่ได้ใช้
เพเนโลพี

@ พัฒนาแล้วทำไมล่ะ พิจารณา descriptor ต่อไปนี้ - รูปขนาดย่อของแพทช์และคุณเปรียบเทียบกับ descriptor อื่นที่มีความสัมพันธ์ข้ามแบบปกติ คุณไม่สามารถเข้าใจผิดกับวัตถุอื่นด้วยวิธีนี้
Andrey Rubshtein

ขออภัยฉันไม่เข้าใจความหมายของ "รูปย่อของแพตช์" ที่คุณสามารถอธิบายได้? และคำอธิบาย: แพทช์ corss-correlation ปกติของคุณคือสิ่งที่ทำให้ค่าคงที่แบบหมุนไม่ได้ความจริงที่ว่าแพทช์ของคุณเป็นวงแหวนหรือวงกลม
เพเนโลพี

@ พัฒนาฉันเดาว่าตอนนี้ฉันยังไม่ชัดเจนพอ ฉันจะพยายามขยายออกในวันพรุ่งนี้ ขอบคุณสำหรับความคิดเห็นของคุณ
Andrey Rubshtein

มองไปข้างหน้า :)
penelope

1

ฉันอยากดู KAZE / AKAZE ซึ่งทำงานได้ดีพอ ๆ กันกับการเร่งความเร็วที่สำคัญ กรณีความผิดปกติจะได้รับการยอมรับ OpenCV เมื่อเร็ว ๆ นี้ได้รับการดำเนินการผ่าน GSoC 2014 คุณสามารถค้นหาได้ที่นี่


1

หากคุณทำการแมปตัวแก้ไขท้องถิ่นรอบ ๆ จุดคุณลักษณะเพื่อบันทึกพิกัดเชิงขั้ว (พร้อมจุดกำเนิดในจุดที่น่าสนใจ) การเปลี่ยนสเกลจะสอดคล้องกับการแปลตามแกนล็อก - รัศมีในขณะที่การหมุนสอดคล้องกับการแปล ตามแนวแกนเชิงมุม หากคุณคำนวณการแปลงฟูริเยร์แบบสองมิติการแปลในทิศทางเรเดียลและเชิงมุมจะเปลี่ยนเฟสในโดเมนความถี่ หากคุณคำนวณค่าสัมบูรณ์ของการแปลงฟูริเยร์เฟสจะหายไปอย่างสมบูรณ์และปรับการเปลี่ยนแปลงและการหมุนของแพตช์ภาพดั้งเดิมจนมองไม่เห็น ดังนั้นค่าสัมบูรณ์ของการแปลงฟูริเยร์ 2D ของภาพในพิกัด log – poolar จึงเป็นตัวบ่งชี้คุณลักษณะของคุณ

อย่างน้อยก็ในทางทฤษฎี ในทางปฏิบัติคุณต้อง จำกัด การขยายรัศมีของแพทช์ของคุณ ซึ่งหมายความว่าคุณต้องตัดส่วนใหญ่ของข้อมูลของคุณก่อนที่จะคำนวณการแปลงฟูริเยร์ (ซึ่งจริงๆแล้วเป็นอนุกรมฟูริเยร์) ดังนั้นการแปลไปตามทิศทางล็อก - เรเดียนในบันทึกพิกัดเชิงขั้วไม่ตรงกับ การเปลี่ยนเฟสในโดเมนความถี่อีกต่อไปดังนั้นวิธีนี้จึงไม่แปรขนาดอย่างสมบูรณ์ ฉันสงสัยว่าถ้าคุณใช้ฟังก์ชั่นหน้าต่างบางอย่าง- โดยไม่ต่อเนื่อง - บนพิกัด log - รัศมีและคูณด้วยความเข้มของสีปัญหานี้จะลดลงบ้าง

อย่างไรก็ตามตัวบ่งชี้คุณลักษณะมันควรจะยังคงหมุนอย่างสมบูรณ์

การอ้างอิง: ค่าความแปรปรวนแบบไม่มีการเลือกมาตราส่วน


0

นอกจากนี้คุณยังสามารถตรวจสอบFASTและเร็ว


เท่าที่ฉันค้นหาแล้ว FAST เป็นเพียงเครื่องมือตรวจจับที่ใช้ร่วมกับชุดคำอธิบายที่แตกต่างกันมากมาย และ FAST และ BRISK ได้ถูกกล่าวถึงแล้วในคำถามที่ตัว OP เองได้เชื่อมโยงดังนั้นฉันคิดว่าเขามีข้อมูลเกี่ยวกับการดำรงอยู่ของวิธีการเหล่านี้แล้ว
เพเนโลพี
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.