ทำไมความแตกต่างของ gaussians มาตราส่วนสเกลอวกาศคงที่?


15

ฉันจะใช้อัลกอริทึมการแปลงคุณสมบัติไม่แปรเปลี่ยนเป็นตัวอย่างที่นี่ SIFT สร้างพื้นที่ขนาดตามการกรองแบบเกาส์ปรับขนาดของภาพแล้วคำนวณความแตกต่างของ Gaussian เพื่อตรวจหาจุดสนใจที่อาจเกิดขึ้น คะแนนเหล่านี้ถูกกำหนดให้เป็น minima ท้องถิ่นและ maxima ข้ามความแตกต่างของ gaussians

มันก็อ้างว่าวิธีนี้เป็นขนาดคงที่ (ในหมู่ invariances งงอื่น ๆ ) ทำไมนี้ มันไม่ชัดเจนสำหรับฉันว่าทำไมในกรณีนี้


ไม่ทราบว่าเป็นร่อนพบนี้ในวิกิพีเดียen.wikipedia.org/wiki/Scale-invariant_feature_transform "วิธีการของ Lowe สำหรับการสร้างคุณลักษณะของรูปภาพแปลงภาพเป็นชุดเวกเตอร์คุณลักษณะขนาดใหญ่ซึ่งแต่ละอันไม่แปรเปลี่ยนไปจากการแปลภาพการปรับขนาดและการหมุน นั่นคือคำอธิบายหรือไม่
niaren

ใช่นั่นคือสิ่งที่ฉันพูดถึง
น้ำ

SIFT ใช้ทฤษฎีสเกลอวกาศ อย่างไรก็ตามฉันไม่เข้าใจสิ่งที่มีความหมายโดย invariancy "มาตราส่วน" ในทฤษฎีที่ คุณสามารถลองอ่านเอกสารของ Tony Lindeberg เกี่ยวกับเรื่องนี้: csc.kth.se/~tony/earlyvision.html
maximus

คำตอบ:


7

คำว่า "scale-invariant" หมายถึงสิ่งต่อไปนี้ สมมติว่าคุณมีภาพผมและคุณได้ตรวจพบคุณลักษณะ (aka จุดที่น่าสนใจ) ในสถานที่บางส่วน(x, y)และในบางระดับขนาดs ตอนนี้สมมติว่าคุณมีภาพที่ฉัน 'ซึ่งเป็นรุ่นที่ปรับขนาดของฉัน (ตัวอย่างเช่นลดขนาดลง) แล้วถ้าตรวจจับคุณลักษณะของคุณมีขนาดคงที่คุณควรจะสามารถที่จะตรวจสอบคุณลักษณะที่สอดคล้องF 'ในฉัน'ที่สถานที่ที่สอดคล้องกัน(x', y ')และสอดคล้องกันขนาดs'ที่(x, y, s)และ(x ', y', s ') เกี่ยวข้องกับการแปลงสเกลที่เหมาะสม

กล่าวอีกนัยหนึ่งหากเครื่องตรวจจับค่าคงที่ของคุณตรวจพบจุดคุณสมบัติที่สอดคล้องกับใบหน้าของใครบางคนแล้วคุณซูมเข้าหรือออกด้วยกล้องของคุณในฉากเดียวกันคุณควรตรวจจับจุดคุณลักษณะบนใบหน้านั้น

แน่นอนคุณจะต้องมี "ตัวบอกคุณสมบัติ" ซึ่งจะช่วยให้คุณจับคู่คุณสมบัติทั้งสองซึ่งเป็นสิ่งที่ SIFT ให้คุณ

ดังนั้นความเสี่ยงที่จะทำให้คุณสับสนต่อไปมีสองสิ่งที่ไม่แปรปรวนที่นี่ หนึ่งคือเครื่องมือตรวจจับจุดสนใจของ DoG ซึ่งเป็นมาตราส่วนที่ไม่เปลี่ยนแปลงเนื่องจากตรวจจับคุณลักษณะของรูปภาพ (blobs) ชนิดใดชนิดหนึ่งโดยไม่คำนึงถึงระดับของพวกเขา กล่าวอีกนัยหนึ่งเครื่องมือตรวจจับ DoG จะตรวจจับรอยเปื้อนในทุกขนาด สิ่งที่ไม่แปรเปลี่ยนขนาดอื่น ๆ คือตัวบอกคุณลักษณะซึ่งเป็นฮิสโตแกรมของทิศทางการไล่ระดับสีซึ่งยังคงคล้ายกับคุณสมบัติภาพเดียวกันมากขึ้นหรือน้อยลงแม้จะเปลี่ยนขนาด

อย่างไรก็ตามความแตกต่างของ Gaussians ถูกใช้ที่นี่เป็นค่าประมาณสำหรับตัวกรอง Laplacian-of-Gaussians


คุณได้รับข้อมูลบางอย่างจากทฤษฎีสเกลอวกาศ คุณช่วยอธิบายคำอธิบายของสิ่งที่เกิดขึ้นได้จริงเมื่อเปรียบเทียบกับสัญญาณสองสัญญาณโดยใช้ทฤษฎีสเกลอวกาศ Lindeberg ในเอกสารของเขา: csc.kth.se/~tony/earlyvision.htmlทำตัวอย่างบางส่วนของการตรวจจับของ blobs ฯลฯ การใช้อนุพันธ์ของพารามิเตอร์ขนาดช่วยในการแปรผันของสเกลได้อย่างไร
maximus

คุณถูก. ฉันแค่พยายามอธิบายสัญชาตญาณตามทฤษฎีอวกาศ - อวกาศ สิ่งที่คุณถามควรเป็นคำถามแยกต่างหาก :) ฉันคิดว่าสิ่งที่คุณกำลังพูดถึงคืออนุพันธ์ที่ถูกนำมาใช้ในระดับที่แตกต่างกันจะต้องได้มาตรฐานอย่างเหมาะสม เมื่อคุณไปที่เครื่องชั่งที่หยาบกว่านี้สัญญาณจะถูกปรับให้เรียบเพื่อให้แอมพลิจูดลดลง นั่นหมายความว่าขนาดของอนุพันธ์ลดลงเช่นกัน ดังนั้นในการเปรียบเทียบการตอบสนองต่ออนุพันธ์ข้ามสเกลคุณจำเป็นต้องคูณพวกเขาโดย
Dima

พลังที่เหมาะสมของซิกมา: อนุพันธ์อันดับหนึ่งโดยซิกมา, อันดับที่สองโดยซิกม่า ^ 2, ฯลฯ
Dima

@ maximus, อุ๊ปส์ฉันไปที่ @ :)
Dima

ขอบคุณสำหรับการตอบกลับของคุณ! มันช่วยฉันได้ แต่ยังมีคำถามบางคำถามที่ฉันถามเป็นคำถามที่แตกต่างกันที่นี่: dsp.stackexchange.com/questions/570/…
maximus

5

ความแตกต่างของ gaussians นั้นไม่แปรปรวน SIFT (ไปยังระดับที่ จำกัด ) ไม่เปลี่ยนแปลงเนื่องจากมองหา DoG extrema ข้ามสเกลพื้นที่ - นั่นคือการหาสเกลด้วย DoG Extremal ทั้งเชิงพื้นที่และค่อนข้างใกล้เคียงกับสเกล เนื่องจากเอาต์พุต DoG ได้รับสำหรับมาตราส่วนคงที่ (ซึ่งไม่ใช่ฟังก์ชันของอินพุตมาตราส่วน) ผลลัพธ์จึงเป็นมาตราส่วนอิสระนั่นคือมาตราส่วนไม่แปรเปลี่ยน


1
ขวา. แต่มันก็แค่มองหา extrema ตามเกล็ดใกล้เคียง นี่ไม่ใช่เครื่องชั่งทั้งหมดยกเว้นว่าฉันเข้าใจผิด แม้ว่าจะเป็นเครื่องชั่งทุกเครื่อง แต่ก็ยังไม่ชัดเจนว่าเครื่องชั่งอิสระ
น้ำ

@ น้ำนั่นถูกต้องแล้ว คุณไม่ต้องการความคลั่งไคล้ในเครื่องชั่งทั้งหมดคุณต้องการ extrema ท้องถิ่น สิ่งนี้ช่วยให้คุณตรวจจับสิ่งก่อสร้างที่ซ้อนกันเช่นวงกลมสีดำขนาดเล็กภายในวงกลมสว่างขนาดใหญ่บนพื้นหลังสีเทา
Dima

มีการใช้ DoG แทน LoG เพราะเร็วกว่าในการคำนวณ DoG
maximus
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.