คำว่า "scale-invariant" หมายถึงสิ่งต่อไปนี้ สมมติว่าคุณมีภาพผมและคุณได้ตรวจพบคุณลักษณะ (aka จุดที่น่าสนใจ) ฉในสถานที่บางส่วน(x, y)และในบางระดับขนาดs ตอนนี้สมมติว่าคุณมีภาพที่ฉัน 'ซึ่งเป็นรุ่นที่ปรับขนาดของฉัน (ตัวอย่างเช่นลดขนาดลง) แล้วถ้าตรวจจับคุณลักษณะของคุณมีขนาดคงที่คุณควรจะสามารถที่จะตรวจสอบคุณลักษณะที่สอดคล้องF 'ในฉัน'ที่สถานที่ที่สอดคล้องกัน(x', y ')และสอดคล้องกันขนาดs'ที่(x, y, s)และ(x ', y', s ') เกี่ยวข้องกับการแปลงสเกลที่เหมาะสม
กล่าวอีกนัยหนึ่งหากเครื่องตรวจจับค่าคงที่ของคุณตรวจพบจุดคุณสมบัติที่สอดคล้องกับใบหน้าของใครบางคนแล้วคุณซูมเข้าหรือออกด้วยกล้องของคุณในฉากเดียวกันคุณควรตรวจจับจุดคุณลักษณะบนใบหน้านั้น
แน่นอนคุณจะต้องมี "ตัวบอกคุณสมบัติ" ซึ่งจะช่วยให้คุณจับคู่คุณสมบัติทั้งสองซึ่งเป็นสิ่งที่ SIFT ให้คุณ
ดังนั้นความเสี่ยงที่จะทำให้คุณสับสนต่อไปมีสองสิ่งที่ไม่แปรปรวนที่นี่ หนึ่งคือเครื่องมือตรวจจับจุดสนใจของ DoG ซึ่งเป็นมาตราส่วนที่ไม่เปลี่ยนแปลงเนื่องจากตรวจจับคุณลักษณะของรูปภาพ (blobs) ชนิดใดชนิดหนึ่งโดยไม่คำนึงถึงระดับของพวกเขา กล่าวอีกนัยหนึ่งเครื่องมือตรวจจับ DoG จะตรวจจับรอยเปื้อนในทุกขนาด สิ่งที่ไม่แปรเปลี่ยนขนาดอื่น ๆ คือตัวบอกคุณลักษณะซึ่งเป็นฮิสโตแกรมของทิศทางการไล่ระดับสีซึ่งยังคงคล้ายกับคุณสมบัติภาพเดียวกันมากขึ้นหรือน้อยลงแม้จะเปลี่ยนขนาด
อย่างไรก็ตามความแตกต่างของ Gaussians ถูกใช้ที่นี่เป็นค่าประมาณสำหรับตัวกรอง Laplacian-of-Gaussians