ความหมายของสูตรนั้นค่อนข้างง่ายจริงๆ ลองนึกภาพว่าคุณใช้พื้นที่เล็ก ๆ ขนาดเท่ากันสองภาพหนึ่งคือสีน้ำเงินและแดง:
ฟังก์ชั่นหน้าต่างเท่ากับ 0 นอกสี่เหลี่ยมสีแดง (เพื่อความง่ายเราสามารถสมมติว่าหน้าต่างคงที่ภายในสี่เหลี่ยมสีแดง) ดังนั้นฟังก์ชั่นหน้าต่างจะเลือกพิกเซลที่คุณต้องการดูและกำหนดน้ำหนักสัมพัทธ์ให้กับแต่ละพิกเซล (โดยทั่วไปคือหน้าต่าง Gaussian เนื่องจากมีความสมมาตรแบบหมุนได้อย่างมีประสิทธิภาพในการคำนวณและเน้นพิกเซลใกล้กับกึ่งกลางของหน้าต่าง) สี่เหลี่ยมสีน้ำเงินถูกเลื่อนโดย (u, v)
ต่อไปคุณคำนวณผลรวมของความแตกต่างกำลังสองระหว่างส่วนภาพที่มีเครื่องหมายสีแดงและสีน้ำเงินนั่นคือคุณลบพิกเซลทีละพิกเซลลบความแตกต่างและสรุปผล (สมมติว่าเพื่อความง่ายที่หน้าต่าง = 1 ในพื้นที่ที่เรามองอยู่ ที่). สิ่งนี้ทำให้คุณมีหมายเลขหนึ่งหมายเลขสำหรับทุกสิ่งที่เป็นไปได้ (u, v) -> E (u, v)
ลองดูว่าเกิดอะไรขึ้นถ้าเราคำนวณค่าของ u / v ที่แตกต่างกัน:
ก่อนอื่นให้ v = 0:
สิ่งนี้ไม่น่าแปลกใจ: ความแตกต่างระหว่างส่วนภาพต่ำที่สุดเมื่อค่าออฟเซ็ต (u, v) อยู่ที่ 0 เมื่อคุณเพิ่มระยะห่างระหว่างทั้งสองแพทช์ผลรวมของความแตกต่างกำลังสองจะเพิ่มขึ้น
การรักษา u = 0:
พล็อตดูคล้ายกัน แต่ผลรวมของความแตกต่างกำลังสองระหว่างส่วนภาพสองภาพนั้นเล็กกว่ามากเมื่อคุณเลื่อนสี่เหลี่ยมผืนผ้าสีน้ำเงินไปในทิศทางของขอบ
เนื้อเรื่องเต็มของ E (u, v) มีลักษณะดังนี้:
เนื้อเรื่องดูเหมือนบิต "แคนยอน": มีความแตกต่างเพียงเล็กน้อยถ้าคุณเปลี่ยนภาพในทิศทางของหุบเขา นั่นเป็นเพราะแพทช์ภาพนี้มีการวางแนว (แนวตั้ง) ที่โดดเด่น
เราสามารถทำเช่นเดียวกันสำหรับแพทช์ภาพอื่น:
ที่นี่พล็อตของ E (u, v) มีลักษณะแตกต่างกัน:
ไม่ว่าคุณจะเปลี่ยนแพตช์ด้วยวิธีใดมันก็ดูต่างออกไปเสมอ
รูปร่างของฟังก์ชั่น E (u, v) บอกเราบางอย่างเกี่ยวกับแพทช์ภาพ
- หาก E (u, v) อยู่ใกล้ 0 ในทุกที่จะไม่มีพื้นผิวในแผ่นภาพที่คุณกำลังดู
- ถ้า E (u, v) คือ "รูปแคนยอน" แสดงว่าแพตช์มีทิศทางที่เด่น (ซึ่งอาจเป็นขอบหรือพื้นผิว)
- ถ้า E (u, v) เป็น "รูปทรงกรวย" แพทช์จะมีพื้นผิว แต่ไม่มีการวางแนว นั่นเป็นชนิดของปะแก้ที่ตัวตรวจจับมุมมองหาอยู่
การอ้างอิงจำนวนมากบอกว่ามันคือขนาดของหน้าต่างที่เลื่อน 'w' ... ดังนั้นหน้าต่างจะเลื่อนเท่าไหร่หนึ่งพิกเซล ... สองพิกเซล?
โดยปกติคุณจะไม่คำนวณ E (u, v) เลย คุณสนใจเฉพาะรูปร่างของมันในละแวกของ (u, v) = (0,0) ดังนั้นคุณแค่อยากให้การขยายตัวของเทย์เลอร์ของ E (u, v) ใกล้ (0,0) ซึ่งอธิบาย "รูปร่าง" ของมันอย่างสมบูรณ์
ผลรวมของตำแหน่งพิกเซลครอบคลุมโดยหน้าต่างหรือไม่
การพูดในเชิงคณิตศาสตร์มันมีความสง่างามกว่าที่จะให้ช่วงการสรุปรวมของพิกเซลทั้งหมด การพูดในทางปฏิบัติมีจุดรวมพิกเซลที่หน้าต่างเป็น 0