คณิตศาสตร์ของการตรวจจับมุมของแฮร์ริส


23

นี่คือนิพจน์ทางคณิตศาสตร์สำหรับการตรวจจับมุมของแฮร์ริส:

นี่คือนิพจน์ทางคณิตศาสตร์สำหรับการตรวจจับมุมของแฮร์ริส ...

แต่ฉันมีข้อสงสัยดังต่อไปนี้:

  1. ความสำคัญทางกายภาพของและคืออะไร? อ้างอิงหลายคนบอกว่ามันเป็นเรื่องสำคัญโดยที่หน้าต่างขยับ หน้าต่างเลื่อนไปเท่าไหร่ หนึ่งพิกเซลหรือสองพิกเซลuvw
  2. ผลรวมของตำแหน่งพิกเซลครอบคลุมโดยหน้าต่างหรือไม่
  3. สมมติว่า ,คือความเข้มของพิกเซลเดียวที่หรือผลรวมของความเข้มภายในหน้าต่างด้วยจุดศูนย์กลางที่ ?w(x,y)=1I(x,y)(x,y)(x,y)
  4. ตามที่วิกิพวกเขาบอกว่าภาพเป็น 2 มิติแสดงโดยฉันแล้วขอให้พิจารณาการปะภาพเหนือพื้นที่จากนั้นใช้สัญกรณ์(x,y)I(x,y)

ฉันพบว่ามันสับสนที่จะเข้าใจคำอธิบายทางคณิตศาสตร์ ใครมีความคิด?


2
ตรวจสอบการบรรยายนี้บนเครื่องตรวจจับมุมของแฮร์ริส ชัดเจนมาก: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

ฉันเขียนโพสต์ในบล็อกส่วนตัวของฉันซึ่งเป็นไปตามการบรรยายด้านบน matlabcorner.wordpress.com/2012/11/17/…
Andrey Rubshtein

คำตอบ:


31

ความหมายของสูตรนั้นค่อนข้างง่ายจริงๆ ลองนึกภาพว่าคุณใช้พื้นที่เล็ก ๆ ขนาดเท่ากันสองภาพหนึ่งคือสีน้ำเงินและแดง:

ป้อนคำอธิบายรูปภาพที่นี่

ฟังก์ชั่นหน้าต่างเท่ากับ 0 นอกสี่เหลี่ยมสีแดง (เพื่อความง่ายเราสามารถสมมติว่าหน้าต่างคงที่ภายในสี่เหลี่ยมสีแดง) ดังนั้นฟังก์ชั่นหน้าต่างจะเลือกพิกเซลที่คุณต้องการดูและกำหนดน้ำหนักสัมพัทธ์ให้กับแต่ละพิกเซล (โดยทั่วไปคือหน้าต่าง Gaussian เนื่องจากมีความสมมาตรแบบหมุนได้อย่างมีประสิทธิภาพในการคำนวณและเน้นพิกเซลใกล้กับกึ่งกลางของหน้าต่าง) สี่เหลี่ยมสีน้ำเงินถูกเลื่อนโดย (u, v)

ต่อไปคุณคำนวณผลรวมของความแตกต่างกำลังสองระหว่างส่วนภาพที่มีเครื่องหมายสีแดงและสีน้ำเงินนั่นคือคุณลบพิกเซลทีละพิกเซลลบความแตกต่างและสรุปผล (สมมติว่าเพื่อความง่ายที่หน้าต่าง = 1 ในพื้นที่ที่เรามองอยู่ ที่). สิ่งนี้ทำให้คุณมีหมายเลขหนึ่งหมายเลขสำหรับทุกสิ่งที่เป็นไปได้ (u, v) -> E (u, v)

ลองดูว่าเกิดอะไรขึ้นถ้าเราคำนวณค่าของ u / v ที่แตกต่างกัน:

ก่อนอื่นให้ v = 0:

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งนี้ไม่น่าแปลกใจ: ความแตกต่างระหว่างส่วนภาพต่ำที่สุดเมื่อค่าออฟเซ็ต (u, v) อยู่ที่ 0 เมื่อคุณเพิ่มระยะห่างระหว่างทั้งสองแพทช์ผลรวมของความแตกต่างกำลังสองจะเพิ่มขึ้น

การรักษา u = 0:

ป้อนคำอธิบายรูปภาพที่นี่

พล็อตดูคล้ายกัน แต่ผลรวมของความแตกต่างกำลังสองระหว่างส่วนภาพสองภาพนั้นเล็กกว่ามากเมื่อคุณเลื่อนสี่เหลี่ยมผืนผ้าสีน้ำเงินไปในทิศทางของขอบ

เนื้อเรื่องเต็มของ E (u, v) มีลักษณะดังนี้:

ป้อนคำอธิบายรูปภาพที่นี่

เนื้อเรื่องดูเหมือนบิต "แคนยอน": มีความแตกต่างเพียงเล็กน้อยถ้าคุณเปลี่ยนภาพในทิศทางของหุบเขา นั่นเป็นเพราะแพทช์ภาพนี้มีการวางแนว (แนวตั้ง) ที่โดดเด่น

เราสามารถทำเช่นเดียวกันสำหรับแพทช์ภาพอื่น:

ป้อนคำอธิบายรูปภาพที่นี่

ที่นี่พล็อตของ E (u, v) มีลักษณะแตกต่างกัน:

ป้อนคำอธิบายรูปภาพที่นี่

ไม่ว่าคุณจะเปลี่ยนแพตช์ด้วยวิธีใดมันก็ดูต่างออกไปเสมอ

รูปร่างของฟังก์ชั่น E (u, v) บอกเราบางอย่างเกี่ยวกับแพทช์ภาพ

  • หาก E (u, v) อยู่ใกล้ 0 ในทุกที่จะไม่มีพื้นผิวในแผ่นภาพที่คุณกำลังดู
  • ถ้า E (u, v) คือ "รูปแคนยอน" แสดงว่าแพตช์มีทิศทางที่เด่น (ซึ่งอาจเป็นขอบหรือพื้นผิว)
  • ถ้า E (u, v) เป็น "รูปทรงกรวย" แพทช์จะมีพื้นผิว แต่ไม่มีการวางแนว นั่นเป็นชนิดของปะแก้ที่ตัวตรวจจับมุมมองหาอยู่

การอ้างอิงจำนวนมากบอกว่ามันคือขนาดของหน้าต่างที่เลื่อน 'w' ... ดังนั้นหน้าต่างจะเลื่อนเท่าไหร่หนึ่งพิกเซล ... สองพิกเซล?

โดยปกติคุณจะไม่คำนวณ E (u, v) เลย คุณสนใจเฉพาะรูปร่างของมันในละแวกของ (u, v) = (0,0) ดังนั้นคุณแค่อยากให้การขยายตัวของเทย์เลอร์ของ E (u, v) ใกล้ (0,0) ซึ่งอธิบาย "รูปร่าง" ของมันอย่างสมบูรณ์

ผลรวมของตำแหน่งพิกเซลครอบคลุมโดยหน้าต่างหรือไม่

การพูดในเชิงคณิตศาสตร์มันมีความสง่างามกว่าที่จะให้ช่วงการสรุปรวมของพิกเซลทั้งหมด การพูดในทางปฏิบัติมีจุดรวมพิกเซลที่หน้าต่างเป็น 0


ขอบคุณที่ Nikie ตัน ....
rotating_image

2
ฉันรู้ว่าคุณจะได้รับคำตอบที่ยอดเยี่ยมที่นี่ @rotating_image
karlphillip

thanx karlphillip ..
rotating_image

1
หนึ่งล้าน upvotes!
Phonon
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.