ความแตกต่างระหว่างความแตกต่างของ Gaussian, Laplace of Gaussian และเวฟเวฟ Hat Mexican คืออะไร


10

มีสามเทคนิคที่ใช้ใน CV ที่ดูเหมือนกันมาก แต่มีความแตกต่างเล็กน้อยคือ:

  • Laplacian แห่งเกาส์เซียน:2[g(x,y,t)f(x,y)]
  • ความแตกต่างของ Gaussians:[g1(x,y,t)f(x,y)][g2(x,y,t)f(x,y)]
  • การแปลงด้วยเวฟเล็ตแบบ Ricker :Ricker(x,y,t)f(x,y)

ตามที่ฉันเข้าใจแล้วในปัจจุบัน: DoG เป็นการประมาณของ LoG ทั้งสองถูกใช้ในการตรวจจับหยดและทั้งคู่ทำหน้าที่เป็นตัวกรองแบนด์ผ่าน การสังเกตุด้วยเวฟเล็ต Hat / Ricker แบบเม็กซิกันนั้นดูเหมือนว่าจะได้ผลเหมือนกันมาก

ฉันใช้เทคนิคทั้งสามนี้กับสัญญาณพัลส์ (พร้อมการขยายขนาดที่จำเป็นเพื่อให้ได้ขนาดที่ใกล้เคียงกัน) และผลลัพธ์ใกล้เคียงกันมาก ในความเป็นจริง LoG และ Ricker มีลักษณะเกือบเหมือนกัน ข้อแตกต่างที่แท้จริงที่ฉันสังเกตเห็นคือ DoG ฉันมี 2 พารามิเตอร์ฟรีในการปรับแต่ง (และ ) เทียบกับ 1 สำหรับ LoG และ Ricker ฉันยังพบว่าเวฟเล็ตนั้นง่ายที่สุด / เร็วที่สุดเท่าที่จะทำได้ด้วยการบิดเพียงครั้งเดียว (ทำได้โดยการคูณในพื้นที่ฟูริเยร์ด้วย FT ของเคอร์เนล) เทียบกับ 2 สำหรับ DoG และ Convol บวก Laplacian สำหรับ LoG σ 1σ1σ1

ผลลัพธ์ของการบิดเวฟเล็ตแบบ Ricker, Laplacian of Gaussian และความแตกต่างของ Gaussian

  • อะไรคือข้อดี / ข้อเสียเปรียบเทียบของแต่ละเทคนิค?
  • มีกรณีการใช้งานที่แตกต่างกันหรือไม่ในกรณีที่หนึ่งมีความโดดเด่นอื่น ๆ ?

ฉันยังมีความคิดตามสัญชาตญาณว่าในตัวอย่างที่ไม่ต่อเนื่อง LoG และ Ricker จะเสื่อมการดำเนินการเดียวกันเนื่องจากสามารถนำไปใช้เป็นเคอร์เนล .[ - 1 , 2 , - 1 ]2

[1,2,1]or[010141010]for 2D images

การใช้การดำเนินการนั้นกับ gaussian ก่อให้เกิดเวฟเล็ต Ricker / Hat นอกจากนี้เนื่องจาก LoG และ DoG เกี่ยวข้องกับสมการการกระจายความร้อนฉันจึงคิดว่าฉันสามารถจับคู่กับพารามิเตอร์ที่เล่นซอ

(ฉันยังคงรู้สึกเปียกด้วยสิ่งนี้รู้สึกอิสระที่จะแก้ไข / ชี้แจงใด ๆ นี้!)

คำตอบ:


6

Laplace of Gaussian

Laplace of Gaussian (LoG) ของภาพสามารถเขียนเป็นf

2(fg)=f2g

ด้วยเคอร์เนล Gaussian และการเปลี่ยนแปลง นั่นคือ Laplace ของภาพที่ปรับให้เรียบด้วยเคอร์เนล Gaussian นั้นเหมือนกับภาพที่เกิดจาก Laplace ของเคอร์เนล Gaussian การบิดนี้สามารถขยายเพิ่มเติมได้ในกรณี 2 มิติเช่นg

f2g=f(2x2g+2y2g)=f2x2g+f2y2g

ดังนั้นจึงเป็นไปได้ที่จะคำนวณว่าเป็นการเพิ่มสอง convolutions ของภาพอินพุตด้วยอนุพันธ์อันดับสองของเคอร์เนล Gaussian (ใน 3D นี่คือ 3 convolutions ฯลฯ ) สิ่งนี้น่าสนใจเพราะเคอร์เนลเกาส์เซียนนั้นแยกออกไม่ได้เช่นเดียวกับอนุพันธ์ของมัน นั่นคือ,

f(x,y)g(x,y)=f(x,y)(g(x)g(y))=(f(x,y)g(x))g(y)

หมายถึงว่าแทนที่จะเป็นการสนทนาแบบ 2 มิติเราสามารถคำนวณสิ่งเดียวกันโดยใช้การสนทนา 1D สองครั้ง สิ่งนี้ช่วยประหยัดการคำนวณจำนวนมาก สำหรับเคอร์เนลเกาส์เซียนที่เล็กที่สุดที่คุณสามารถคิดได้คุณมี 5 ตัวอย่างตามแต่ละมิติ การบิด 2 มิตินั้นต้องการ 25 การคูณและการเพิ่มเติมส่วนการบิด 1D สองอันนั้นต้องการ 10 เคอร์เนลที่มีขนาดใหญ่ขึ้นหรือมีมิติมากขึ้นในภาพยิ่งมีความสำคัญในการประหยัดคอมพิวเตอร์มากขึ้น

ดังนั้น LoG สามารถคำนวณได้โดยใช้การสนทนา 1D สี่ครั้ง แม้ว่าเคอร์เนล LoG นั้นไม่สามารถแยกได้

มีการประมาณที่ภาพถูกโน้มน้าวด้วยเคอร์เนลเกาส์เซียนก่อนแล้วจึงนำไปใช้โดยใช้ความแตกต่างอัน จำกัด นำไปสู่เคอร์เนล 3x3 ที่มี -4 ตรงกลางและ 1 ในสี่เพื่อนบ้านขอบของมัน2

ริคเกอร์เวฟหรือผู้ประกอบหมวกเม็กซิกันเหมือนกับที่บันทึกถึงการปรับขนาดและการฟื้นฟู

ความแตกต่างของ Gaussians

ความแตกต่างของภาพ Gaussians (DoG)สามารถเขียนได้ดังนี้f

fg(1)fg(2)=f(g(1)g(2))

ดังนั้นเช่นเดียวกับ LoG DoG จึงถูกมองว่าเป็นสังวัตนา 2D ที่แยกกันไม่ได้หรือผลรวม (ความแตกต่างในกรณีนี้) ของสอง convolutions ที่แบ่งแยกได้ เห็นด้วยวิธีนี้ดูเหมือนว่าไม่มีข้อได้เปรียบด้านการคำนวณในการใช้ DoG ผ่าน LoG อย่างไรก็ตาม DoG เป็นตัวกรอง band-pass ที่ปรับค่าได้, LoG ไม่สามารถปรับได้ในลักษณะเดียวกันและควรถูกมองว่าเป็นตัวดำเนินการต่อเนื่อง DoG ยังปรากฏขึ้นตามธรรมชาติในการตั้งค่าสเกลพื้นที่ซึ่งภาพถูกกรองในหลายสเกล (Gaussians ที่มี sigmas ที่แตกต่างกัน) ความแตกต่างระหว่างสเกลที่ตามมาคือ DoG

มีการประมาณค่ากับเคอร์เนล DoG ที่แยกได้ลดค่าใช้จ่ายในการคำนวณลงครึ่งหนึ่งแม้ว่าการประมาณนั้นจะไม่ได้เป็นแบบ isotropic ซึ่งนำไปสู่การพึ่งพาการหมุนของตัวกรอง

ฉันเคยแสดงให้เห็นถึงความเท่าเทียมกันของ LoG และ DoG สำหรับ DoG ที่ความแตกต่างของ sigma ระหว่างเมล็ดเกาส์เซียนทั้งสองนั้นมีขนาดเล็กมาก (มากถึงขนาด) ฉันไม่มีบันทึกนี้ แต่ก็ไม่ยากที่จะแสดง

รูปแบบอื่น ๆ ของการคำนวณตัวกรองเหล่านี้

คำตอบของ Laurentกล่าวถึงการกรองแบบเรียกซ้ำและการคำนวณ OP กล่าวถึงในโดเมนฟูริเยร์ แนวคิดเหล่านี้ใช้กับทั้ง LoG และ DoG

เสียนและอนุพันธ์สามารถคำนวณได้โดยใช้สาเหตุและป้องกันสาเหตุกรอง IIR ดังนั้นการโน้มน้าวใจ 1D ทั้งหมดที่กล่าวถึงข้างต้นสามารถนำไปใช้ในเวลาคงที่ wrt sigma โปรดทราบว่านี่จะมีประสิทธิภาพสำหรับ sigmas ที่ใหญ่กว่าเท่านั้น

ในทำนองเดียวกันการคำนวณใด ๆ ที่สามารถคำนวณได้ในโดเมนฟูริเยร์ดังนั้นทั้งเมล็ด DoG และ LoG 2D สามารถเปลี่ยนเป็นโดเมนฟูริเยร์ (หรือคำนวณได้มากกว่านั้น) และนำไปใช้โดยการคูณ

สรุปแล้ว

ไม่มีความแตกต่างอย่างมีนัยสำคัญในความซับซ้อนของการคำนวณของทั้งสองวิธี ฉันยังไม่พบเหตุผลที่ดีในการประมาณ LoG โดยใช้ DoG


นี่คือคำตอบที่ยอดเยี่ยม! ฉันจะอัปเดตเป็นคำตอบใหม่ไม่ใช่คำตอบของ Laurentว่าผิดหรือไม่สมบูรณ์ แต่คุณใช้เวลาเพิ่มมุมมองที่สองให้กับคำถามที่ตอบแล้วปีหนึ่ง
DeusXMachina

2
DoG และ LoG พบกันในระดับ "เห่า"
Laurent Duval

4

The Ricker wavelet, (isotropic) Marr wavelet, หมวกเม็กซิกันหรือ Laplacian ของ Gaussians เป็นแนวคิดเดียวกัน: wavelets ที่ยอมรับได้อย่างต่อเนื่อง (พอใจเงื่อนไขบางประการ) ตามเนื้อผ้าเวฟเล็ต Ricker เป็นรุ่น 1D Marr เวฟเล็ตหรือหมวกเม็กซิกันเป็นชื่อที่กำหนดในบริบทของการสลายตัวของภาพ 2D คุณสามารถพิจารณาตัวอย่างเช่น 2.2 ของภาพพาโนรามาในการแสดงทางเรขาคณิตแบบหลายส่วนการสลับระหว่างปริภูมิทิศทางและการเลือกความถี่การประมวลสัญญาณ 2011, L. Jacques et อัล Laplacian ของ Gaussian เป็นลักษณะทั่วไปหลายมิติ

อย่างไรก็ตามในทางปฏิบัติผู้คนยอมรับการแยกประเภทต่าง ๆ ในระดับที่ต่างกัน

3×33×3

(010141010)

(111181111)
5×5

σ1σ2

แต่มีการใช้อัตราส่วนอื่น ๆ ในปิรามิด Laplacian บางอย่างซึ่งทำให้ DoG เปลี่ยนเป็นฟิลเตอร์ bandpass ทั่วไปหรือเครื่องตรวจจับขอบมากขึ้น

การอ้างอิงล่าสุด: การจับคู่รูปภาพโดยใช้จุดสนใจขนาดพื้นที่ทั่วไป , T. Lindeberg, 2015


1
ตรัสรู้มาก ๆ ขอบคุณ! ดังนั้นดูเหมือนจากFast Gaussian Smoothingที่ DoG มีข้อได้เปรียบในการคำนวณซึ่งสามารถทำได้โดยตรงในโดเมนอวกาศดังนั้นฉันจึงนึกภาพเช่นการประมวลผลสัญญาณบนชิปสำหรับการมองเห็นด้วยคอมพิวเตอร์แบบ CCD / แบบรวม ยิ่งไปกว่านั้นA Panorama ยังมีภาพรวมการอ่านที่ยอดเยี่ยมขอบคุณ!
DeusXMachina

ด้วยการประมาณที่รวดเร็วคุณสามารถดำเนินการได้หลายอย่างโดยไม่ขึ้นกับเครื่องชั่ง
Laurent Duval

1
อัตราส่วน 1.6 มาจากไหน ถ้าคุณเขียนคณิตศาสตร์คุณจะเห็นว่ามีความเท่าเทียมกันอย่างแน่นอนระหว่างอนุพันธ์อันดับสองของเกาส์เซียนและความแตกต่างของเกาส์เซียนกับความแตกต่างเล็กน้อยในซิกม่า (จนถึงการปรับสเกล)
Cris Luengo

1
จาก Marr และ Hildreth, 1980, ภาคผนวก B, พวกเขาเรียกมันว่า "การประมาณทางวิศวกรรมที่ดีที่สุด" โดยมีการแลกเปลี่ยนระหว่างแบนด์วิดท์และความไวตามเส้นโค้งบุญในขณะที่เปลี่ยนอัตราส่วนความกว้าง ฉันได้พบกับงานบางอย่างในอดีตโดยผู้คนในเดลฟ์ที่มีชื่อเดียวกัน เหตุบังเอิญ?
Laurent Duval

1
@ LaurentDuval: ฉันทำปริญญาเอกใน Delft ไม่มีคนอื่นที่มีชื่อของฉัน AFAIK ฉันสามารถดูว่าคุณจะได้รับ (ส่วนตัว) ที่เหมาะสมที่สุดตามความไวและแบนด์วิดท์ได้อย่างไร หากอัตราส่วนมีขนาดเล็กเกินไปการตอบสนองต่ำเกินไปอาจขึ้นอยู่กับเสียงรบกวนจากการแยกส่วนมากกว่าสิ่งอื่น หากอัตราส่วนสูงเกินไปก็ไม่ใช่ตัวกรองที่น่าสนใจ มีเหตุผล. ขอบคุณ!
Cris Luengo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.