เหตุใดจึงใช้ตัวกรองเกาส์เซียนเป็นตัวกรองสัญญาณความถี่ต่ำในการประมวลผลภาพ


30

ในการประมวลผลสัญญาณ 1d ใช้ตัวกรองสัญญาณความถี่ต่ำหลายประเภท แม้ว่าตัวกรองแบบเกาส์นั้นแทบจะไม่เคยใช้เลย

เหตุใดจึงเป็นที่นิยมในแอปพลิเคชั่นประมวลผลข้อมูลภาพ? ตัวกรองเหล่านี้เป็นผลมาจากการเพิ่มประสิทธิภาพเกณฑ์หรือเป็นเพียงโซลูชันเฉพาะกิจเนื่องจากภาพ 'แบนด์วิดท์' ไม่ได้กำหนดไว้อย่างดี

คำตอบ:


28

แอปพลิเคชั่นประมวลผลภาพแตกต่างจากแอปพลิเคชั่นประมวลผลเสียงพูดเนื่องจากมีหลายรายการที่ปรับให้เหมาะกับสายตา หน้ากากแบบเกาส์เกือบจะจำลองแสงเบลอได้อย่างสมบูรณ์แบบ (ดูฟังก์ชันการกระจายแบบจุด ) ในแอปพลิเคชันการประมวลผลภาพใด ๆ ที่เน้นการผลิตงานศิลปะฟิลเตอร์ Gaussian จะใช้สำหรับการเบลอตามค่าเริ่มต้น

ที่สำคัญอีกคุณสมบัติเชิงปริมาณของฟิลเตอร์แบบเกาส์ก็คือพวกเขาทุกที่ที่ไม่ใช่เชิงลบ สิ่งนี้มีความสำคัญเนื่องจากสัญญาณ 1D ส่วนใหญ่แตกต่างกันไปประมาณ 0 ( ) และสามารถมีค่าบวกหรือลบ รูปภาพมีความแตกต่างกันในแง่ที่ว่าค่าทั้งหมดของรูปภาพไม่ใช่ค่าลบ ( ) Convolution ด้วยเคอร์เนล Gaussian (ตัวกรอง) รับประกันผลลัพธ์ที่ไม่เป็นลบดังนั้นฟังก์ชันดังกล่าวจะจับคู่ค่าที่ไม่เป็นลบกับค่าที่ไม่ใช่เชิงลบอื่น ๆ ( ) ผลลัพธ์จึงเป็นภาพที่ถูกต้องเสมอxRxR+:R+R+

โดยทั่วไปการปฏิเสธความถี่ในการประมวลผลภาพไม่สำคัญเท่าสัญญาณ 1D ตัวอย่างเช่นในแผนการปรับตัวกรองของคุณจำเป็นต้องมีความแม่นยำมากในการปฏิเสธช่องทางอื่น ๆ ที่ส่งด้วยความถี่ผู้ให้บริการที่แตกต่างกันและอื่น ๆ ฉันไม่สามารถนึกอะไรได้เลยว่าเป็นปัญหาในการประมวลผลภาพ


21

ตัวกรองแบบเกาส์ใช้ในการประมวลผลภาพเนื่องจากมีคุณสมบัติที่รองรับในโดเมนเวลาเท่ากับการสนับสนุนในโดเมนความถี่ สิ่งนี้มาจากเผ่าเกาส์เซียนซึ่งเป็นฟูริเยร์แปลงของตัวเอง

ความหมายของสิ่งนี้คืออะไร? ถ้าการสนับสนุนของตัวกรองเท่ากันในทั้งสองโดเมนนั่นหมายความว่าอัตราส่วนของการรองรับทั้งสองคือ 1 เมื่อปรากฎว่านี่หมายความว่าตัวกรอง Gaussian มี 'ผลิตภัณฑ์แบนด์วิดท์เวลาต่ำสุด'

ดังนั้นสิ่งที่คุณอาจพูดว่า? ในการประมวลผลภาพสิ่งหนึ่งที่สำคัญมากคือการกำจัดสัญญาณรบกวนสีขาวทั้งหมดในขณะที่ยังคงรักษาขอบภาพที่เด่นชัด นี่อาจเป็นงานที่ขัดแย้ง - มีสัญญาณรบกวนสีขาวในทุกความถี่เท่ากันในขณะที่มีขอบอยู่ในช่วงความถี่สูง (การเปลี่ยนแปลงอย่างฉับพลันในสัญญาณเชิงพื้นที่) ในการกำจัดสัญญาณรบกวนแบบดั้งเดิมผ่านการกรองสัญญาณจะถูกกรองผ่านความถี่ต่ำซึ่งหมายความว่าส่วนประกอบความถี่สูงในสัญญาณของคุณจะถูกลบออกอย่างสมบูรณ์

แต่ถ้าภาพมีขอบเป็นองค์ประกอบความถี่สูง LPF'ing แบบดั้งเดิมจะลบภาพเหล่านั้นออกและมองเห็นสิ่งนี้จะปรากฏขึ้นเมื่อขอบกลายเป็น 'เปื้อน' มากขึ้น

ถ้าอย่างนั้นจะกำจัดเสียงรบกวนอย่างไร แต่ยังรักษาความถี่สูงไว้ได้? ป้อนเคอร์เนลเกาส์เซียน เนื่องจากการแปลงฟูริเยร์ของเกาส์เซียนนั้นก็เป็นเกาส์เซียนด้วยเช่นกันตัวกรองเกาส์เซียนจึงไม่มีจุดตัดที่คมชัดในบางย่านความถี่ผ่านซึ่งเกินกว่าที่ความถี่ทั้งหมดจะถูกลบ แต่กลับมีหางที่สวยงามและเป็นธรรมชาติซึ่งจะลดลงเรื่อย ๆ เมื่อความถี่เพิ่มขึ้น ซึ่งหมายความว่ามันจะทำหน้าที่เป็นฟิลเตอร์กรองความถี่ต่ำ แต่ยังอนุญาตให้ใช้ในส่วนประกอบความถี่ที่สูงขึ้นซึ่งสอดคล้องกับความเร็วในการสลายตัวของหาง (ในทางกลับกัน LPF จะมีผลิตภัณฑ์แบนด์วิธที่สูงกว่าเนื่องจากการสนับสนุนในโดเมน F นั้นไม่ใหญ่เท่ากับของ Gaussians)

สิ่งนี้จะช่วยให้คนเราสามารถบรรลุผลที่ดีที่สุดของทั้งสองโลก - กำจัดเสียงรบกวนรวมถึงการดูแลรักษาขอบ


2
ฉันไม่แน่ใจว่าคุณสามารถเปรียบเทียบการรองรับทั้งสองโดยตรงเนื่องจากมีการวัดในเวลา / ความยาวและการสนับสนุนอื่น ๆ ใน Hz / เรเดียน สัณฐานวิทยาของพวกมันเหมือนกัน แต่สมบัติการไต่ระดับสากลยังคงมีอยู่
Phonon

ขอบคุณสำหรับการเตือนฉันเกี่ยวกับผลิตภัณฑ์แบนด์วิดท์เวลาขั้นต่ำ อย่างไรก็ตามตามที่ Phonon กล่าวไว้การลดการสนับสนุนโดเมนเชิงพื้นที่ (~ เวลา) จำเป็นต้องเพิ่มแบนด์วิดท์ ไม่มีทางที่คุณจะสามารถลดเสียงรบกวนและรักษาขอบด้วยฟิลเตอร์เกาส์แบบง่ายได้ นั่นเป็นเหตุผลที่ Perona & Malik พัฒนาตัวกรองแบบแอนไอโซทรอปิก
nimrodm

@Phonon อย่างที่ฉันได้เห็นการสนับสนุนเป็นเพียงจำนวนรายการที่ไม่เป็นศูนย์อธิบายฟังก์ชั่นในทั้งสองโดเมน - ฉันเชื่อว่าพวกเขาเหมือนกัน (ดังนั้นอัตราส่วน 1) ที่ถูกกล่าวว่าผลิตภัณฑ์เวลาแบนด์วิธถูกวัดเป็นผลิตภัณฑ์ของความแปรปรวนของฟังก์ชั่นในเวลาและความถี่ วิธีการปรับมาตรฐานของมันแตกต่างจากผู้เขียนฉันได้เห็นว่ามันบรรจุเท่ากับ 1/2 หรือ 1/4
Spacey

1
@nimrodm "การลดการสนับสนุนโดเมนเชิงพื้นที่ (~ เวลา) จำเป็นต้องเพิ่มแบนด์วิดท์" ใช่นั่นคือแนวโน้มซึ่งเกิดจากความสัมพันธ์แบบผกผันของความถี่เวลา (นี่คือที่มาของความไม่แน่นอนของความถี่เวลา) อย่างไรก็ตามฟังก์ชั่นเกาส์เซียนเป็นคลาสที่ลดขนาดผลิตภัณฑ์ทั้งหมดโดยย่อ เมื่อกำหนดความสัมพันธ์แบบผกผันระหว่างเวลาและความถี่ไม่มีวิธีการใด ๆ เว้นแต่จะมีการสนับสนุนที่เท่าเทียมกันในทั้งสองโดเมน
Spacey

@nimrodm ในการกระจาย anisotropic เมล็ดที่ฉันเห็นยังคงเป็นเกาส์แม้ว่าจะมีความแปรปรวนร่วมแปรปรวนที่ขึ้นอยู่กับการไล่ระดับสีของภาพ (มันยังเป็นวิธีที่ไม่ใช่เชิงเส้น, VS gaussian smoothing ซึ่งเป็นเส้นตรง) แต่ Gaussian ยังคงใช้อยู่เนื่องจากคุณสมบัติของมัน
Spacey

11

คุณมีคำตอบที่ดีอยู่แล้ว แต่ฉันจะเพิ่มคุณสมบัติที่มีประโยชน์เพิ่มเติมของตัวกรอง 2D Gaussian ซึ่งจะแยกออกได้นั่นคือตัวกรอง 2D สามารถแยกย่อยเป็นตัวกรอง 1D สองตัวได้ นี่อาจเป็นการพิจารณาประสิทธิภาพที่สำคัญสำหรับขนาดเคอร์เนลที่ใหญ่กว่าเนื่องจากตัวกรองแบบแยกได้ MxN สามารถนำไปใช้กับการM+Nเพิ่มทวีคูณได้ในขณะที่ตัวกรอง MxN แบบแยกไม่ได้นั้นต้องการการM*Nเพิ่มแบบทวีคูณ


2
นั่นเป็นข้อโต้แย้งที่ดี ตัวกรองแบบเกาส์ 2D มีทั้งแบบเรดิอเรตและยังแยกกันไม่ได้ดังนั้นความซับซ้อนในการติดตั้งจึงลดลงอย่างมาก
nimrodm

1
เป็นข้อมูลอ้างอิงนักวิทยาศาสตร์และวิศวกรคู่มือ DSPให้คำอธิบายที่ดีของคุณสมบัตินี้ในบทที่ 24
Caleb Reister

6

คู่มือ imagemagick มีคำอธิบายที่ดีว่าทำไมการกรองด้วยฟังก์ชั่น sinc นำไปสู่ ​​"เอฟเฟกต์" เสียงเรียกเข้าในขณะที่ gaussians ไม่มี ( http://www.imagemagick.org/Usage/fourier/#blurringและhttp://www.imagemagick.org/Usage/fourier/#circle_spectrum ) เมื่อคุณมีขอบ (ไม่ต่อเนื่อง) ในภาพของคุณ (ซึ่งภาพส่วนใหญ่ทำ) จากนั้นการตัดความถี่สูงทั้งหมดทำให้คุณมีระลอกคลื่นในโดเมนอวกาศ คุณยังได้รับเสียงเมื่อคุณกรองคลื่นสี่เหลี่ยมด้วยฟังก์ชัน sinc ในมิติเดียว


2

มีคำตอบที่สวยงามอยู่แล้ว แต่ฉันจะเพิ่มเม็ดเกลือของฉัน ot ค่อนข้างมุมมองที่แตกต่าง:

การกรองในระดับนามธรรมที่สุดถือได้ว่าเป็นการใช้ความรู้เดิมกับข้อมูลดิบ หมายความว่าการใช้อัลกอริธึมการกรองบางอย่างคือการใช้สิ่งนี้ก่อนเพื่อค้นหาอัตราส่วนสัญญาณต่อเสียงที่เหมาะสมตัวอย่างเช่น

สำหรับภาพคลาสสิกก่อนหน้าคือความราบรื่นของค่า (เช่นความเข้ม) ที่เกี่ยวกับตำแหน่ง (สามารถมองเห็นได้เป็นฟังก์ชั่นการกระจายจุดที่กล่าวถึงโดย @Phonon) มันมักจะเป็นแบบเกาส์เช่นเดียวกับรูปร่างที่คุณจะได้รับเมื่อผสมวัตถุต่าง ๆ เข้ากับรัศมีความเรียบที่รู้จัก (ซึ่งเรียกว่าทฤษฎีบทขีด จำกัด กลาง ) สิ่งนี้มีประโยชน์เป็นส่วนใหญ่เมื่อคุณต้องการสร้างอนุพันธ์ของภาพ: แทนที่จะสร้างความแตกต่างกับสัญญาณดิบ (ซึ่งจะให้ผลลัพธ์ที่มีเสียงรบกวน) คุณควรทำเช่นนั้นกับภาพที่ราบเรียบ นี้จะเทียบเท่ากับใช้ประกอบเวฟเหมือนเช่นฟิลเตอร์บอร์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.