สุ่มตัวอย่างภาพด้วยปัจจัยจำนวนเต็ม


16

เมื่อสุ่มตัวอย่างภาพด้วยปัจจัยจำนวนเต็มวิธีที่ชัดเจนคือตั้งค่าพิกเซลของภาพที่ส่งออกเป็นค่าเฉลี่ยของบล็อกn × n ที่สอดคล้องกันในภาพอินพุตnn×n

ฉันจำได้ว่าเพิ่งอ่านบางแห่งว่าวิธีนี้ไม่เหมาะสม (ขออภัยฉันจำรายละเอียดไม่ได้)

เป็นความจริงไหมว่ามีวิธีที่ดีกว่า (และถ้าเป็นเช่นนั้นวิธีการข้างต้นจะล้มเหลวแม้ว่าจะดูเหมือนว่า "ชัด" ถูกต้อง) ฉันไม่รู้มากเกี่ยวกับการประมวลผลสัญญาณคำถามนี้แค่สนใจฉัน


หากคุณไม่มีพื้นหลังการประมวลผลสัญญาณคำอธิบาย laymans คือ: มีวิธีที่ดีกว่าสำหรับการสุ่มตัวอย่าง อัลกอริทึมการลดขนาดตัวอย่างของคุณในทางเทคนิคจะทำให้ขนาดพิกเซลภาพเล็กลงโดย N BUT แต่อัลกอริทึมที่อธิบายข้างต้นจะลดคุณภาพลงอย่างมากเมื่อเปรียบเทียบกับอัลกอริธึมการลดขนาดตัวอย่างที่ดีกว่า
เทรเวอร์บอยด์สมิ ธ

คำตอบ:


16

การสุ่มตัวอย่างภาพลดจำนวนตัวอย่างที่สามารถเป็นตัวแทนของสัญญาณได้ ในแง่ของโดเมนความถี่เมื่อสัญญาณมีการสุ่มตัวอย่างส่วนความถี่สูงของสัญญาณจะถูกใช้นามแฝงกับส่วนความถี่ต่ำ เมื่อนำไปใช้กับการประมวลผลภาพผลลัพธ์ที่ต้องการคือรักษาเฉพาะส่วนที่มีความถี่ต่ำ ในการดำเนินการนี้ภาพต้นฉบับจะต้องได้รับการประมวลผลล่วงหน้า (กรองด้วยนามแฝง) เพื่อลบส่วนความถี่สูงเพื่อไม่ให้เกิดนามแฝง


ตัวกรองดิจิตอลที่ดีที่สุดที่จะลบส่วนความถี่สูง (ที่มีการตัดคมชัด) เป็นฟังก์ชั่น sinc เหตุผลก็คือการเป็นตัวแทนของโดเมนความถี่ของฟังก์ชัน Sinc นั้นมีค่าคงที่เกือบ 1 ตลอดช่วงความถี่ต่ำทั้งหมดและเกือบ 0 คงที่ตลอดภูมิภาคความถี่สูงทั้งหมด

sinc(x)=บาป(πx)πx

การตอบสนองต่อแรงกระตุ้นของตัวกรอง sinc นั้นไม่มีที่สิ้นสุด ตัวกรอง Lanczosเป็นตัวกรอง sinc ที่ปรับเปลี่ยนซึ่งลดทอนค่าสัมประสิทธิ์ sinc และตัดทอนพวกเขาเมื่อค่าลดลงสู่ความไม่สำคัญ


อย่างไรก็ตามการที่ดีที่สุดในโดเมนความถี่นั้นไม่ได้หมายความว่าจะดีที่สุดในสายตามนุษย์ มีวิธีการสุ่มตัวอย่างแบบอัพและแซมดาวน์ที่ไม่ปฏิบัติตามการแปลงเชิงเส้น แต่ให้ผลลัพธ์ที่ดีกว่าแบบลิเนียร์


โดยคำนึงถึงข้อความเกี่ยวกับ n×nโปรดทราบว่าในระหว่างการสุ่มตัวอย่างภาพการเลือกความสอดคล้องของพิกัดระหว่างสัญญาณความละเอียดสูงและสัญญาณความละเอียดต่ำนั้นไม่ได้กำหนดเองและไม่เพียงพอที่จะจัดตำแหน่งให้เป็นจุดกำเนิดเดียวกัน (0) บน บรรทัดจำนวนจริงหรือไม่ต่อเนื่อง

ความต้องการขั้นต่ำในการติดต่อประสานงานคือ

  1. การสุ่มภาพใหม่ที่มีค่าสุ่มโดยปัจจัยตัวประกอบจำนวนเต็มจากนั้นการสุ่มตัวอย่างด้วยปัจจัยจำนวนเต็มเดียวกันควรทำให้ภาพเดียวกันมีการเปลี่ยนแปลงเชิงตัวเลขน้อยที่สุด
  2. Upsampling / downsampling ภาพที่ประกอบด้วยค่าสม่ำเสมอเพียงหนึ่งค่าตามด้วยการดำเนินการตรงข้ามควรส่งผลให้ภาพประกอบด้วยค่าเดียวกันอย่างสม่ำเสมอโดยมีการเบี่ยงเบนตัวเลขน้อยที่สุด
  3. การใช้คู่ของการสุ่มตัวอย่างต่ำ / การสุ่มตัวอย่างซ้ำ ๆ ควรลดการเปลี่ยนแปลงของเนื้อหาภาพให้น้อยที่สุดเท่าที่จะทำได้

คุณหมายถึงอะไรโดยการแปลงฟังก์ชัน sinc ที่เป็น "เกือบ" 1 และ 0 ในภูมิภาคที่เกี่ยวข้อง?

@ เวลา: ปรากฏการณ์กิ๊บส์ใกล้กับความถี่ตัดของตัวกรอง sinc
rwong

2
การสุ่มตัวอย่าง Sinc ใหม่จะใช้งานได้เฉพาะสัญญาณที่รับรู้ / ประมวลผลในโดเมนความถี่เช่นเสียง มีการรับรู้ภาพอย่างน้อยประมาณโดเมนในขอบเขตพิเศษ (ซึ่งเป็นที่ถกเถียงกันมันเป็นไปได้ที่การรับรู้รูปแบบซ้ำ ๆ บางอย่างอยู่ในโดเมนความถี่) และการแปลงใด ๆ ที่อิงกับโดเมนความถี่จะทำให้เกิดการบิดเบือนที่น่ารังเกียจโดเมนพิเศษ โดยพื้นฐานแล้วการดำเนินการสังวัตนา / เชิงเส้นใด ๆ ที่มีค่าสัมประสิทธิ์เชิงลบใด ๆ จะผลิตสิ่งประดิษฐ์ที่น่ารังเกียจและสิ่งที่มีค่าสัมประสิทธิ์ไม่เชิงลบทั้งหมดจะทำให้เกิดการเบลอ
. GitHub หยุดช่วยน้ำแข็ง

6

คุณพูดถูกว่าการหาพื้นที่เฉลี่ยอยู่ใกล้กับ "ที่ถูกต้องที่สุด" คุณจะได้รับ แต่ปัญหาคือพฤติกรรมที่ไม่สอดคล้องกันเมื่อทำการลดขนาดเส้นความกว้าง -N ที่คมชัดโดยปัจจัยของ N หากตำแหน่งของเส้นนั้นอยู่ในแนวโมดูโล N คุณจะได้เส้นที่คมชัด 1 พิกเซล แต่ถ้าประมาณ N / 2 mod N คุณจะได้เส้นที่เบลอมาก (กว้าง 2 พิกเซลที่ความเข้มครึ่งหนึ่ง) สิ่งนี้อาจดูไม่ดีมากและด้วยแกมมาที่ไม่เชิงเส้นก็จะส่งผลให้เกิดความแตกต่างของความเข้ม (โดยหลักแล้วการเริ่มต้นใหม่ทั้งหมดจะต้องเกิดขึ้นกับแกมม่าที่แก้ไขสำหรับระดับความเข้มเชิงเส้น แต่ในทางปฏิบัติแทบไม่มีใครทำเช่นนั้นเพราะมันมีราคาแพงจริงๆ)

หากคุณต้องการปรับปรุงในเรื่องนี้คุณต้องยอมรับความจริงที่ว่ามันเป็นไปไม่ได้ที่จะลดการเบลอของภาพในบางกรณีดังนั้นวิธีเดียวที่จะได้ผลลัพธ์แบบเดียวคือการเพิ่มการเบลอ วิธีที่เหมาะคือใช้เคอร์เนล gaussian ที่มีรัศมีมากกว่า N / 2 แทนที่จะเป็นฟังก์ชันแบบขั้นตอนเนื่องจากเป็นฟังก์ชัน convolution พร้อมกับอิมเมจต้นทาง วิธีที่ประหยัดในการประมาณค่าอย่างไรก็ตามหากคุณมีการดำเนินการหาค่าเฉลี่ยพื้นที่ N-by-N ของคุณอยู่แล้วเพียงเพื่อใช้การโน้มน้าวใจเบลอ (1 / 4,1 / 2,1 / 4) กับการลดขนาดตัวอย่าง ภาพ.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.