การดำเนินการสังวัตนานั้นคือการรวมกันของผลคูณองค์ประกอบที่ชาญฉลาดของสองเมทริกซ์ ตราบใดที่การฝึกอบรมทั้งสองนี้ตกลงกันในมิติก็ไม่น่ามีปัญหาและดังนั้นฉันสามารถเข้าใจแรงจูงใจที่อยู่เบื้องหลังการสืบค้นของคุณ
A.1 อย่างไรก็ตามเจตนาของการบิดคือการเข้ารหัสเมทริกซ์แหล่งข้อมูล (รูปภาพทั้งหมด) ในแง่ของตัวกรองหรือเคอร์เนล โดยเฉพาะอย่างยิ่งเรากำลังพยายามเข้ารหัสพิกเซลในพื้นที่ใกล้เคียงของจุดยึด / พิกเซลแหล่งที่มา ดูรูปด้านล่าง:
โดยทั่วไปแล้วเราพิจารณาทุกพิกเซลของภาพต้นฉบับเป็นจุดยึด / พิกเซลต้นทาง แต่เราไม่ได้บังคับให้ทำเช่นนี้ ในความเป็นจริงมันไม่ใช่เรื่องแปลกที่จะรวมก้าวย่างที่เรายึด / พิกเซลแหล่งที่มาจะถูกคั่นด้วยจำนวนพิกเซลที่เฉพาะเจาะจง
โอเคพิกเซลแหล่งที่มาคืออะไร เป็นจุดยึดที่เคอร์เนลอยู่กึ่งกลางและเรากำลังเข้ารหัสพิกเซลที่อยู่ใกล้เคียงทั้งหมดรวมถึงจุดยึด / พิกเซลแหล่งที่มา เนื่องจากเคอร์เนลมีรูปร่างสมมาตร (ไม่ใช่สมมาตรในค่าเคอร์เนล) จึงมีจำนวนพิกเซล (n) เท่ากันทุกด้าน (การเชื่อมต่อ 4 จุด) ของจุดยึดพิกเซล ดังนั้นไม่ว่าจำนวนพิกเซลนี้จะเท่าไหร่ความยาวของแต่ละด้านของเคอร์เนลที่มีรูปร่างสมมาตรคือ 2 * n + 1 (แต่ละด้านของจุดยึด + จุดยึดพิกเซล) และดังนั้นตัวกรอง / เมล็ดจึงมีขนาดแปลกเสมอ
เกิดอะไรขึ้นถ้าเราตัดสินใจที่จะทำลายด้วย 'ประเพณี' และใช้เมล็ดไม่สมมาตร คุณจะได้รับข้อผิดพลาดในการใช้นามแฝงดังนั้นเราจึงไม่ทำเช่นนั้น เราถือว่าพิกเซลเป็นเอนทิตีที่เล็กที่สุดนั่นคือไม่มีแนวคิดย่อยพิกเซลที่นี่
A.2 ปัญหาขอบเขตถูกจัดการโดยใช้วิธีการที่แตกต่างกัน: บางคนไม่สนใจ, บางส่วนเป็นศูนย์มัน, กระจกเงาสะท้อนให้เห็น หากคุณไม่ต้องการคำนวณการผกผันเช่น deconvolution และไม่สนใจที่จะสร้างภาพต้นฉบับขึ้นมาใหม่อย่างสมบูรณ์แบบคุณไม่ต้องสนใจว่าจะสูญเสียข้อมูลหรือการส่งเสียงดังเนื่องจากปัญหาเขตแดน โดยทั่วไปการดำเนินการรวมกำไร (การรวมกำไรโดยรวมหรือการรวมกำไรสูงสุด) จะลบสิ่งประดิษฐ์ขอบเขตของคุณต่อไป ดังนั้นอย่าเพิกเฉยส่วนหนึ่งของ 'ฟิลด์อินพุต' การดำเนินการรวมกำไรของคุณจะทำเพื่อคุณ
-
เซนแห่งการโน้มน้าวใจ:
ในโดเมนการประมวลผลสัญญาณของโรงเรียนเก่าเมื่อสัญญาณอินพุตได้รับการโน้มน้าวหรือผ่านตัวกรองไม่มีวิธีการตัดสินก่อนซึ่งองค์ประกอบของการตอบสนองที่ถูกกรอง / กรองนั้นมีความเกี่ยวข้อง / ให้ข้อมูล ดังนั้นจุดมุ่งหมายคือเพื่อรักษาองค์ประกอบสัญญาณ (ทั้งหมดของมัน) ในการเปลี่ยนแปลงเหล่านี้
ส่วนประกอบสัญญาณเหล่านี้เป็นข้อมูล องค์ประกอบบางอย่างมีข้อมูลมากกว่าองค์ประกอบอื่น ๆ เหตุผลเดียวสำหรับสิ่งนี้คือเราสนใจดึงข้อมูลระดับสูงขึ้น ข้อมูลที่เกี่ยวข้องกับคลาสความหมายบางคลาส ดังนั้นส่วนประกอบของสัญญาณเหล่านั้นที่ไม่ได้ให้ข้อมูลที่เราสนใจเป็นพิเศษสามารถตัดออกได้ ดังนั้นซึ่งแตกต่างจากผู้สอนในโรงเรียนเก่าเกี่ยวกับการโน้มน้าว / การกรองเรามีอิสระที่จะรวม / ตัดการตอบสนองการบิดตามที่เรารู้สึก วิธีที่เรารู้สึกว่าทำเช่นนั้นคือการลบส่วนประกอบข้อมูลทั้งหมดที่ไม่ได้มีส่วนร่วมในการปรับปรุงแบบจำลองทางสถิติของเราอย่างจริงจัง