คุณมาถูกทางแล้ว
Invarianceหมายความว่าคุณสามารถรับรู้วัตถุเป็นวัตถุแม้ว่าลักษณะที่ปรากฏจะแตกต่างกันไปในทางใดทางหนึ่ง สิ่งนี้เป็นสิ่งที่ดีเพราะมันรักษาเอกลักษณ์ของวัตถุประเภท (ฯลฯ ) ตลอดการเปลี่ยนแปลงเฉพาะของอินพุตภาพเช่นตำแหน่งสัมพัทธ์ของวิวเวอร์ / กล้องและวัตถุ
ภาพด้านล่างมีหลายมุมมองของรูปปั้นเดียวกัน คุณ (และเครือข่ายประสาทเทียมที่ผ่านการฝึกอบรมมาเป็นอย่างดี) สามารถรับรู้ว่าวัตถุเดียวกันปรากฏในทุกภาพแม้ว่าค่าพิกเซลที่แท้จริงจะแตกต่างกันมาก
โปรดทราบว่าการแปลที่นี่มีความหมายเฉพาะในการมองเห็นยืมมาจากรูปทรงเรขาคณิต ไม่ได้อ้างถึงการแปลงประเภทใด ๆ ซึ่งแตกต่างจากการพูดคำแปลจากฝรั่งเศสเป็นอังกฤษหรือระหว่างรูปแบบไฟล์ แต่หมายความว่าแต่ละจุด / พิกเซลในภาพถูกย้ายในปริมาณที่เท่ากันในทิศทางเดียวกัน อีกวิธีหนึ่งคุณสามารถนึกถึงต้นกำเนิดว่าได้รับการเปลี่ยนจำนวนเท่ากันในทิศทางตรงกันข้าม ตัวอย่างเช่นเราสามารถสร้างภาพที่ 2 และ 3 ในแถวแรกจากภาพแรกโดยเลื่อนแต่ละพิกเซล 50 หรือ 100 พิกเซลไปทางขวา
หนึ่งสามารถแสดงให้เห็นว่าผู้ประกอบการ convutes commutes เกี่ยวกับการแปล หากคุณโน้มน้าวด้วยมันไม่สำคัญว่าคุณจะแปลเอาต์พุตที่ได้รับการแปลหรือถ้าคุณแปลหรือก่อนจากนั้นจึงโน้มน้าวพวกเขา วิกิพีเดียมีมากขึ้นเล็กน้อย
fgf∗gfg
วิธีการหนึ่งในการจดจำวัตถุที่ไม่แปรเปลี่ยนคือการใช้ "เทมเพลต" ของวัตถุและโน้มน้าวกับทุกตำแหน่งที่เป็นไปได้ของวัตถุในภาพ หากคุณได้รับการตอบกลับจำนวนมากในสถานที่หนึ่งแสดงว่าวัตถุที่มีลักษณะคล้ายกับแม่แบบนั้นอยู่ที่ตำแหน่งนั้น วิธีนี้มักจะเรียกว่าแม่แบบจับคู่
Invariance vs. Equivariance
คำตอบของ Santanu_Pattanayak ( ที่นี่ ) ชี้ให้เห็นว่ามีความแตกต่างระหว่างการแปรปรวนของการแปลและการแปลความเท่าเทียมกัน ความไม่แปรเปลี่ยนของการแปลหมายความว่าระบบสร้างการตอบสนองที่เหมือนกันทุกประการโดยไม่คำนึงถึงว่าข้อมูลถูกเปลี่ยนไปอย่างไร ตัวอย่างเช่นเครื่องตรวจจับใบหน้าอาจรายงาน "FACE FOUND" สำหรับภาพทั้งสามในแถวด้านบน Equivariance หมายถึงระบบทำงานได้ดีเท่าเทียมกันทั่วทั้งตำแหน่ง แต่การตอบสนองจะเปลี่ยนไปตามตำแหน่งของเป้าหมาย ตัวอย่างเช่นแผนที่ความร้อนของ "ใบหน้า - iness" จะมีการกระแทกที่คล้ายกันที่ด้านซ้าย, กลาง, และขวาเมื่อมันประมวลผลแถวแรกของภาพ
นี่เป็นบางครั้งความแตกต่างที่สำคัญ แต่หลายคนเรียกปรากฏการณ์ทั้งสองว่า "invariance" โดยเฉพาะอย่างยิ่งเนื่องจากมันเป็นเรื่องไม่สำคัญที่จะแปลงการตอบสนองที่เท่าเทียมกันให้กลายเป็นสิ่งที่ไม่แปรเปลี่ยน - เพียงไม่สนใจข้อมูลตำแหน่งทั้งหมด)