ฉันได้ศึกษาสถาปัตยกรรมของเครือข่ายประสาทเทียมที่แนะนำโดย Yann LeCun และเพื่อนร่วมงานของเขาในปี 1994 เพื่อรับรู้ลายเซ็น ( “ การตรวจสอบลายเซ็นโดยใช้เครือข่ายประสาทเทียมหน่วงเวลาสยาม” .pdf , NIPS 1994)
ฉันเข้าใจแนวคิดทั่วไปของสถาปัตยกรรมนี้ แต่ฉันไม่เข้าใจจริงๆว่าการ backpropagation ทำงานอย่างไรในกรณีนี้ ฉันไม่เข้าใจว่าค่าเป้าหมายของเครือข่ายประสาทคืออะไรซึ่งจะทำให้ backpropagation ตั้งค่าน้ำหนักของแต่ละเซลล์ประสาทอย่างเหมาะสม
ในสถาปัตยกรรมนี้อัลกอริธึมคำนวณความคล้ายคลึงโคไซน์ระหว่างการแสดงขั้นสุดท้ายของเครือข่ายนิวรัลสองแห่งกระดาษระบุ: "ผลลัพธ์ที่ต้องการสำหรับมุมเล็ก ๆ ระหว่างเอาท์พุทของเครือข่ายย่อยทั้งสอง (f1 และ f2) และมุมกว้างถ้าหนึ่งในลายเซ็นนั้นเป็นของปลอม "
ฉันไม่เข้าใจจริง ๆ ว่าพวกเขาสามารถใช้ฟังก์ชันเลขฐานสองได้อย่างไร (ความคล้ายคลึงโคไซน์ระหว่างเวกเตอร์สองตัว) เป็นเป้าหมายในการเรียกใช้การขยายภาพย้อนหลัง
การคำนวณ backpropagation ในเครือข่ายประสาทเทียมของสยามเป็นอย่างไร?