มีความแตกต่างระหว่างการฝึกอบรม autoencoder ที่ซ้อนกันและเครือข่ายประสาท 2 ชั้นหรือไม่?


14

สมมติว่าฉันกำลังเขียนอัลกอริทึมสำหรับการสร้าง autoencoder 2 ชั้นซ้อนกันและเครือข่ายประสาท 2 ชั้น พวกเขาเป็นสิ่งเดียวกันหรือแตกต่างกันอย่างไร

สิ่งที่ฉันเข้าใจคือเมื่อฉันสร้างตัวเข้ารหัสอัตโนมัติแบบซ้อนกันฉันจะสร้างเลเยอร์ทีละชั้น สำหรับเครือข่ายประสาทฉันจะเริ่มต้นพารามิเตอร์ทั้งหมดใน netowork และจากนั้นสำหรับแต่ละจุดข้อมูลฉันผ่านมันผ่านเครือข่ายและคำนวณการสูญเสีย (เช่นระยะห่างจากนิวเคลียส) และทำการ backpropagation

คำตอบ:


16

ชุดเข้ารหัสอัตโนมัติและเครือข่ายประสาทหลายชั้นนั้นแตกต่างกัน ในทางปฏิบัติคุณจะมีเครือข่ายทั้งสองที่แชร์น้ำหนักและอาจแชร์บัฟเฟอร์หน่วยความจำ ดังนั้นในการติดตั้งของคุณเครือข่ายทั้งสองจึงเชื่อมโยงกัน

โดยทั่วไปแล้วระบบเข้ารหัสอัตโนมัติจะได้รับการฝึกอบรมในแบบที่ไม่มีผู้ดูแลโลภและชาญฉลาด (ไม่มีป้ายกำกับเริ่มการฝึกอบรมด้วยเลเยอร์แรกของเครือข่ายแล้วเพิ่มเลเยอร์ใหม่ตามที่คุณไป) น้ำหนักสามารถเรียนรู้ได้โดยใช้เทคนิคที่หลากหลายตั้งแต่การไล่ระดับสีแบบ "แบทช์" (โปรดอย่าทำอย่างนั้น) ถึงโคตรลาดลงของมินิแบทช์ (SGD) ถึงวิธีเสมือนกึ่งนิวตันเช่น L-BFGS

แนวคิดก็คือว่าน้ำหนักที่เรียนรู้ในลักษณะที่ไม่ได้รับการดูแลเพื่อลดข้อผิดพลาดในการสร้างใหม่สำหรับงานการเรียนรู้การเป็นตัวแทนเสนอเป็นจุดเริ่มต้นที่ดีในการเริ่มต้นเครือข่ายสำหรับงานที่มีการแบ่งแยกเช่นการจำแนกหรือความคล้ายคลึง นั่นคือเครือข่ายเรียนรู้บางอย่างเกี่ยวกับการแจกจ่ายพื้นฐานโดยดูที่ข้อมูลที่ไม่มีชื่อกำกับทำให้สามารถแยกแยะระหว่างข้อมูลที่มีป้ายกำกับได้ อย่างไรก็ตามน้ำหนักยังคงต้อง "ปรับ" สำหรับงานใหม่นี้ ดังนั้นเพิ่มเลเยอร์การถดถอยโลจิสติกที่ด้านบนของเครือข่ายแล้วทำการเรียนรู้ภายใต้การดูแลด้วยชุดข้อมูลที่มีป้ายกำกับ ขั้นตอนการปรับแต่งอย่างละเอียดจะทำการไล่ระดับสีและปรับน้ำหนักสำหรับทุกชั้นในเครือข่ายพร้อมกัน

ข้อดีของวิธีนี้คือการฝึกมุ้งอวน:

  1. การฝึกอบรมแบบไม่สำรองข้อมูลช่วยให้คุณแสดงข้อมูลเครือข่ายได้มากขึ้นเนื่องจากการรับชุดข้อมูลขนาดใหญ่ที่ไม่ได้รับการจัดการนั้นง่ายกว่าการติดป้ายกำกับ
  2. คุณสามารถใช้เครือข่ายที่ได้รับการฝึกฝนมาก่อนว่าเป็น "จุดกระโดด" สำหรับฝึกอบรมตัวแยกประเภทใหม่ดังนั้นคุณไม่ต้องเริ่มจากศูนย์ทุกครั้ง

สำหรับกระดาษให้ดูซ้อน denoising autoencoders: การเรียนรู้การแสดงที่มีประโยชน์ในเครือข่ายที่ลึกกับเกณฑ์


ฉันสับสนเกี่ยวกับขั้นตอนที่สองที่คุณฝึกฝนเลเยอร์การเข้ารหัสด้วยเลเยอร์การจัดหมวดหมู่ (เช่นเลเยอร์ softmax) สำหรับงานการจัดหมวดหมู่ คุณใช้ชุดข้อมูลการฝึกซ้ำอีกครั้งเพื่อให้ส่วนนี้เพื่อเรียนรู้ฉลากหรือไม่ ฉันพบสิ่งแปลก ๆ นี้เพราะชุดการฝึกอบรมใช้เพื่อเรียนรู้การประมาณตัวเองเท่านั้น
ผู้ชายที่

มันไม่สมเหตุสมผลหากคุณมีข้อมูลกำกับอยู่ทั้งหมด มันจะยิ่งมากขึ้นสำหรับสถานการณ์ที่คุณมีข้อมูลที่ไม่มีป้ายกำกับจำนวนมากเพื่อเตรียมการและจากนั้นใช้ข้อมูล "การฝึกอบรม" ที่มีป้ายกำกับเพื่อปรับแต่ง
meow
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.