ชุดเข้ารหัสอัตโนมัติและเครือข่ายประสาทหลายชั้นนั้นแตกต่างกัน ในทางปฏิบัติคุณจะมีเครือข่ายทั้งสองที่แชร์น้ำหนักและอาจแชร์บัฟเฟอร์หน่วยความจำ ดังนั้นในการติดตั้งของคุณเครือข่ายทั้งสองจึงเชื่อมโยงกัน
โดยทั่วไปแล้วระบบเข้ารหัสอัตโนมัติจะได้รับการฝึกอบรมในแบบที่ไม่มีผู้ดูแลโลภและชาญฉลาด (ไม่มีป้ายกำกับเริ่มการฝึกอบรมด้วยเลเยอร์แรกของเครือข่ายแล้วเพิ่มเลเยอร์ใหม่ตามที่คุณไป) น้ำหนักสามารถเรียนรู้ได้โดยใช้เทคนิคที่หลากหลายตั้งแต่การไล่ระดับสีแบบ "แบทช์" (โปรดอย่าทำอย่างนั้น) ถึงโคตรลาดลงของมินิแบทช์ (SGD) ถึงวิธีเสมือนกึ่งนิวตันเช่น L-BFGS
แนวคิดก็คือว่าน้ำหนักที่เรียนรู้ในลักษณะที่ไม่ได้รับการดูแลเพื่อลดข้อผิดพลาดในการสร้างใหม่สำหรับงานการเรียนรู้การเป็นตัวแทนเสนอเป็นจุดเริ่มต้นที่ดีในการเริ่มต้นเครือข่ายสำหรับงานที่มีการแบ่งแยกเช่นการจำแนกหรือความคล้ายคลึง นั่นคือเครือข่ายเรียนรู้บางอย่างเกี่ยวกับการแจกจ่ายพื้นฐานโดยดูที่ข้อมูลที่ไม่มีชื่อกำกับทำให้สามารถแยกแยะระหว่างข้อมูลที่มีป้ายกำกับได้ อย่างไรก็ตามน้ำหนักยังคงต้อง "ปรับ" สำหรับงานใหม่นี้ ดังนั้นเพิ่มเลเยอร์การถดถอยโลจิสติกที่ด้านบนของเครือข่ายแล้วทำการเรียนรู้ภายใต้การดูแลด้วยชุดข้อมูลที่มีป้ายกำกับ ขั้นตอนการปรับแต่งอย่างละเอียดจะทำการไล่ระดับสีและปรับน้ำหนักสำหรับทุกชั้นในเครือข่ายพร้อมกัน
ข้อดีของวิธีนี้คือการฝึกมุ้งอวน:
- การฝึกอบรมแบบไม่สำรองข้อมูลช่วยให้คุณแสดงข้อมูลเครือข่ายได้มากขึ้นเนื่องจากการรับชุดข้อมูลขนาดใหญ่ที่ไม่ได้รับการจัดการนั้นง่ายกว่าการติดป้ายกำกับ
- คุณสามารถใช้เครือข่ายที่ได้รับการฝึกฝนมาก่อนว่าเป็น "จุดกระโดด" สำหรับฝึกอบรมตัวแยกประเภทใหม่ดังนั้นคุณไม่ต้องเริ่มจากศูนย์ทุกครั้ง
สำหรับกระดาษให้ดูซ้อน denoising autoencoders: การเรียนรู้การแสดงที่มีประโยชน์ในเครือข่ายที่ลึกกับเกณฑ์