ในความเป็นจริงเวกเตอร์ผลลัพธ์ไม่ได้คำนวณจากอินพุตโดยใช้การดำเนินการทางคณิตศาสตร์ใด ๆ แต่จะใช้จำนวนเต็มอินพุตแต่ละตัวเป็นดัชนีเพื่อเข้าถึงตารางที่มีเวกเตอร์ที่เป็นไปได้ทั้งหมด นั่นคือเหตุผลที่คุณต้องระบุขนาดของคำศัพท์เป็นอาร์กิวเมนต์แรก (เพื่อให้สามารถเริ่มต้นตาราง)
แอปพลิเคชันทั่วไปของเลเยอร์นี้ใช้สำหรับการประมวลผลข้อความ ลองมาดูตัวอย่างง่ายๆ ชุดการฝึกอบรมของเราประกอบด้วยเพียงสองวลี:
หวังว่าจะได้พบคุณเร็ว ๆ นี้
ยินดีที่ได้พบคุณอีกครั้ง
ดังนั้นเราสามารถเข้ารหัสวลีเหล่านี้โดยกำหนดจำนวนเต็มจำนวนเฉพาะแต่ละคำ (ตามลำดับที่ปรากฏในชุดข้อมูลการฝึกอบรมของเราเป็นต้น) จากนั้นวลีของเราสามารถเขียนใหม่เป็น:
[0, 1, 2, 3, 4]
[5, 1, 2, 3, 6]
ตอนนี้จินตนาการว่าเราต้องการฝึกเครือข่ายที่มีเลเยอร์แรกเป็นเลเยอร์การฝัง ในกรณีนี้เราควรเริ่มต้นดังนี้
Embedding(7, 2, input_length=5)
อาร์กิวเมนต์แรก (7) คือจำนวนคำที่แตกต่างในชุดฝึกอบรม อาร์กิวเมนต์ที่สอง (2) ระบุขนาดของเวกเตอร์การฝัง input_length argumet ของหลักสูตรกำหนดขนาดของลำดับการป้อนข้อมูลแต่ละ
เมื่อเครือข่ายได้รับการฝึกอบรมเราสามารถรับน้ำหนักของเลเยอร์การฝังซึ่งในกรณีนี้จะมีขนาด (7, 2) และสามารถคิดเป็นตารางที่ใช้ในการแม็พจำนวนเต็มเพื่อฝังเวกเตอร์:
+------------+------------+
| index | Embedding |
+------------+------------+
| 0 | [1.2, 3.1] |
| 1 | [0.1, 4.2] |
| 2 | [1.0, 3.1] |
| 3 | [0.3, 2.1] |
| 4 | [2.2, 1.4] |
| 5 | [0.7, 1.7] |
| 6 | [4.1, 2.0] |
+------------+------------+
ดังนั้นตาม embeddings เหล่านี้วลีฝึกอบรมที่สองของเราจะแสดงเป็น:
[[0.7, 1.7], [0.1, 4.2], [1.0, 3.1], [0.3, 2.1], [4.1, 2.0]]
มันอาจดูเข้าใจง่ายในตอนแรก แต่เอ็นจิ้นการสร้างความแตกต่างโดยอัตโนมัติ (เช่น Tensorflow หรือ Theano) จัดการเพื่อเพิ่มประสิทธิภาพเวกเตอร์เหล่านี้ที่เกี่ยวข้องกับแต่ละจำนวนเต็มอินพุทเหมือนกับพารามิเตอร์อื่น ๆ ของแบบจำลองของคุณ นอกจากนี้ยังเป็นที่น่าสนใจที่จะใช้ embeddings เรียนรู้โดยวิธีการอื่น ๆ / คนในโดเมนที่แตกต่างกัน (ดูhttps://blog.keras.io/using-pre-trained-word-embeddings-in-a-keras-model.html ) เป็น เสร็จใน [1]
[1] López-Sánchez, D. , Herrero, JR, Arrieta, AG, & Corchado, JM Hybridizing การเรียนรู้การวัดแบบเมตริกและเหตุผลเชิงกรณีสำหรับการตรวจจับ clickbait ที่ปรับเปลี่ยนได้ ข่าวกรองประยุกต์, 1-16