ฉันจะบอกว่าอัลกอริทึม word2vec ขึ้นอยู่กับทั้งสอง
เมื่อคนพูดdistributional representation
พวกเขามักจะหมายถึงลักษณะทางภาษา: ความหมายคือบริบทรู้คำศัพท์จาก บริษัท และคำพูดที่มีชื่อเสียงอื่น ๆ
แต่เมื่อมีคนพูดว่าdistributed representation
ส่วนใหญ่ไม่มีอะไรเกี่ยวข้องกับภาษาศาสตร์ มันเกี่ยวกับวิทยาศาสตร์คอมพิวเตอร์มากขึ้น ถ้าฉันเข้าใจ Mikolov และอื่น ๆ อย่างถูกต้องคำ
distributed
ในเอกสารของพวกเขาหมายความว่าแต่ละองค์ประกอบของการเป็นตัวแทนเวกเตอร์ไม่มีความหมายของตัวเอง คุณลักษณะที่ตีความได้ (ตัวอย่างเช่นบริบทของคำในกรณีของ word2vec) จะถูกซ่อนและdistributed
ในหมู่องค์ประกอบเวกเตอร์ที่ไม่สามารถตีความได้: แต่ละองค์ประกอบมีหน้าที่รับผิดชอบต่อคุณสมบัติที่ตีความได้หลายประการและคุณลักษณะที่ตีความได้แต่ละอย่าง
ดังนั้น word2vec (และ doc2vec) ใช้การแทนแบบกระจายทางเทคนิคเป็นวิธีการแทนความหมายของคำศัพท์ และในเวลาเดียวกันมันก็ขึ้นอยู่กับแนวคิดตามสมมติฐานการกระจาย: มันทำงานได้เพียงเพราะสมมติฐานการกระจายเป็นจริง (ความหมายของคำมีความสัมพันธ์กับบริบททั่วไปของพวกเขา)
แต่แน่นอนบ่อยครั้งที่ข้อตกลงdistributed
และdistributional
ใช้แทนกันได้เพิ่มความเข้าใจผิด :)