ฉันจะบอกว่าอัลกอริทึม word2vec ขึ้นอยู่กับทั้งสอง
เมื่อคนพูดdistributional representationพวกเขามักจะหมายถึงลักษณะทางภาษา: ความหมายคือบริบทรู้คำศัพท์จาก บริษัท และคำพูดที่มีชื่อเสียงอื่น ๆ
แต่เมื่อมีคนพูดว่าdistributed representationส่วนใหญ่ไม่มีอะไรเกี่ยวข้องกับภาษาศาสตร์ มันเกี่ยวกับวิทยาศาสตร์คอมพิวเตอร์มากขึ้น ถ้าฉันเข้าใจ Mikolov และอื่น ๆ อย่างถูกต้องคำ
distributedในเอกสารของพวกเขาหมายความว่าแต่ละองค์ประกอบของการเป็นตัวแทนเวกเตอร์ไม่มีความหมายของตัวเอง คุณลักษณะที่ตีความได้ (ตัวอย่างเช่นบริบทของคำในกรณีของ word2vec) จะถูกซ่อนและdistributedในหมู่องค์ประกอบเวกเตอร์ที่ไม่สามารถตีความได้: แต่ละองค์ประกอบมีหน้าที่รับผิดชอบต่อคุณสมบัติที่ตีความได้หลายประการและคุณลักษณะที่ตีความได้แต่ละอย่าง
ดังนั้น word2vec (และ doc2vec) ใช้การแทนแบบกระจายทางเทคนิคเป็นวิธีการแทนความหมายของคำศัพท์ และในเวลาเดียวกันมันก็ขึ้นอยู่กับแนวคิดตามสมมติฐานการกระจาย: มันทำงานได้เพียงเพราะสมมติฐานการกระจายเป็นจริง (ความหมายของคำมีความสัมพันธ์กับบริบททั่วไปของพวกเขา)
แต่แน่นอนบ่อยครั้งที่ข้อตกลงdistributedและdistributionalใช้แทนกันได้เพิ่มความเข้าใจผิด :)