Alexaของ Amazon , Mixของ Nuance และWit.aiของ Facebook ทั้งหมดใช้ระบบที่คล้ายกันเพื่อระบุวิธีแปลงคำสั่งข้อความให้เป็นเจตนา - นั่นคือสิ่งที่คอมพิวเตอร์จะเข้าใจ ฉันไม่แน่ใจว่าชื่อ "ทางการ" สำหรับสิ่งนี้คืออะไร แต่ฉันเรียกมันว่า "การจดจำเจตนา" โดยทั่วไปวิธีที่จะไปจาก "กรุณาตั้งค่าไฟของฉันถึง 50% ความสว่าง" lights.setBrightness(0.50)
เพื่อ
วิธีที่พวกเขาระบุไว้คือการให้นักพัฒนาจัดทำรายการ "คำพูดตัวอย่าง" ซึ่งเกี่ยวข้องกับเจตนาและติดแท็กเลือกที่ตั้งของ "เอนทิตี" (โดยทั่วไปพารามิเตอร์) นี่คือตัวอย่างจาก Wit.ai:
คำถามของฉันคือระบบเหล่านี้ทำงานอย่างไร เนื่องจากมันคล้ายกันมากฉันจึงคิดว่ามีงานน้ำเชื้อบางอย่างที่พวกเขาใช้ทั้งหมด ไม่มีใครรู้ว่ามันคืออะไร?
ที่น่าสนใจHoundifyใช้ระบบที่แตกต่างกันมากขึ้นเช่น ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]
regexes: ฉันคิดว่ามันรวมเข้ากับการค้นหาลำแสงของระบบรู้จำเสียงในขณะที่ Alexa, Wit.ai และ Mix ดูเหมือนจะแยก Speech-> Text และ Text-> ระบบ Intent
แก้ไข:ผมพบว่าเป็นจุดเริ่มต้น - กลไกมนุษย์ - ปฏิสัมพันธ์หุ่นยนต์ผ่านทางการคำสั่งเสียง มันใช้สิ่งที่เรียกว่าการวิเคราะห์ความหมายแฝงเพื่อเปรียบเทียบคำพูด ฉันจะอ่านมัน อย่างน้อยมันก็ทำให้ฉันเป็นจุดเริ่มต้นในเครือข่ายการอ้างอิง
แก้ไข 2: LSA เป็นหลักเปรียบเทียบคำที่ใช้ (Bag of Words) ในแต่ละย่อหน้าของข้อความ ฉันไม่เห็นว่ามันจะทำงานได้ดีมากสำหรับกรณีนี้เพราะสูญเสียการเรียงลำดับคำทั้งหมด แม้ว่าการเรียงคำอาจจะไม่สำคัญสำหรับคำสั่งประเภทนี้
แก้ไข 3: โมเดล Markov ที่ซ่อนหัวข้อดูเหมือนว่าพวกเขาน่าสนใจ