ทางเลือกในการพูดคุยกับมังกรโดยธรรมชาติ?


31

มีทางเลือกอื่นสำหรับโปรแกรมนี้หรือไม่?


คุณสนใจไหมว่าเป็น FOSS หรือไม่? ควรทำงานออฟไลน์หรือไม่ สำหรับการใช้ภาษาอังกฤษเท่านั้น?
Pablo A

คำตอบ:


18

มีบทความทั้งหมดเกี่ยวกับ Wikipedia ที่ทุ่มเทให้กับปัญหา

น่าเสียดายที่ดูเหมือนว่าในปัจจุบันไม่มีวิธีแก้ปัญหาใดที่ทำงานได้ดี แต่มีรายการโครงการขนาดใหญ่ที่กำลังดำเนินการอยู่

คุณอาจต้องการค้นหาคำตอบเพื่อดูว่ามีสิ่งใดที่เหมาะกับความต้องการของคุณหรือไม่

ตุ่นปากเป็ด :

มีเสมอไปได้ที่จะวิ่งมังกรธรรมชาติพูดโดยใช้ไวน์ โครงการ Platypusคือการสร้างซอฟต์แวร์เพื่อเปลี่ยนเส้นทางออกมังกรลินุกซ์ / X โปรแกรมใด ๆ และพวกเขาอยู่ห่างไกลมากพร้อม

คุณควรดูที่นี่อย่างแน่นอน


5

สำหรับคำตอบของการปรับปรุงที่นี่เป็นบทความจากมีนาคม 2018: เครื่องมือที่ดีที่สุดฟรีลินุกซ์การรู้จำเสียง - ซอฟต์แวร์โอเพ่นซอร์ส

บทความนี้เน้นซอฟต์แวร์รู้จำเสียงโอเพ่นซอร์สที่ดีที่สุดสำหรับ Linux หมายเหตุซอฟต์แวร์บางตัวอยู่ในช่วงเริ่มต้นของการพัฒนาจึงไม่พร้อมสำหรับการนำไปใช้อย่างแพร่หลาย

ก่อนที่จะตรวจสอบคำแนะนำของเราแจสเปอร์สมควรได้รับการกล่าวถึงเป็นพิเศษ มันเป็นแพลตฟอร์มโอเพ่นซอร์สที่ยอดเยี่ยมสำหรับการพัฒนาแอพพลิเคชั่นที่ควบคุมเสียงได้ตลอดเวลา คุณอาจสงสัยว่าทำไม HTK จึงไม่ปรากฏด้านล่าง แน่นอน HTK เป็นชุดเครื่องมือรู้จำเสียงพูดที่เป็นที่นิยม แต่ HTK ไม่มีสิทธิ์เข้าร่วมในโซลูชันที่แนะนำ ไม่ใช่เพราะ Microsoft เป็นเจ้าของลิขสิทธิ์ แต่เป็นเพราะซอฟต์แวร์ที่เป็นกรรมสิทธิ์

มาสำรวจ 6 เครื่องมือรู้จำเสียงพูดฟรี สำหรับแต่ละชื่อหนังสือเราได้รวบรวมหน้าพอร์ทัลของตัวเองพร้อมคำอธิบายแบบเต็มและการวิเคราะห์เชิงลึกของคุณสมบัติ

เครื่องมือรู้จำเสียงพูดโอเพ่นซอร์ส

  • DeepSpeech TensorFlow การใช้งานสถาปัตยกรรม DeepSpeech ของไป่ตู้
  • Julius Two-pass โปรแกรมจดจำคำพูดที่มีขนาดใหญ่อย่างต่อเนื่อง
  • ซอฟต์แวร์รู้จำเสียงSimon Flexible
  • ระบบรู้จำเสียงพูดCMUSphinxสำหรับแอปพลิเคชันมือถือและเซิร์ฟเวอร์
  • deepspeech.pytorch การนำ DeepSpeech2 ไปใช้โดยใช้ Baidu Warp-CTC
  • ชุดเครื่องมือKaldi C ++ ออกแบบมาสำหรับนักวิจัยการรู้จำเสียง

4

คุณสามารถติดตั้ง Chromium 11 เวอร์ชั่นจาก ppa ppa:chromium-daily/stable( วิธีเพิ่ม PPA ) และเพิ่ม --enable-speech-input ไปยังส่วนท้ายของ launcher

ป้อนคำอธิบายรูปภาพที่นี่

ตอนนี้เยี่ยมชมเว็บไซต์นี้และโห่! Speech-to-Text บน ubuntu โดยใช้ html5

ฉันอ่านที่นี่ว่าถ้าคุณพูดช้ามันจะแม่นยำมากขึ้น

ป้อนคำอธิบายรูปภาพที่นี่


3

freespeech-VR

เป็นคำพูดโอเพ่นซอร์สที่ดีสำหรับเอ็นจิ้นข้อความ นี่คือซอร์สโค้ด ( บน Google Code )

โปรดทราบว่าใช้การกำหนดค่าเล็กน้อยซึ่งขัดน้อยกว่าการกำหนดค่าของ Dragon Naturally Speaking


2
FreeSpeech ดูเหมือนจะไม่ได้รับการดูแล ไม่ได้เสนอ ppa ตั้งแต่ Ubuntu 10.
JellicleCat

2
ตอนนี้มีพอร์ต Python 3ของ FreeSpeech
dotancohen

1

Dictanote

เพื่อขยายคำตอบของ Alaukik มีแอพที่สร้างขึ้นจากความสามารถในการรู้จำเสียงของ Chrome

ฉันใช้Dictanoteเป็นการส่วนตัว(คล้ายกับ Dragon มาก) นี่คือการเชื่อมโยงไปยังแอปโครเมี่ยม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.