โซลูชัน Text-to-Speech ที่ดีสำหรับ Windows [ปิด]


9

ฉันใช้ Windows 7 และฉันรู้ว่ามันมีความสามารถในการอ่านข้อความในแอปพลิเคชันของฉัน แต่ฉันกำลังมองหายูทิลิตี้ที่ดีในการบันทึกข้อความเป็นไฟล์ wav หรือ mp3 มันอาจถูกสร้างไว้ในระบบปฏิบัติการแล้ว แต่ปลอมตัวอย่างชาญฉลาด ฉันรู้ว่าฉันสามารถเขียนโปรแกรมเพื่อเรียก API ซึ่งเป็นขั้นตอนต่อไปของฉันหากไม่มีวิธีแก้ไขที่ดีอยู่แล้ว

ฉันชอบคุณภาพของระบบAT&Tมาก แต่มีข้อ จำกัด ที่ค่อนข้างสูงในการใช้ MP3 ที่ผลิต ฉันต้องการใช้พวกเขาในพอดคาสต์ของฉัน

เว็บเบสก็ใช้ได้เช่นกันตราบใดที่มันสร้างไฟล์เสียงที่ค่อนข้างไม่มีข้อ จำกัด (โดเมนสาธารณะหรือครีเอทีฟคอมมอนส์) ได้อย่างง่ายดาย Wav, MP3 หรือไฟล์เสียงมาตรฐานอื่น ๆ โดยธรรมชาติแล้วฉันชอบแหล่งโอเพนซอร์สหรือเสรีมากกว่าเชิงพาณิชย์ แต่นั่นไม่ใช่ข้อกำหนด

คำตอบ:


4

ฉันได้พยายามeSpeak , เทศกาลและMaryTTS พวกเขาสร้างเสียงที่เข้าใจได้เป็นส่วนใหญ่ แต่ไม่เป็นธรรมชาติ แม้ว่าจะมีการดาวน์โหลดเสียงเพิ่มเติมสำหรับระบบเหล่านี้ (เช่น Mbrola, CMU Arctic) เสียงก็ยังไม่ค่อยดีนัก

เสียงของIVONAนั้นดีที่สุดเท่าที่ฉันเคยได้ยินมา พวกเขาให้การสาธิตฟรี 30 วันซึ่งเพียงพอหากคุณมีงานทำ หลังจากนั้นพวกเขาจะอยู่ที่ $ 45 / เสียง อเมซอนเพิ่งซื้อ บริษัท เพื่อให้คุณรู้ว่ามันแข็งแกร่ง ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ )

พวกเขาทำงานกับอินเทอร์เฟซ SAPI ของ Microsoft ซึ่งหมายถึงเสียงที่มีให้กับโปรแกรมใด ๆ ที่สนับสนุนนั้น (เช่น Adobe Reader) ฉันใช้มันกับโปรแกรมText To Wavซึ่งดีสำหรับการแปลงไฟล์ข้อความเป็นไฟล์เวฟ

แก้ไข

ที่จริงแค่อ่านคำถามของคุณอีกครั้งและฉันคิดว่าสำหรับการใช้ที่ไม่ใช่ส่วนตัว (เช่นพอดคาสต์) ราคาอาจสูงขึ้นมากสำหรับ IVONA ในกรณีนี้ฉันจะบอกว่าตรวจสอบ MaryTTS


ฉันเพิ่งฟัง MaryTTS และมันก็ทำให้เกิดเสียงเอ๊บ ๆ และเทศกาลขึ้น
สามสิบสาม

MaryTTS มีเสียงที่ยอดเยี่ยมและมันก็ฟรีเช่นกัน
Jim McKeeth

ดูเหมือนว่าข้อความเป็นคำพูดสำหรับเสียง Ivona สำหรับการใช้เดสก์ท็อปตอนนี้มีให้โดยTextAloud
ผู้ใช้

6

eSpeakนั้นฟรีและโอเพ่นซอร์สและให้ทุกสิ่งที่คุณต้องการ

มันสามารถเรียกใช้เป็นโปรแกรมบรรทัดคำสั่งเพื่อพูดข้อความจากไฟล์หรือจาก stdin
นอกจากนี้ยังมีเวอร์ชันห้องสมุดที่ใช้ร่วมกัน

* รวมถึงเสียงที่แตกต่างซึ่งสามารถเปลี่ยนลักษณะได้
* สามารถสร้างเอาต์พุตเสียงพูดเป็นไฟล์ WAV
* รองรับ SSML (ภาษามาร์กอัปการสังเคราะห์เสียงพูด) (ไม่สมบูรณ์),
  และ HTML
* ขนาดกะทัดรัด โปรแกรมและข้อมูลรวมถึงหลายภาษา
  รวมประมาณ 1 เมกกะไบท์
* สามารถแปลข้อความเป็นรหัสฟอนิมได้ดังนั้นจึงสามารถนำไปปรับใช้เป็นส่วนหน้าได้
  สิ้นสุดสำหรับเครื่องมือสังเคราะห์เสียงพูดอีกอัน
* ศักยภาพสำหรับภาษาอื่น ๆ หลายอย่างรวมอยู่ในขั้นตอนที่แตกต่างกัน
  ของความคืบหน้า ความช่วยเหลือจากเจ้าของภาษาสำหรับภาษาเหล่านี้หรือภาษาอื่น ๆ คือ
  ยินดี
* เครื่องมือในการพัฒนาสำหรับการผลิตและการปรับแต่งข้อมูลหน่วยเสียง
* เขียนเป็น C ++

แม้ว่า eSpeak จะดูน่าสนใจ แต่ก็สามารถได้รับประโยชน์จากคำแนะนำ "เริ่มต้นอย่างรวดเร็ว" ขอบคุณสำหรับเคล็ดลับแม้ว่า ฉันจะทำงานกับมันต่อไป
Jim McKeeth

+1 สำหรับ eSpeak ฉันกำลังมองหาแอปที่จะทำสิ่งนี้มาเป็นเวลานาน ขอบคุณมาก!
Axxmasterr
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.