โซลูชัน Text-to-Speech ที่ดีสำหรับ Windows [ปิด]

9

ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้

ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง

ปิดให้บริการใน7 ปีที่ผ่านมา

ฉันใช้ Windows 7 และฉันรู้ว่ามันมีความสามารถในการอ่านข้อความในแอปพลิเคชันของฉัน แต่ฉันกำลังมองหายูทิลิตี้ที่ดีในการบันทึกข้อความเป็นไฟล์ wav หรือ mp3 มันอาจถูกสร้างไว้ในระบบปฏิบัติการแล้ว แต่ปลอมตัวอย่างชาญฉลาด ฉันรู้ว่าฉันสามารถเขียนโปรแกรมเพื่อเรียก API ซึ่งเป็นขั้นตอนต่อไปของฉันหากไม่มีวิธีแก้ไขที่ดีอยู่แล้ว

ฉันชอบคุณภาพของระบบAT&Tมาก แต่มีข้อ จำกัด ที่ค่อนข้างสูงในการใช้ MP3 ที่ผลิต ฉันต้องการใช้พวกเขาในพอดคาสต์ของฉัน

เว็บเบสก็ใช้ได้เช่นกันตราบใดที่มันสร้างไฟล์เสียงที่ค่อนข้างไม่มีข้อ จำกัด (โดเมนสาธารณะหรือครีเอทีฟคอมมอนส์) ได้อย่างง่ายดาย Wav, MP3 หรือไฟล์เสียงมาตรฐานอื่น ๆ โดยธรรมชาติแล้วฉันชอบแหล่งโอเพนซอร์สหรือเสรีมากกว่าเชิงพาณิชย์ แต่นั่นไม่ใช่ข้อกำหนด

— จิม McKeeth
แหล่งที่มา

4

ฉันได้พยายามeSpeak , เทศกาลและMaryTTS พวกเขาสร้างเสียงที่เข้าใจได้เป็นส่วนใหญ่ แต่ไม่เป็นธรรมชาติ แม้ว่าจะมีการดาวน์โหลดเสียงเพิ่มเติมสำหรับระบบเหล่านี้ (เช่น Mbrola, CMU Arctic) เสียงก็ยังไม่ค่อยดีนัก

เสียงของIVONAนั้นดีที่สุดเท่าที่ฉันเคยได้ยินมา พวกเขาให้การสาธิตฟรี 30 วันซึ่งเพียงพอหากคุณมีงานทำ หลังจากนั้นพวกเขาจะอยู่ที่ $ 45 / เสียง อเมซอนเพิ่งซื้อ บริษัท เพื่อให้คุณรู้ว่ามันแข็งแกร่ง ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ )

พวกเขาทำงานกับอินเทอร์เฟซ SAPI ของ Microsoft ซึ่งหมายถึงเสียงที่มีให้กับโปรแกรมใด ๆ ที่สนับสนุนนั้น (เช่น Adobe Reader) ฉันใช้มันกับโปรแกรมText To Wavซึ่งดีสำหรับการแปลงไฟล์ข้อความเป็นไฟล์เวฟ

แก้ไข

ที่จริงแค่อ่านคำถามของคุณอีกครั้งและฉันคิดว่าสำหรับการใช้ที่ไม่ใช่ส่วนตัว (เช่นพอดคาสต์) ราคาอาจสูงขึ้นมากสำหรับ IVONA ในกรณีนี้ฉันจะบอกว่าตรวจสอบ MaryTTS

— ผู้ใช้งาน
แหล่งที่มา

ฉันเพิ่งฟัง MaryTTS และมันก็ทำให้เกิดเสียงเอ๊บ ๆ และเทศกาลขึ้น

— สามสิบสาม

MaryTTS มีเสียงที่ยอดเยี่ยมและมันก็ฟรีเช่นกัน

— Jim McKeeth

ดูเหมือนว่าข้อความเป็นคำพูดสำหรับเสียง Ivona สำหรับการใช้เดสก์ท็อปตอนนี้มีให้โดยTextAloud

— ผู้ใช้

6

eSpeakนั้นฟรีและโอเพ่นซอร์สและให้ทุกสิ่งที่คุณต้องการ

มันสามารถเรียกใช้เป็นโปรแกรมบรรทัดคำสั่งเพื่อพูดข้อความจากไฟล์หรือจาก stdin
นอกจากนี้ยังมีเวอร์ชันห้องสมุดที่ใช้ร่วมกัน

* รวมถึงเสียงที่แตกต่างซึ่งสามารถเปลี่ยนลักษณะได้
* สามารถสร้างเอาต์พุตเสียงพูดเป็นไฟล์ WAV
* รองรับ SSML (ภาษามาร์กอัปการสังเคราะห์เสียงพูด) (ไม่สมบูรณ์),
  และ HTML
* ขนาดกะทัดรัด โปรแกรมและข้อมูลรวมถึงหลายภาษา
  รวมประมาณ 1 เมกกะไบท์
* สามารถแปลข้อความเป็นรหัสฟอนิมได้ดังนั้นจึงสามารถนำไปปรับใช้เป็นส่วนหน้าได้
  สิ้นสุดสำหรับเครื่องมือสังเคราะห์เสียงพูดอีกอัน
* ศักยภาพสำหรับภาษาอื่น ๆ หลายอย่างรวมอยู่ในขั้นตอนที่แตกต่างกัน
  ของความคืบหน้า ความช่วยเหลือจากเจ้าของภาษาสำหรับภาษาเหล่านี้หรือภาษาอื่น ๆ คือ
  ยินดี
* เครื่องมือในการพัฒนาสำหรับการผลิตและการปรับแต่งข้อมูลหน่วยเสียง
* เขียนเป็น C ++

— จอห์นที
แหล่งที่มา

แม้ว่า eSpeak จะดูน่าสนใจ แต่ก็สามารถได้รับประโยชน์จากคำแนะนำ "เริ่มต้นอย่างรวดเร็ว" ขอบคุณสำหรับเคล็ดลับแม้ว่า ฉันจะทำงานกับมันต่อไป

— Jim McKeeth

+1 สำหรับ eSpeak ฉันกำลังมองหาแอปที่จะทำสิ่งนี้มาเป็นเวลานาน ขอบคุณมาก!

— Axxmasterr