ฉันต้องการค้นหาวิธีที่มีประสิทธิภาพพอสมควรในการตรวจสอบพยางค์ในคำ เช่น,
มองไม่เห็น -> in-vi-sib-le
มีกฎบางพยางค์ที่สามารถใช้ได้:
V CV VC CVC CCV CCCV CVCC
* โดยที่ V คือเสียงสระและ C เป็นพยัญชนะ เช่น,
การออกเสียง (5 Pro-nun-ci-a-tion; CV-CVC-CV-V-CVC)
ฉันได้ลองวิธีการสองสามอย่างซึ่งใช้ regex (ซึ่งจะช่วยเฉพาะในกรณีที่คุณต้องการนับพยางค์) หรือการกำหนดกฎการเข้ารหัสแบบยาก (วิธีการบังคับแบบเดรัจฉานซึ่งพิสูจน์ให้เห็นว่าไม่มีประสิทธิภาพมาก) และสุดท้ายก็ใช้ออโต จำกัด ไม่ส่งผลกับสิ่งที่มีประโยชน์)
แอปพลิเคชันของฉันมีวัตถุประสงค์เพื่อสร้างพจนานุกรมของพยางค์ทั้งหมดในภาษาที่กำหนด พจนานุกรมนี้จะใช้สำหรับการตรวจสอบการสะกดคำในภายหลัง (โดยใช้ตัวแยกประเภทเบส์) และการสังเคราะห์ข้อความเป็นคำพูด
ฉันจะขอบคุณถ้ามีใครสามารถให้คำแนะนำในทางเลือกอื่นในการแก้ปัญหานี้นอกเหนือจากวิธีการก่อนหน้าของฉัน
ฉันทำงานใน Java แต่เคล็ดลับใน C / C ++, C #, Python, Perl ... จะทำงานให้ฉัน