แปลงเสียงพูด (ไฟล์เสียง mp3) เป็นข้อความ


8

ฉันกำลังมองหาตัวแปลงอย่างง่ายจาก mp3 เป็น txt ฉันพยายามแล้วไม่ประสบความสำเร็จ: julius, CMU Sphinx, ... ใน 4 ชั่วโมงที่ผ่านมาฉันไม่พบวิธีการใช้งาน (หรือติดตั้งอย่างถูกต้อง)

สิ่งที่ฉันกำลังมองหาคือสิ่งที่ชอบ:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

ฉันสบายกับแอปพลิเคชั่น GUI เพราะฉันมีไฟล์เพียงไม่กี่ไฟล์ที่สามารถแปลงได้

แก้ไข: ด้วยความช่วยเหลือของคำตอบนี้แอปรู้จำเสียงพูดเพื่อแปลง MP3 เป็นข้อความ? ฉันจัดการเพื่อให้มันใช้งานได้ แต่มันไม่สร้างผลลัพธ์ อันที่จริงมันสร้างบรรทัดว่างสองสามบรรทัด (ตรวจไม่พบคำ) ...


คำสั่งที่แน่นอนที่คุณเรียกใช้และผลลัพธ์ที่คุณเห็นคืออะไร?
Nikolay Shmyrev

1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt เป็นคำสั่งที่แน่นอนตาม @NikolayShmyrev คำถาม ผมได้ดาวน์โหลดรุ่นจากsourceforge.net/projects/cmusphinx/files/...
Samo

คำตอบ:


4

pocketsphinx จะพูดเป็นข้อความจากไฟล์เสียงที่มีอยู่ ขึ้นอยู่กับรูปแบบเริ่มต้นของ mp3 คุณอาจต้องใช้สองคำสั่งแยกกัน

ก่อนอื่นให้แปลงไฟล์เสียงที่มีอยู่เป็นรูปแบบอินพุตที่จำเป็น:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

เรียกใช้ pockets ฟิงซ์

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

ไฟล์ที่สร้างขึ้น myspeech.txt จะมีสิ่งที่คุณกำลังมองหา


ในกรณีที่คุณยังใหม่กับ Ubuntu คุณจะต้องติดตั้งโปรแกรมข้างต้นโดยใช้คำสั่งนี้:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeep opensource เครื่องมือเปลี่ยนข้อความเป็นเสียงพูดจะทำ คุณจะต้องติดตั้งแอปพลิเคชั่นบนเดสก์ท็อป linux ของคุณ หรือคุณสามารถลองใช้Transcribearเครื่องมือสร้างเสียงพูดเป็นข้อความที่ไม่จำเป็นต้องติดตั้ง แต่คุณจะต้องเชื่อมต่อออนไลน์เพื่ออัพโหลดการบันทึกไปยังเซิร์ฟเวอร์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.