มีใครรู้บ้างเกี่ยวกับแอปพลิเคชั่นที่สามารถแปลงเสียงเป็นข้อความได้หรือไม่? ฉันใช้ Ubuntu 12.04 LTS
มีใครรู้บ้างเกี่ยวกับแอปพลิเคชั่นที่สามารถแปลงเสียงเป็นข้อความได้หรือไม่? ฉันใช้ Ubuntu 12.04 LTS
คำตอบ:
ซอฟต์แวร์ที่คุณสามารถใช้เป็นCMUSphinx ต่างจากคำแนะนำในคำตอบอื่น Julius ไม่เหมาะเพราะต้องใช้รุ่น แบบจำลองสำหรับการรู้จำเสียงพูดคำศัพท์ขนาดใหญ่ไม่สามารถใช้ได้สำหรับ Julius
คุณสามารถใช้pocketsphinxเพื่อแปลงไฟล์เสียง คำสั่งทั้งสองนั้นจะต้องทำงาน ก่อนอื่นคุณต้องแปลงไฟล์ให้อยู่ในรูปแบบที่กำหนดจากนั้นให้คุณจดจำได้:
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
เรียกใช้ pockets ฟิงซ์
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt
ผลลัพธ์จะถูกเก็บไว้ใน result.txt
speech recognition
และvoice command
เครื่องมือที่นี่: youtube.com/…
pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.log
ทำงาน บางทีพวกเขาอาจไม่ใช่แพ็คเกจที่ดีที่สุด แต่มันตรงกับที่ฉันหาได้ในที่เก็บ
ฉันรู้ว่ามันเก่า แต่เพื่อขยายคำตอบของ Nikolay และหวังว่าจะช่วยคนบางคนในอนาคตเพื่อรับรุ่น pockets กระเป๋าที่ทันสมัยคุณต้องรวบรวมจาก github หรือ sourceforge repository (ไม่แน่ใจ ซึ่งได้รับการปรับปรุงให้ทันสมัยยิ่งขึ้น) หมายเหตุ -j8 หมายถึงเรียกใช้ 8 งานแยกกันถ้าเป็นไปได้ หากคุณมีแกน CPU มากขึ้นคุณสามารถเพิ่มจำนวนได้
git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
จากนั้น: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/
ดาวน์โหลดรุ่นใหม่ล่าสุดของcmusphinx-en-us-....tar.gz
และen-70k-....lm.gz
tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz
จากนั้นในที่สุดคุณสามารถดำเนินการตามขั้นตอนจากคำตอบของ Nikolay:
ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
-hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
2>pocketsphinx.log >book.txt
สฟิงซ์ทำงานได้ดี ฉันจะไม่พึ่งพามันเพื่อสร้างข้อความที่อ่านได้ แต่ก็ดีพอที่คุณจะสามารถค้นหาได้หากคุณกำลังมองหาคำพูดเฉพาะ ใช้งานได้ดีเป็นพิเศษหากคุณใช้อัลกอริธึมการค้นหาเช่น Xapian ( http://www.lesbonscomptes.com/recoll/ ) ซึ่งยอมรับ wildcard และไม่ต้องการการค้นหาที่แน่นอน
หวังว่านี่จะช่วยได้
pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory
-------> export LD_LIBRARY_PATH=/usr/local/lib
------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
ฉันต้องการแปลงคำพูดเป็นข้อความที่คุณสามารถลองเปิดศูนย์ซอฟต์แวร์ Ubuntu ของคุณและค้นหาJulius
ลักษณะ
"Julius" เป็นซอฟต์แวร์ถอดรหัสถอดรหัสเสียงพูดต่อเนื่อง (LVCSR) ที่มีประสิทธิภาพสูงสำหรับผู้วิจัยและนักพัฒนาที่เกี่ยวข้องกับการพูด
หรือตัวเลือกอื่นที่ไม่ได้อยู่ใน Software Center คือSimon
... เป็นโปรแกรมรู้จำเสียงพูดโอเพ่นซอร์สและแทนที่เมาส์และคีย์บอร์ด
ลิงค์อ้างอิง
http://julius.sourceforge.jp/en_index.php
คุณสามารถใช้แผงการถอดเสียงspeechpad.pw