ลดเสียงรบกวนพื้นหลังและเพิ่มประสิทธิภาพการพูดจากคลิปเสียงโดยใช้ ffmpeg
ฉันแยกคลิปเสียงจากไฟล์วิดีโอสำหรับการรู้จำเสียง วิดีโอเหล่านี้มาจากอุปกรณ์มือถือ / อื่น ๆ ที่ทำด้วยมือดังนั้นจึงมีเสียงดังมาก ฉันต้องการลดเสียงพื้นหลังของเสียงเพื่อให้การพูดที่ฉันส่งไปยังโปรแกรมรู้จำเสียงพูดของฉันชัดเจน ฉันใช้ ffmpeg เพื่อทำสิ่งนี้ทั้งหมด แต่ฉันติดอยู่ที่ขั้นตอนการลดเสียงรบกวน จนถึงตอนนี้ฉันได้ลองใช้ตัวกรองดังนี้: ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav แต่ผลลัพธ์ที่น่าผิดหวังมาก เหตุผลของฉันคือเนื่องจากคำพูดอยู่ในช่วง 300-3,000 เฮิร์ตซ์ฉันสามารถกรองความถี่อื่น ๆ ทั้งหมดเพื่อระงับเสียงพื้นหลังใด ๆ ฉันพลาดอะไรไป นอกจากนี้ฉันอ่านเกี่ยวกับตัวกรองเนอร์ที่สามารถใช้สำหรับการปรับปรุงการพูดและพบสิ่งนี้แต่ฉันไม่แน่ใจว่าจะใช้อย่างไร