ฉันแยกคลิปเสียงจากไฟล์วิดีโอสำหรับการรู้จำเสียง วิดีโอเหล่านี้มาจากอุปกรณ์มือถือ / อื่น ๆ ที่ทำด้วยมือดังนั้นจึงมีเสียงดังมาก ฉันต้องการลดเสียงพื้นหลังของเสียงเพื่อให้การพูดที่ฉันส่งไปยังโปรแกรมรู้จำเสียงพูดของฉันชัดเจน ฉันใช้ ffmpeg เพื่อทำสิ่งนี้ทั้งหมด แต่ฉันติดอยู่ที่ขั้นตอนการลดเสียงรบกวน
จนถึงตอนนี้ฉันได้ลองใช้ตัวกรองดังนี้:
ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav
ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav
ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav
แต่ผลลัพธ์ที่น่าผิดหวังมาก เหตุผลของฉันคือเนื่องจากคำพูดอยู่ในช่วง 300-3,000 เฮิร์ตซ์ฉันสามารถกรองความถี่อื่น ๆ ทั้งหมดเพื่อระงับเสียงพื้นหลังใด ๆ ฉันพลาดอะไรไป
นอกจากนี้ฉันอ่านเกี่ยวกับตัวกรองเนอร์ที่สามารถใช้สำหรับการปรับปรุงการพูดและพบสิ่งนี้แต่ฉันไม่แน่ใจว่าจะใช้อย่างไร