วิธีแบ่งเซ็กเมนต์เสียงโทรศัพท์ให้เป็นความเงียบ / ไม่เงียบ


9

ปัญหาของฉันคือฉันไม่รู้พลังงานของเสียงพื้นหลังดังนั้นฉันจึงไม่สามารถ จำกัด พลังงานได้ การประมวลผลเสร็จในเวลาจริงและฉันมีเวลาประมาณ 500 มิลลิวินาทีในการตัดสินใจ เป็นการดีที่ฉันต้องการพยัญชนะที่เงียบสงบซึ่งไม่ใช่ความเงียบ


6
ฉันไม่ได้มีข้อมูลเพียงพอที่จะให้คำตอบที่เต็มรูปแบบ แต่ปัญหาของคุณจะเรียกว่าการตรวจสอบกิจกรรมเสียง ไม่มีวิธีที่ดีที่สุดที่ตกลงกันเพียงอย่างเดียวที่จะทำและถ้าคุณดูคุณอาจจะพบวิธีการที่แตกต่างกัน บางทีคนอื่น ๆ ก็สามารถทำให้มันออกมาได้อีก
Jason R

@Michael Litvin มีคลาสของตัวกรองที่ไม่เป็นเชิงเส้น (ใช้ใน 'การตรวจจับพลังงาน' โดยใช้ชื่อ 'Teager-Kaiser' ฉันคิดว่ามันเป็นเซตย่อยของสิ่งที่เรียกว่า 'voltera kernels' ขออภัยฉันไม่สามารถระบุได้ ข้อมูลเพิ่มเติม แต่ถ้าคุณค้นหาคำเหล่านั้นคุณอาจพบสิ่งที่คุณกำลังมองหาฉันรู้ว่าวิธี Teager-Kaiser ใช้เพื่อ 'เมื่อ' เสียงวาฬเริ่มต้น VS เพียงแค่เสียงพื้นหลัง
Spacey

คำตอบ:


4

มีพารามิเตอร์จำนวนมากที่คุณสามารถดูได้:

  1. พลังงานโดยรวม
  2. สเปกตรัมระยะสั้น: เสียงพูดมีลักษณะพิเศษค่อนข้าง "เหมือนสีชมพู" สเปกตรัมและเสียงรบกวน (ซึ่งเกิดขึ้นในช่วงที่ไม่ใช่คำพูด) มีแนวโน้มที่จะเป็นสีขาวถ้ามันโดดเด่นด้วยไฟฟ้าหรือ "แดง" (เช่นความถี่ต่ำหนัก) ถ้าเป็นพื้นอะคูสติก เสียงรบกวนหรือเสียงไมโครโฟน
  3. สถิติกว้าง สัญญาณเสียงส่วนใหญ่มีการกระจายแบบเกาส์, คำพูดนั้นใกล้เคียงกับการกระจายแบบ Laplace

ฉันคิดว่าการรวมกันของสามสิ่งนี้ควรให้รูปแบบการตรวจจับที่มีประสิทธิภาพพอสมควร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.