สิ่งที่เทียบเท่าเสียงของภาพเช่น "Lena", "Mandrill" และ "Cameraman"?


21

ฉันไม่รู้ว่าจะเรียกรูปภาพเหล่านี้อย่างไร แต่บ่อยครั้งมักใช้ในโลกแห่งการประมวลผลภาพเป็นตัวอย่างมาตรฐานเพื่อแสดงผลลัพธ์ของการทำงานเฉพาะ นี่คือการเชื่อมโยงไปยังหน้าอธิบาย Lena เป็น "ภาพทดสอบมาตรฐาน" มีคลิปเสียง canonical ที่คล้ายกันที่ใช้ในการสาธิตผลกระทบของฟิลเตอร์เสียงหรือการทำงานบางอย่างหรือไม่?

คำตอบ:


17

ตัวอย่างที่ใกล้เคียงที่สุดที่ฉันนึกได้คือจุดเริ่มต้นของ"Tom's Diner"ของ Suzanne Vega ซึ่งใช้สำหรับการพัฒนา MPEG-1 layer 3 และยังใช้เป็นครั้งคราวเพื่อสาธิตตัวแปลงสัญญาณเสียง


3
ใช่แล้ว Tom's Diner เป็นตัวอย่างข้อมูลเสียงที่สะอาดสะอ้านและปราศจากเสียงสะท้อนซึ่งเป็นประโยชน์สำหรับการทดสอบโปรแกรมตรวจจับระดับเสียง อีกหนึ่งคือ Boyz II Men คลิป offa ปกของเดอะบีทเทิลส์ของ "เมื่อวาน" (ขวาที่สุด) ดีสำหรับการติดตามระดับเสียงของเสียงพูดโมโนโฟนิค มันยากกว่า Tom's Diner ฉันจำได้ว่า Digital Performer ใช้มัน
robert bristow-johnson

16

การประมวลผลเสียงเป็นฟิลด์ขนาดใหญ่ แต่โดยเฉพาะในการประมวลผลคำพูดฐานข้อมูลแบบเปิดของตัวอย่างที่เรียกว่าประโยคฮาร์วาร์ดถูกนำมาใช้อย่างกว้างขวาง ประโยคฮาร์วาร์ดเป็นประโยคที่มีการออกเสียงเป็นภาษาอังกฤษแบบอเมริกัน มีฐานข้อมูลเทียบเท่าจำนวนมากสำหรับภาษาอื่นเช่นกัน

ไฟล์ที่เกิดขึ้นจริงกับประโยคคำพูดของฮาร์วาร์สามารถพบได้ที่นี่


5

ฉันยังคิดว่าฐานข้อมูล NIST นั้นเป็นที่นิยมมากเมื่อพูดถึงการรู้จำเสียง ในความเป็นจริงมันเป็นมาตรฐานสำหรับการเปรียบเทียบอัลกอริธึมและเทคนิคใหม่ ๆ ระหว่างความท้าทายรายปี

นอกจากนี้ส่วนย่อยของ MATLAB load handelที่มีGFHandel - Hallelujahนั้นเป็นที่นิยมใช้กันมาก



2

อย่าประมาทพลังของคลื่นไซน์ 1 kHz ที่ 0 dBFS ในแบบโมโน มีหลายสิ่งที่ผิดปกติกับเส้นทางสัญญาณที่สามารถพบได้

ฉันได้สร้างและปรับเทียบระบบเสียงเพียงพอที่ฉันสามารถเป่านกหวีด 1 kHz ได้อย่างแน่นอน จากหน่วยความจำง่าย ๆ

นอกเหนือจากนั้น IGY โดย Donald Fagen ยังเป็นที่นิยมเช่นเดียวกับแทร็กทดสอบที่ถูกห้ามโดยเทศกาลต่างๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.