สถานะปัจจุบันของศิลปะในการแก้ไขสัญญาณเสียง


11

คำถามสามข้อ:

  1. เมตริกทั้งหมดสามารถใช้เพื่อวัดคุณภาพการแก้ไขด้วยเสียงได้อย่างเป็นกลางหรือไม่ (แต่ในแง่ของจิตวิเคราะห์หากเป็นไปได้)

  2. จากการวัดเหล่านั้นสถานะปัจจุบันของศิลปะในการแก้ไขเสียงคืออะไร

  3. สมมติว่าฉันต้องเรนเดอร์สองไฟล์จากลำดับของบันทึกย่อจากเครื่องมือเสมือนในความละเอียดสองค่าจากนั้นเปรียบเทียบการอัปแซมปลิงของไฟล์หนึ่งไฟล์กับเวอร์ชันที่เรนเดอร์ความถี่สูงซอฟต์แวร์ใดที่สามารถใช้เปรียบเทียบ - เป็นการดีที่ใช้เมตริกที่กล่าวถึงก่อนหน้านี้

จนถึงตอนนี้จากที่ฉันได้รวบรวมผู้ทดลองใช้เหล่านี้มีคุณภาพที่ดีที่สุด

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

หนึ่งในปัญหาที่ resamplers เหล่านี้ดูเหมือนจะมีก่อนและหลังการเรียกเข้า

ฉันควรทราบว่าสิ่งที่น่าสนใจที่สำคัญคือการสร้างสัญญาณใหม่ (ตราบเท่าที่คำนั้นสมเหตุสมผล) ดังนั้นการสุ่มสัญญาณมากกว่าการสุ่มตัวอย่าง

แก้ไข: ประสิทธิภาพเวลาการแก้ไขไม่เกี่ยวข้องในบริบทนี้

ขอแสดงความนับถือ :-)

คำตอบ:


5

เกี่ยวกับ "ปัญหา" คุณทราบด้วย resamplers:

อัลกอริธึมการสุ่มตัวอย่างจำนวนมากใช้เคอร์เนลโพลีเฟสฟิลเตอร์กรองความถี่ต่ำแบบพาสโพลิเฟส เคอร์เนลการแก้ไขตัวกรองขั้นต่ำเมื่อเทียบกับเคอร์เนลการแก้ไขเชิงเส้นเฟส (ที่มีการตอบสนองความถี่เดียวกัน) จะสร้างเสียงกริ่งล่วงหน้าน้อยลงในระหว่างการ resampling เป็นอัตราตัวอย่างที่สูงกว่าซึ่งอาจวัดความเที่ยงตรงน้อยกว่า เสียง acoustically "ดีกว่า" กับมนุษย์

ต่อไปนี้เป็นข้อควรทราบเกี่ยวกับการสร้างตัวกรองขั้นต่ำสำหรับการกรองโดยอาจส่งเสียงเรียกเข้าล่วงหน้าน้อยกว่า: http://www.music.columbia.edu/pipermail/music-dsp/2004-F กุมภาพันธ์/059372.html

นอกจากนี้ตัวกรองความถี่ต่ำผ่านการออกแบบ Remez (Parks-McClellan) อาจมีระลอกคลื่นชัดเจนเป็นระยะในโดเมนความถี่ซึ่งอาจทำให้เกิดแรงกระตุ้นก่อนวงแหวนในโดเมนเวลา ดังนั้นคุณอาจต้องการลองใช้ Sinc แบบหน้าต่างหรือแหล่งกำเนิดของตัวกรองสัญญาณอนาล็อกคลาสสิกแทนสำหรับการออกแบบตัวกรอง low-pass (ซึ่งโดยปกติแล้วจะส่งผลให้บางสิ่งใกล้เคียงกับระยะต่ำสุด) สำหรับเคอร์เนลการแก้ไข resampling


เกี่ยวกับจุดของคุณเกี่ยวกับตัวกรองเฟสขั้นต่ำ: ฉันไม่แน่ใจเกี่ยวกับลิงก์สองตัวแรก แต่ SRC ของ iZotope อนุญาตให้มีการเปลี่ยนแปลงเฟสอย่างต่อเนื่องระหว่างขั้นต่ำและเชิงเส้น ในการทดสอบการฟังผู้คนมักจะชอบที่ไหนสักแห่งในช่วงระหว่างขั้นต่ำและระยะเชิงเส้น
schnarf

ตัวกรองแบบหน้าต่างไม่จำเป็นต้องดีกว่าตัวกรอง Equiripple (ออกแบบโดยใช้การแลกเปลี่ยน Remez) ที่เกี่ยวข้องกับเสียงเรียกเข้าโดเมนเวลา เอฟเฟกต์เสียงเรียกเข้าเรียกว่าปรากฏการณ์กิ๊บส์และสังเกตได้เมื่อคุณ bandlimit สัญญาณที่มีความไม่ต่อเนื่อง (เช่นคลื่นสี่เหลี่ยม) มันไม่ได้เกิดจากคลื่นความถี่โดเมนของตัวกรอง Equiripple ผลจะเห็นได้ชัดเจนขึ้นเมื่อคุณใช้ตัวกรองที่มีการตัดยอดแหลมมาก การเพิ่มความกว้างช่วงการเปลี่ยนภาพสามารถลดได้บ้าง
Jason R

@ Jason R: sinusoid ในโดเมนเวลา = แรงกระตุ้นในโดเมนความถี่ตำแหน่งขึ้นอยู่กับอัตราการกระเพื่อมของ sinusoid ตอนนี้กลับโดเมน 2 และวางระลอกคลื่นไซน์ในการตอบสนองโดเมนความถี่ แรงกระตุ้นจะเข้าสู่โดเมนเวลาตำแหน่งขึ้นอยู่กับลักษณะของคลื่น
hotpaw2

@ hotpaw2: ฉันเห็นความคล้ายคลึงของคุณ ฉันเข้าใจผิดเจตนาของคำว่า "อิมพัลส์ pre-ring"
Jason R

นอกจากนี้หน้าต่างที่ราบรื่นในโดเมนเวลาจะสร้างรูปทรงที่ไม่ต่อเนื่องรอบ ๆ ความไม่ต่อเนื่องในโดเมนความถี่ด้วยการโน้มน้าวใจ
hotpaw2

6

มีการเปรียบเทียบขั้นตอนวิธี resampling ใหม่อย่างละเอียด: http://src.infinitewave.ca/

คุณสามารถดูการทดสอบที่ใช้ Aliasing นั้นใหญ่และสามารถมองเห็นได้ง่ายด้วย spectrogram ของ sine sweep นอกจากนี้ยังมีการตอบสนองความถี่สูง - SRC สามารถแผ่คลื่นความถี่สูงออกไปได้นอกเหนือจากการอนุญาตให้สร้างนามแฝง คุณสามารถเห็นภาพการตอบสนองเฟสด้วยกราฟการตอบสนองแบบอิมพัลส์หรือพล็อตของการตอบสนองเฟส


ใช่ฉันรู้ว่าแหล่งข้อมูลที่ยอดเยี่ยมนี้ ฉันแค่อยากจะรู้ว่าพารามิเตอร์ทั้งหมดที่ควรค่าแก่การวัดเมื่อทำการวัด resampling (โดยเฉพาะอย่างยิ่งการอัปแซมปลิง)
Bent Rasmussen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.