DFT พร้อมช่องว่างแบบเรขาคณิต?


16

การแปลงฟูริเยร์แบบไม่ต่อเนื่องแบบดั้งเดิม (DFT) และลูกพี่ลูกน้องของมันคือ FFT ผลิตถังขยะที่เว้นระยะเท่ากัน พูดอีกอย่างก็คือคุณได้รับ 10 เฮิร์ตซ์แรกในถังขยะแรก 10.1 ถึง 20 ในวินาที ฯลฯ อย่างไรก็ตามฉันต้องการบางสิ่งที่แตกต่างออกไปเล็กน้อย ฉันต้องการช่วงความถี่ที่ครอบคลุมโดยแต่ละถังเพื่อเพิ่มแบบเรขาคณิต สมมติว่าฉันเลือกตัวคูณ 1.5 จากนั้นเรามี 0 ถึง 10 ในถังขยะแรกฉันต้องการ 11 ถึง 25 ในถังขยะที่สอง, 26 ถึง 48 ในถังขยะที่สาม ฯลฯ เป็นไปได้หรือไม่ที่จะปรับเปลี่ยนอัลกอริทึม DFT ให้ทำงานในลักษณะนี้


คุณสามารถคำนวณ DFT ได้ตลอดเวลาที่จุดสนใจ นอกจากนี้การแปลงเวฟเล็ตโดยสิ้นเชิงและกรองธนาคารมาถึงใจของฉัน อาจคุ้มค่าที่จะดูพวกเขา

2
คุณกำลังมองหาคง Q Transform (CQT)
Paul R

2
คำพูดไม่ดี สิ่งที่คุณต้องการไม่ใช่เรื่องใหม่หรือการปรับปรุงในหลายกรณี
hotpaw2


2
DFT และ FFT ไม่ใช่ลูกพี่ลูกน้อง พวกเขาให้ผลลัพธ์ที่เหมือนกัน
Phonon

คำตอบ:


17

เพื่ออ้างถึงวิทยานิพนธ์ของฉัน:

ชุดของการแปลงจะได้รับชื่อค่าคงที่ Q และคล้ายกับการแปลงฟูริเยร์

การคำนวณการแปลงฟูริเยร์แบบแยกนั้นมีประสิทธิภาพมากเมื่อใช้การแปลงฟูริเยร์ที่รวดเร็ว อย่างไรก็ตามเราสังเกตเห็นว่าพลังงานของสัญญาณแบ่งออกเป็นที่เก็บความถี่ที่มีขนาดเท่ากันทั่วทั้งสเปกตรัม ในขณะที่ในหลายกรณีสิ่งนี้มีประโยชน์เราสังเกตเห็นว่าสถานการณ์ที่การกระจายตัวแบบเดียวกันนั้นมีประโยชน์น้อยที่สุด ตัวอย่างที่สำคัญของกรณีดังกล่าวถูกสังเกตด้วยการวิเคราะห์ความถี่ดนตรี ในดนตรีตะวันตกความถี่ที่ประกอบขึ้นเป็นระดับดนตรีนั้นมีการเว้นระยะทางเรขาคณิต ดังนั้นเราจึงเห็นว่าแผนที่ระหว่างถังขยะความถี่ของการแปลงฟูริเยร์โดยสิ้นเชิงและความถี่ของเกล็ดดนตรีไม่เพียงพอในแง่ที่ว่าถังขยะจับคู่ไม่ดี การแปลง Q อย่างต่อเนื่องแก้ไขปัญหานี้ได้

เป้าหมายของค่าคงที่ Q คือสร้างชุดของช่องเก็บความถี่แบบลอการิทึมซึ่งมีความกว้างของช่องความถี่เป็นผลิตภัณฑ์ก่อนหน้านี้ ดังนั้นเราอาจสร้างถังขยะจำนวนเท่ากันต่อโน้ตดนตรีทั่วสเปกตรัมเสียงที่ได้ยินดังนั้นจึงรักษาระดับความแม่นยำคงที่สำหรับโน้ตดนตรีแต่ละอัน ถังขยะความถี่กว้างขึ้นไปสู่ความถี่ที่สูงขึ้นและแคบลงไปสู่ความถี่ที่ต่ำกว่า การแพร่กระจายในความแม่นยำของการตรวจจับความถี่อย่างใกล้ชิดเลียนแบบวิธีการที่ระบบการได้ยินของมนุษย์ตอบสนองต่อความถี่

นอกจากนี้การจับคู่อย่างใกล้ชิดของโน้ตในเครื่องชั่งตะวันตกทำให้ค่าคงที่ -Q มีประโยชน์อย่างยิ่งในการตรวจจับโน้ต การระบุค่าโน้ตดนตรีแทนที่จะเป็นค่าความถี่ที่ชัดเจน นอกจากนี้ค่า Q คงที่ช่วยลดความยุ่งยากของกระบวนการวิเคราะห์เสียงต่ำ ความถี่ของโน้ตดนตรีที่เล่นโดยเครื่องมือมักประกอบด้วยส่วนที่เกี่ยวข้องอย่างกลมกลืน เสียงต่ำของเครื่องดนตรีสามารถกำหนดโดยอัตราส่วนของเสียงดนตรี ด้วยการแปลง Q อย่างสม่ำเสมอฮาร์มอนิกจะเว้นระยะเท่ากันทั่วทั้งช่องเก็บโดยไม่คำนึงถึงความถี่พื้นฐาน สิ่งนี้ช่วยลดความซับซ้อนของกระบวนการในการระบุเครื่องมือที่เล่นโน้ตได้ทุกที่ในระดับง่ายๆโดยการเปลี่ยนลักษณะเฉพาะข้ามถังขยะ

อัลกอริทึมที่มีประสิทธิภาพสำหรับการแปลงการแปลงฟูริเยร์แบบแยก (ซึ่งอาจคำนวณด้วย FFT) เป็นการแปลง Q อย่างต่อเนื่องมีรายละเอียดในสีน้ำตาลและ Puckette (1992)


1

มีสมมติฐานทางคณิตศาสตร์ที่สำคัญใน DFT (FFT) สิ่งสำคัญที่สุดในกรณีนี้คือคุณกำลังทำการแปลงไซน์อยด์แบบไม่ จำกัด เวลาที่ถูกตัดทอน อย่างที่สองก็คือเวลาที่ถูกตัดทอนและสัญญาณ frequncy ที่ถูกตัดทอนนั้นจะถูกห่อด้วยโมดูโล (แบบวงกลม) ถังขยะที่เว้นระยะในรูปแบบ FFT ปกติที่ตั้งค่าออร์โธเฟนแบบปกติเนื่องจากสมมติฐานเหล่านี้เท่านั้น เวลา <-> คู่ความถี่จึงสามารถย้อนกลับได้อย่างสมบูรณ์แบบ

การแปลงค่า Q อย่างต่อเนื่องไม่ได้ถูกตัดทอนอย่างสมบูรณ์ดังนั้นการใช้งานจริงใด ๆ จึงไม่สามารถจับคู่ออร์โธปกติได้อย่างสมบูรณ์แบบ เคอร์เนลคือไซน์อยด์แบบเน่าเปื่อยที่มีความยาวไม่ จำกัด และดังนั้นจึงไม่สามารถมีข้อได้เปรียบแบบวงกลมดังกล่าวข้างต้น หากคุณไม่ตัดทอนพวกเขาจะตั้งค่า orthonormal

โดยทั่วไปการแปลงเวฟเล็ตจะใช้กำลังของระยะห่าง 2 อันซึ่งไม่ได้มีประโยชน์มากสำหรับการประมาณความถี่แบบละเอียด

ข้อเสนอแนะสำหรับการเว้นวรรคอย่างไม่สม่ำเสมอของ DFT ไซน์ไซด์มาตรฐานจะทำให้พลาดข้อมูลในพื้นที่ที่มีการเว้นวงกว้างในขณะที่มันจะทำซ้ำข้อมูลในพื้นที่ที่มีพื้นที่หนาแน่น เว้นแต่จะใช้ฟังก์ชัน apodization ที่แตกต่างกันสำหรับแต่ละความถี่ ... ค่าใช้จ่ายสูงมาก

วิธีแก้ปัญหาหนึ่งที่ใช้งานได้คือการทำขั้นตอนซ้ำครึ่งละครึ่งฆ่าเชื้อเพื่อให้ได้ส่วนย่อยตามระดับแปดเสียงเพื่อตอบสนองข้อผิดพลาดการประมาณค่าต่ำสุดบางประการต่อคู่ ส่วนสเปกตรัม -> decimate-by-ratio สามารถตั้งค่าเป็นอัตราส่วนใด ๆ เพื่อให้บรรลุความต้องการที่ละเอียดใด ๆ ยังคงคำนวณเข้มข้นสวย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.