การประมวลผลสัญญาณ dct

4

อะไรคือความแตกต่างระหว่างการแปลงฟูริเยร์และการแปลงโคไซน์?

ในการรู้จำเสียงส่วนหน้าส่วนใหญ่ทำการประมวลผลสัญญาณเพื่อให้สามารถดึงคุณสมบัติออกจากสตรีมเสียง การแปลงฟูริเยร์แบบไม่ต่อเนื่อง (DFT) ถูกนำมาใช้สองครั้งในกระบวนการนี้ ครั้งแรกคือหลังจากการเปิดหน้าต่าง หลังจาก Mel Binning นี้ถูกนำไปใช้และจากนั้นก็แปลงฟูเรียร์อื่น ฉันได้สังเกตเห็นว่ามันเป็นเรื่องธรรมดาในตัวรู้จำเสียงพูด (ส่วนหน้าเริ่มต้นในCMU Sphinxเป็นต้น) เพื่อใช้การแปลงแบบโคไซน์แบบแยกส่วน (DCT) แทนที่จะเป็น DFT สำหรับการดำเนินการครั้งที่สอง ความแตกต่างระหว่างการดำเนินการทั้งสองนี้คืออะไร ทำไมคุณต้องทำ DFT ในครั้งแรกและจากนั้น DCT เป็นครั้งที่สอง

75 dct dft

3

การแปลง Cosine อย่างรวดเร็วผ่าน FFT

ฉันต้องการใช้การแปลงโคไซน์อย่างรวดเร็ว ฉันอ่านวิกิพีเดียว่ามีรุ่น DCT ที่รวดเร็วซึ่งคำนวณได้คล้ายกับ FFT ฉันพยายามอ่านMakhoul * paper ที่อ้างถึงสำหรับการใช้งาน FTPACK และ FFTW ที่ใช้ในScipyแต่ฉันไม่สามารถแยกอัลกอริทึมจริงได้ นี่คือสิ่งที่ฉันมี: รหัส FFT: def fft(x): if x.size ==1: return x N = x.size x0 = my_fft(x[0:N:2]) x1 = my_fft(x[0+1:N:2]) k = numpy.arange(N/2) e = numpy.exp(-2j*numpy.pi*k/N) l = x0 + x1 * e r = x0 - x1 …

15 fft dct

2

สามารถใช้ DCT สำหรับสเปกตรัมขนาดเสียงแทน DFT ได้หรือไม่

จากสิ่งที่ฉันเข้าใจ DCT มีขนาดครึ่งถังเป็น DFT ที่มีขนาดเท่ากัน N DFT ยังรวมข้อมูลเฟสด้วย แต่บ่อยครั้งที่สิ่งนี้ไม่จำเป็นเมื่อต้องการสเปกตรัมขนาดเท่านั้น DCT สามารถนำมาใช้เพื่อให้สเปกตรัมขนาดที่มีความหนาแน่นเป็นสองเท่า (ระยะห่างครึ่งช่องเก็บขยะ) ของ DFT หรือข้อมูลเฟสขาดหายไปได้หรือไม่? ทับซ้อนกัน 50% แล้วล่ะ

13 dct dft

1

ความสัมพันธ์ระหว่าง DCT และ PCA

ฉันมีความรู้การใช้งานพื้นฐานของ 2D 8x8 DCT ที่ใช้ในการบีบอัดภาพและวิดีโอ ในขณะที่อ่านเกี่ยวกับการวิเคราะห์องค์ประกอบหลักการฉันสามารถเห็นความคล้ายคลึงกันได้มากมายแม้ว่า PCA จะเป็นแบบทั่วไปที่ชัดเจนกว่า เมื่อฉันอ่านเกี่ยวกับ DCT ก่อนหน้านี้มันถูกนำเสนอเสมอเกี่ยวกับ DFT ดังนั้นคำถามของฉันคือ DCT จะได้มาจากมุมมอง PCA ได้อย่างไร (แม้คำอธิบายคลื่นมือก็เพียงพอ) ขอบคุณมาก

12 image-processing discrete-signals dct video-compression

3

นี่เป็นการตีความที่ถูกต้องของขั้นตอน DCT ในการคำนวณ MFCC หรือไม่

นี่คือความต่อเนื่องของการอภิปรายที่นี่ ฉันจะแสดงความคิดเห็นที่นั่น แต่ฉันไม่มีตัวแทน 50 คนฉันจึงถามคำถามใหม่ นี่คือวิธีที่ฉันเข้าใจขั้นตอน DCT ในกระบวนการคำนวณ MFCC: เหตุผลที่อยู่เบื้องหลังคือการแยกสหสัมพันธ์ในขนาดบันทึกการทำงาน (จากตัวกรอง) เนื่องจากการซ้อนทับของตัวกรอง โดยพื้นฐานแล้ว DCT ทำให้การแสดงสเปกตรัมเป็นไปอย่างราบรื่นโดยขนาดของ log-spectral มันจะถูกต้องหรือไม่ที่จะบอกว่าเส้นสีน้ำเงินในภาพด้านล่างแทนสเปกตรัมที่แสดงโดยเวกเตอร์ของขนาด - บันทึกสเปกตรัมและเส้นสีแดงคือเวกเตอร์นั้นครั้งหนึ่งเคยเป็น DCT-ified?

9 mfcc dct

คำถามติดแท็ก dct