คำถามติดแท็ก frequency-spectrum

สเปกตรัมความถี่ของสัญญาณโดเมนเวลาเป็นการแทนสัญญาณนั้นในโดเมนความถี่

6
โดเมนความถี่แสดงถึงอะไรในกรณีของภาพ
ฉันเพิ่งเรียนรู้เกี่ยวกับโดเมนความถี่ในภาพ ฉันสามารถเข้าใจคลื่นความถี่ในกรณีของคลื่น มันหมายถึงความถี่ที่มีอยู่ในคลื่น ถ้าเราวาดคลื่นความถี่ของcos(2πft)cos⁡(2πft)\cos(2\pi f t)เราได้รับสัญญาณที่แรงกระตุ้น−f−f-fและ+f+f+f F และเราสามารถใช้ตัวกรองที่สอดคล้องกันเพื่อดึงข้อมูลเฉพาะ แต่คลื่นความถี่หมายถึงอะไรในกรณีของภาพ? เมื่อเราใช้ FFT ของภาพใน OpenCV เราจะได้ภาพแปลก ๆ ภาพนี้แสดงถึงอะไร? และแอปพลิเคชันของมันคืออะไร? ฉันอ่านหนังสือบางเล่ม แต่พวกเขาให้สมการทางคณิตศาสตร์มากมายแทนที่จะเป็นนัยยะทางกายภาพ ดังนั้นทุกคนสามารถให้คำอธิบายง่ายๆเกี่ยวกับโดเมนความถี่ในภาพด้วยแอปพลิเคชันอย่างง่ายในการประมวลผลภาพได้หรือไม่?

2
ทำไมต้องคำนวณ PSD เป็นจำนวนมาก?
วิธีการของ Welch เป็นอัลกอริธึมไปสู่การคำนวณความหนาแน่นสเปกตรัมพลังงาน (PSD) ของไทม์สตัวอย่างที่สม่ำเสมอ ฉันสังเกตเห็นว่ามีวิธีการมากมายสำหรับการคำนวณ PSD ตัวอย่างเช่นใน Matlab ฉันเห็น: PSD ใช้เมธอด Burg PSD ใช้วิธีความแปรปรวนร่วม PSD ใช้ periodogram PSD ใช้วิธีการแปรปรวนร่วมที่แก้ไขแล้ว PSD โดยใช้วิธีการหลายจุด (MTM) PSD ใช้วิธีของ Welch PSD ใช้วิธี Yule-Walker AR Spectrogram โดยใช้การแปลงฟูริเยร์ในระยะเวลาอันสั้น การประมาณสเปกตรัม อะไรคือข้อดีของวิธีการต่างๆเหล่านี้? เป็นคำถามที่ปฏิบัติได้เมื่อใดฉันจะต้องการใช้วิธีอื่นนอกเหนือจากวิธีของ Welch

3
“ การสุ่มตัวอย่างที่ซับซ้อน” สามารถทำลาย Nyquist ได้หรือไม่
ฉันได้ยินมาพอสมควรว่าการสุ่มตัวอย่างสัญญาณที่ซับซ้อนไม่จำเป็นต้องเป็นไปตามอัตราการสุ่มตัวอย่าง Nyquist แต่จริง ๆ แล้วสามารถได้รับไปด้วยอัตราการสุ่มตัวอย่าง Nyquist ครึ่งหนึ่ง ฉันสงสัยว่ามีความจริงใด ๆ กับเรื่องนี้หรือไม่? จาก Nyquist เรารู้ว่าการสุ่มตัวอย่างสัญญาณอย่างไม่ชัดเจนเราจำเป็นต้องสุ่มตัวอย่างอย่างน้อยสูงกว่าแบนด์วิดท์ของสัญญาณนั้นอย่างน้อยสองเท่า (ฉันกำลังกำหนดแบนด์วิดท์ที่นี่เช่นเดียวกับที่พวกเขาทำในลิงค์วิกิหรือที่รู้จักกันว่าการมีความถี่เป็นบวก) กล่าวอีกนัยหนึ่งถ้าสัญญาณของฉันมีอยู่จาก -B ถึง B ฉันต้องสุ่มตัวอย่างอย่างน้อย> 2 * B เพื่อสนอง nyquist ถ้าฉันผสมสัญญาณนี้กับ fc และต้องการทำการสุ่มตัวอย่างด้วย bandpass ฉันจะต้องสุ่มอย่างน้อย> 4 * B ทั้งหมดนี้ยอดเยี่ยมสำหรับสัญญาณจริง คำถามของฉันคือมีความจริงใด ๆ กับคำสั่งว่าสัญญาณเบสแบนด์ที่ซับซ้อน (aka สิ่งที่มีอยู่เพียงด้านเดียวของสเปกตรัมความถี่) ไม่จำเป็นต้องได้รับการสุ่มตัวอย่างในอัตราอย่างน้อย> 2 * B แต่ในความเป็นจริงแล้ว มีการสุ่มตัวอย่างอย่างเพียงพอในอัตราอย่างน้อย> B หรือไม่ (ฉันมักจะคิดว่าถ้าเป็นกรณีนี้เป็นเพียงความหมายเพราะคุณยังต้องใช้สองตัวอย่าง (หนึ่งจริงและหนึ่งจินตนาการ) ต่อเวลาตัวอย่างเพื่อให้เป็นตัวแทนของเฟสเซอร์หมุนได้อย่างสมบูรณ์ดังนั้นจึงยังคงติดตาม Nyquist …

4
วิธีแยกเสียงจากการกรน
พื้นหลัง: ฉันกำลังทำงานกับโปรแกรม iPhone (พาดพิงถึงใน หลาย อื่น ๆ โพสต์ ) ที่ "ฟัง" นอนกรน / การหายใจในขณะที่หนึ่งคือนอนหลับและกำหนดว่ามีสัญญาณของการหยุดหายใจขณะหลับ (ในขณะที่ก่อนหน้าจอสำหรับ "นอนห้องปฏิบัติการ" การทดสอบ) แอปพลิเคชั่นส่วนใหญ่ใช้ "ความแตกต่างของสเปกตรัม" เพื่อตรวจจับกรน / ลมหายใจและทำงานได้ค่อนข้างดี (มีความสัมพันธ์ 0.85--0.90) เมื่อทดสอบกับการบันทึกแล็บในห้องปฏิบัติการ (ซึ่งจริง ๆ แล้วค่อนข้างมีเสียงดัง) ปัญหา: เสียง "ห้องนอน" ส่วนใหญ่ (พัดลม ฯลฯ ) ฉันสามารถกรองด้วยเทคนิคต่าง ๆ และมักจะตรวจจับการหายใจในระดับ S / N ที่หูมนุษย์ไม่สามารถตรวจพบได้อย่างน่าเชื่อถือ ปัญหาคือเสียงรบกวน ไม่ใช่เรื่องผิดปกติที่จะมีโทรทัศน์หรือวิทยุทำงานในพื้นหลัง (หรือเพียงแค่ให้ใครบางคนกำลังพูดอยู่ในระยะไกล) และจังหวะของเสียงที่ใกล้เคียงกับการหายใจ / การนอนกรน ในความเป็นจริงฉันใช้งานการบันทึกของ Bill …

1
อะไรคือความแตกต่างระหว่าง PSD และขนาดกำลังสองของสเปกตรัมความถี่?
สเปกตรัมพลังงานของสัญญาณสามารถคำนวณได้โดยใช้ขนาดกำลังสองของการแปลงฟูริเยร์ การเป็นคนที่ได้ยินเสียงสัญญาณที่น่าสนใจสำหรับฉันจะเป็นช่วงเวลา การเป็นตัวแทนนี้แตกต่างจาก PSD (ความหนาแน่นของสเปกตรัมพลังงาน) อย่างไรและที่สำคัญในสถานการณ์จริงที่ควรใช้ PSD แทนสเปกตรัมพลังงานที่อธิบายไว้ข้างต้น

3
การเรียงลำดับส่วน biquad สำหรับตัวกรองคำสั่งซื้อที่สูงขึ้นทำงานอย่างไร
ฉันกำลังพยายามใช้ตัวกรอง IIR อันดับที่ 8 และบันทึกย่อของแอปพลิเคชันและหนังสือทุกเล่มที่ฉันได้อ่านบอกว่ามันเป็นการดีที่สุดที่จะใช้ตัวกรองลำดับที่สองมากกว่านั้นเป็นส่วนที่สอง ฉันใช้tf2sosMATLAB เพื่อรับค่าสัมประสิทธิ์สำหรับส่วนที่สองซึ่งทำให้ฉันมีค่า 6x4 coeffs สำหรับส่วนของคำสั่งที่สอง 4 ตามที่คาดไว้ ก่อนการใช้งานเป็น SOS ตัวกรองลำดับที่ 8 จำเป็นต้องเก็บค่าตัวอย่าง 7 ค่าก่อนหน้า (และค่าเอาต์พุตด้วย) ตอนนี้เมื่อดำเนินการตามลำดับส่วนที่สองโฟลว์ทำงานอย่างไรจากอินพุตไปยังเอาต์พุตฉันต้องเก็บค่าตัวอย่างก่อนหน้านี้เพียง 2 ค่าหรือไม่ หรือผลลัพธ์ของตัวกรองตัวแรกป้อนเช่นเดียวx_inกับตัวกรองที่สองและอื่น ๆ ?
20 filters  filter-design  infinite-impulse-response  biquad  audio  image-processing  distance-metrics  algorithms  interpolation  audio  hardware  performance  sampling  computer-vision  dsp-core  music  frequency-spectrum  matlab  power-spectral-density  filter-design  ica  source-separation  fourier-transform  fourier-transform  sampling  bandpass  audio  algorithms  edge-detection  filters  computer-vision  stereo-vision  filters  finite-impulse-response  infinite-impulse-response  image-processing  blur  impulse-response  state-space  linear-systems  dft  floating-point  software-implementation  oscillator  matched-filter  digital-communications  digital-communications  deconvolution  continuous-signals  discrete-signals  transfer-function  image-processing  computer-vision  3d 

2
การใช้อัลกอริทึมของ Goertzel ให้ความละเอียดของความถี่ดีขึ้นจริงหรือ
ฉันกำลังอ่านบทความนี้และฉันสับสนเล็กน้อยจากการใช้ 'การแก้ไขความถี่' แบบเสรีนิยมของผู้เขียนเกี่ยวกับอัลกอริทึมของ Goertzel คำถามพื้นฐาน: การใช้อัลกอริธึม Goertzel จริง ๆ แล้วจะให้ความละเอียดความถี่มากกว่าย่านความถี่ที่คุณสนใจหรือไม่เพียงแค่คำนวณ FFT อย่างมีประสิทธิภาพเหนือย่านความถี่เฉพาะที่ระบุ แต่ที่ความละเอียดความถี่เดียวกันที่ระบุโดยความถี่สุ่มหารด้วยจำนวน ของกลุ่มตัวอย่าง? ตัวอย่างเช่นสมมติว่าคือ 100 KHz (คงที่) และจำนวนตัวอย่างข้อมูลคือ 10000 (เช่นแก้ไข) หากฉันคำนวณ FFT ปกติโดยที่ความยาว FFT เป็นความละเอียดความถี่ของฉันคือตามที่คาดไว้และจะเท่ากับ 10 Hz ซึ่งหมายความว่าช่องเก็บเงินของฉันคั่นด้วย 10 Hz จาก -50,000 Hz ถึง 50,000 Hz N N F sFsFsF_sยังไม่มีข้อความยังไม่มีข้อความNยังไม่มีข้อความยังไม่มีข้อความNFsยังไม่มีข้อความFsยังไม่มีข้อความ\frac{F_s}{N} ตอนนี้ให้เราบอกว่าฉันต้องการใช้อัลกอริทึม Geortzel เพื่อดูความถี่ในช่วงของการพูด 20,000-21,000 เฮิร์ตซ์ หากฉันใช้เดียวกันสำหรับจำนวนตัวอย่างและใช้เดียวกันสำหรับขนาด FFT ของฉันการแก้ไขความถี่ของฉันคืออะไร ยัง …

2
เหตุใดการรั่วไหลของสเปกตรัมจึงเกิดขึ้นใน FFT
ฉันลอง googling และ wikipedia แล้ว แต่ฉันยังไม่ได้รับคำตอบนอกเหนือจาก 'เพราะความถี่ของสัญญาณอินพุตอยู่ระหว่างสองถังขยะ' ฉันเข้าใจว่านี่คือเหตุผล แต่สิ่งที่ฉันไม่เข้าใจคือสาเหตุที่การรั่วไหลดูเหมือนว่าจะขยายไปยังถังขยะติดกันหลายแห่งแทนที่จะเป็นถังขยะที่อยู่ติดกันเพียงถังเดียว เพื่อแสดงสิ่งที่ฉันกำลังพูดถึงนี่คือข้อมูลจำลอง (รหัสที่ท้ายโพสต์): ด้านบนคือสเปกตรัม FFT (พล็อตในระดับบันทึก) ของคลื่นไซน์ของความถี่ 10 อัตราการสุ่มตัวอย่างคือหนึ่งและจำนวนตัวอย่างคือ 100 กราฟได้รับการเลื่อน FFT เห็นได้ชัดว่ามีเพียงจุดสูงสุดที่ bin 10 และส่วนที่เหลืออยู่ในลำดับของข้อผิดพลาดเชิงตัวเลขหรือที่นั่น นี่คือสเปกตรัมความถี่ที่ความถี่ที่สร้างขึ้นที่ 10.1 เห็นได้ชัดว่ามี 'การรั่วไหล' ในถังขยะมากกว่าถังขยะที่อยู่ติดกันทันที นี่คือโครงเรื่องสำหรับความถี่ 10.5 คำถาม:ทำไมมีการรั่วไหลนี้และทำไมมันถึงขยายไปยังถังขยะอื่นทั้งหมดแทนที่จะเป็นถังขยะที่อยู่ติดกัน? รหัสสำหรับทุกคนที่สนใจ (รหัสหลาม) import numpy as np import matplotlib.pyplot as plt xFreq = 10.5 xSize = 100.0 xPeriod = …

4
คุณคำนวณความเรียบของสเปกตรัมจาก FFT อย่างไร
ตกลงความเรียบของสเปกตรัม (หรือเรียกอีกอย่างว่า Wiener เอนโทรปี) ถูกกำหนดเป็นอัตราส่วนของค่าเฉลี่ยเรขาคณิตของสเปกตรัมต่อค่าเฉลี่ยเลขคณิต วิกิพีเดียและการอ้างอิงอื่น ๆ บอกว่าสเปกตรัมกำลัง นั่นคือจตุรัสของฟูริเยร์ใช่ไหม FFT สร้าง "สเปกตรัมแอมพลิจูด" แล้วคุณยกกำลังสองนั้นเพื่อให้ได้ "สเปกตรัมพลังงาน"? โดยพื้นฐานแล้วสิ่งที่ฉันอยากรู้คือถ้าspectrum = abs(fft(signal))สิ่งใดที่ถูกต้อง? spectral_flatness = gmean(spectrum)/mean(spectrum) spectral_flatness = gmean(spectrum^2)/mean(spectrum^2) คำนิยามของ Wikipedia ดูเหมือนว่าจะใช้ขนาดโดยตรง: F l a t n e s s = ∏ยังไม่มีข้อความ- 1n = 0x ( n )---------√ยังไม่มีข้อความΣยังไม่มีข้อความ- 1n = 0x ( n )ยังไม่มีข้อความ= ประสบการณ์( 1)ยังไม่มีข้อความΣยังไม่มีข้อความ- …

9
เหตุใดเราจึงใช้หน้าต่างในโดเมนเวลาแทนที่จะทำ FFT ปรับเปลี่ยนคลื่นความถี่และเปลี่ยนเป็น FFT แบบผกผัน
ฉันคิดว่า DSP จะทำได้โดยใช้ FFT บางส่วนของสัญญาณปรับเปลี่ยนตัวอย่างที่เป็นผลมาจาก FFT (เนื่องจากพวกเขาเป็นตัวแทนของสเปกตรัมของสัญญาณ + เสียงของเรา) และลบสัญญาณที่ไม่ต้องการและนอกเหนือจาก FFT ผกผันเพื่อให้ได้เวลา การเป็นตัวแทนโดเมนของสัญญาณกรอง (ลบเสียงรบกวนแล้ว) อย่างไรก็ตามสิ่งนี้ไม่ได้ทำแทนเราทำงานทั้งหมดในโดเมนเวลาโดยใช้ฟังก์ชั่นหน้าต่าง ทำไม? ถ้าเราคูณฟังก์ชันของหน้าต่างในโดเมนเวลามากกว่าที่เราเชื่อว่าการตอบสนองความถี่ของฟังก์ชันหน้าต่างกับสเปกตรัมของสัญญาณในโดเมนความถี่ของเรานั้นเป็นอย่างไร ฉันหมายถึงถ้าเราเพิ่งทำงานทั้งหมดในโดเมนความถี่ด้วยการเพิ่มสัญญาณของเราด้วยการตอบสนองความถี่ของตัวกรองนั่นจะเป็นการกรองใช่ไหม แต่ที่นี่เราทำทุกสิ่งในโดเมนเวลาแทนที่จะใช้หน้าต่าง -> ให้ดูว่าความสับสนของฉันมาจากไหน สำหรับตัวกรองแบบอะนาล็อกเช่นตัวกรองความถี่ต่ำเรามีพัลส์เช่นการตอบสนองความถี่ เมื่อเรากรองสัญญาณเราจะเพิ่มสเปกตรัมของสัญญาณอย่างมีประสิทธิภาพด้วยพัลส์เช่นการตอบสนองความถี่ของตัวกรอง สิ่งนี้จะลดความถี่ทั้งหมดในสัญญาณของเราเหนือการตัดออกเป็น 0 นี่คือการทำงานของตัวกรองสัญญาณความถี่ต่ำ ทำไมไม่ทำเช่นเดียวกันกับตัวกรองดิจิตอลด้วย?

1
คำศัพท์: สเปกตรัม, สเปกโตรแกรม, สเปกโตรกราฟ, โซแกรม, ฯลฯ
ในแง่ของอนุสัญญาการตั้งชื่อที่เหมาะสมหรือเป็นที่ยอมรับของกราฟิก DSP หรือเอาท์พุทของเครื่องมืออะไรคือความแตกต่างระหว่างคำว่าสเปกตรัม, สเปกโตรแกรม, สเปกโตรกราฟ, และคำที่คล้ายกันและชนิดของแผนภูมิกราฟ CRT . เพิ่ม: นอกจากนี้ฉันยังพบคำว่า sonogram ที่ใช้ในหนังสือสองเล่มสำหรับกราฟิกสเปกตรัมเทียบกับเวลา เมื่อใดจึงอาจเหมาะสมในการตั้งค่าตามเงื่อนไขข้อใดข้อหนึ่งข้างต้นหรือในทางกลับกัน

3
ฉันจะพลอตความถี่เทียบกับขนาดของการแปลงเวฟเล็ตได้อย่างไร?
ฉันกำลังใช้การแปลงเวฟเล็ตอย่างต่อเนื่องของ Morlet ฉันมีwscalogramสัญญาณแล้วและตอนนี้ฉันต้องการพล็อตความอิสระเช่นภาพต่อไปนี้ แต่ฉันไม่รู้จะทำอย่างไร: ฉันใช้scal2freqฟังก์ชั่น MATLAB เพื่อแปลงเครื่องชั่งเป็นความถี่หลอก นอกจากนี้ฉันยังมีความถี่ในสัญญาณของฉันที่มีอัตราส่วนลดลงมาก (4%) ดังนั้นพวกเขาจึงไม่สามารถมองเห็นได้อย่างชัดเจนในพล็อต ฉันจะพูดเกินจริงโหมดที่ได้รับการป้องกันอย่างสูงเหล่านี้ได้อย่างไร ฉันใช้ MATLAB นี่คือรหัสของฉัน: % Import the text4.txt to matlab workspace. and save it under name "data" t=linspace(0,30,301); Fs=ceil(inv(t(2)-t(1))); x=data(:,4); % use x=data(:,3),x=data(:,5) too. first column is time,second is refrence wname = 'morl'; scales = 1:1:256; coefs = cwt(x,scales,wname,'lvlabs'); freq …

1
ในการใช้ eigenvector เพื่อประเมินความถี่พื้นฐานของสัญญาณผ่านทาง MUSIC
บริบท: (ข้อจำกัดความรับผิดชอบ: นี่ไม่ใช่ปัญหาการสื่อสาร) ฉันพยายามที่จะประเมินความถี่พื้นฐานของสัญญาณที่แท้จริงและเป็นระยะ สัญญาณนี้ถูกสร้างขึ้นโดยจับคู่กรองสัญญาณดิบกับของพัลส์ (ตัวกรองที่ตรงกัน) สัญญาณผลลัพธ์มีคุณสมบัติดังต่อไปนี้: มันเป็นระยะ (พื้นฐานคือ 1 / งวด) และนี่คือสิ่งที่ฉันพยายามประเมิน มันไม่หยุดนิ่งในเวลา โดยเฉพาะแอมพลิจูดของพัลส์เป็นระยะสามารถเปลี่ยนแปลงได้ในแอมพลิจูด (เช่นชีพจรหนึ่งอาจต่ำในขณะที่อีกสูงและต่ำถัดไปอีกครั้งและหนึ่งหลังจากสื่อนั้น ฯลฯ ) ฉันเชื่อว่ามันคงที่ในความถี่ (เท่าที่คุณยอมรับการเปลี่ยนแอมพลิจูด แต่ไม่เปลี่ยนแบนด์) มันมีความเพี้ยน สิ่งที่ฉันหมายถึงที่นี่คือ (และแก้ไขฉันถ้าฉันผิด) แต่สัญญาณพัลส์ภายในสัญญาณไม่ได้เป็นไซนัส แต่เป็นรูปร่างที่ "ขี้ขลาด" เช่นเกาส์สามเหลี่ยม - อิชครึ่งอาราโบลา ฯลฯ . ฉันพยายามประเมินความถี่พื้นฐานของสัญญาณนี้ แน่นอนว่าบางครั้งสัญญาณดิบนั้นไม่ได้เป็นเพียงแค่สัญญาณรบกวน แต่ยังคงผ่านเส้นทางและได้รับการกรองอย่างเหมาะสม (เพิ่มเติมในภายหลัง) สิ่งที่ฉันได้ลอง: ตอนนี้ฉันได้ตระหนักถึงการประมาณค่าความถี่พื้นฐานมากมายเช่น วิธีการสัมพันธ์อัตโนมัติ หยินและการอ้างอิงทั้งหมด วิธีการ FFT ฯลฯ YIN: ฉันยังไม่ได้ลอง YIN วิธีการ FFT: วิธีการ FFT …

2
การรับรู้ประสานเสียงประสาน
การถอดเสียงโพลีโฟนิคเพลงในปัจจุบันไม่ได้เป็นปัญหาที่แก้ไขแล้ว วิธีการเกี่ยวกับการผกผันของปัญหาเล็ก ๆ มีลักษณะสเปกตรัมแบบใดบ้าง (จาก STFT) ที่สามารถใช้เพื่อกำจัดคอร์ดดนตรีบางส่วนจากพื้นที่ความน่าจะเป็นหรือไม่? (เช่นตัวอย่างของเสียงส่วนใหญ่น่าจะไม่มีคอร์ด C # หรือคอร์ดเล็ก ๆ น้อย ๆ ที่ลดลงหรือเป็นโน้ตเดี่ยวที่ไม่ใช่คอร์ด ฯลฯ ) สมมติว่าตัวอย่างข้อมูลเสียงมีความนิ่งมากขึ้นหรือน้อยลง (ลบการโจมตีชั่วคราว ฯลฯ ) และเสียงส่วนเกินสำหรับบันทึกย่อส่วนบุคคลหรือทั้งหมดมีแนวโน้มมาก (และคำถามนี้ไม่เกี่ยวกับคอร์ดฤinษี)

1
การเปลี่ยนแปลงใดที่เลียนแบบระบบการได้ยินของมนุษย์มากที่สุด
การแปลงฟูริเยร์มักใช้สำหรับการวิเคราะห์ความถี่ของเสียง อย่างไรก็ตามมันมีข้อเสียเมื่อวิเคราะห์การรับรู้เสียงของมนุษย์ ยกตัวอย่างเช่นถังขยะความถี่เป็นเชิงเส้นในขณะที่หูมนุษย์ตอบสนองความถี่ลอการิทึมไม่เป็นเส้นตรง การแปลงเวฟเล็ตสามารถแก้ไขความละเอียดสำหรับช่วงความถี่ที่แตกต่างกันซึ่งแตกต่างจากการแปลงฟูริเยร์ เวฟแปลงคุณสมบัติของช่วยให้การสนับสนุนชั่วคราวขนาดใหญ่สำหรับความถี่ต่ำในขณะที่รักษาความกว้างชั่วขณะสั้นสำหรับความถี่สูง Morlet เวฟเกี่ยวข้องอย่างใกล้ชิดกับการรับรู้ของมนุษย์ในการได้ยิน สามารถใช้กับการถอดความเพลงและให้ผลลัพธ์ที่แม่นยำมากซึ่งไม่สามารถทำได้โดยใช้เทคนิคการแปลงฟูริเยร์ มีความสามารถในการจับภาพการบรรเลงเพลงสั้น ๆ ซ้ำ ๆ และสลับกันโดยมีเวลาเริ่มต้นและสิ้นสุดที่ชัดเจนสำหรับแต่ละโน้ต คง-Q เปลี่ยน (ที่เกี่ยวข้องอย่างใกล้ชิดกับ Morlet แปลงเวฟเล็ต) นอกจากนี้ยังเหมาะกับข้อมูลดนตรี เนื่องจากเอาต์พุตของการแปลงเป็นแอมพลิจูด / เฟสอย่างมีประสิทธิภาพต่อความถี่ล็อกจึงจำเป็นต้องใช้ถังขยะสเปกตรัมน้อยกว่าเพื่อให้ครอบคลุมช่วงที่กำหนดได้อย่างมีประสิทธิภาพ การแปลงรูปแบบนี้จะช่วยลดความละเอียดของความถี่ด้วยช่องเก็บความถี่ที่สูงขึ้นซึ่งเป็นที่ต้องการสำหรับการใช้งานด้านการได้ยิน มันสะท้อนระบบการได้ยินของมนุษย์โดยที่ความละเอียดสเปกตรัมที่ต่ำกว่าจะดีกว่าในขณะที่ความละเอียดของสัญญาณชั่วคราวจะเพิ่มขึ้นที่ความถี่สูงขึ้น คำถามของฉันคือ: มีการเปลี่ยนแปลงอื่น ๆ ที่เลียนแบบระบบการได้ยินของมนุษย์อย่างใกล้ชิดหรือไม่? มีใครพยายามออกแบบการแปลงสภาพร่างกาย / ระบบประสาทที่ตรงกับระบบการได้ยินของมนุษย์ให้มากที่สุดหรือไม่? ยกตัวอย่างเช่นมันเป็นที่รู้จักกันว่าหูของมนุษย์มีการตอบสนองลอการิทึมกับความเข้มเสียง นอกจากนี้ยังเป็นที่รู้จักกันว่ารูปทรงเท่ากันเสียงดังแตกต่างกันไม่เพียง แต่มีความรุนแรง แต่มีระยะห่างในความถี่ของส่วนประกอบสเปกตรัม เสียงที่มีองค์ประกอบของสเปกตรัมในช่วงคลื่นวิทยุที่สำคัญจะรับรู้ได้ดังกว่าแม้ว่าความดันเสียงทั้งหมดจะยังคงที่ สุดท้ายหูมนุษย์มีจำกัด มติชั่วขึ้นอยู่กับความถี่ บางทีนี่อาจถูกนำมาพิจารณาด้วยเช่นกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.