คำถามติดแท็ก music

3
การเรียงลำดับส่วน biquad สำหรับตัวกรองคำสั่งซื้อที่สูงขึ้นทำงานอย่างไร
ฉันกำลังพยายามใช้ตัวกรอง IIR อันดับที่ 8 และบันทึกย่อของแอปพลิเคชันและหนังสือทุกเล่มที่ฉันได้อ่านบอกว่ามันเป็นการดีที่สุดที่จะใช้ตัวกรองลำดับที่สองมากกว่านั้นเป็นส่วนที่สอง ฉันใช้tf2sosMATLAB เพื่อรับค่าสัมประสิทธิ์สำหรับส่วนที่สองซึ่งทำให้ฉันมีค่า 6x4 coeffs สำหรับส่วนของคำสั่งที่สอง 4 ตามที่คาดไว้ ก่อนการใช้งานเป็น SOS ตัวกรองลำดับที่ 8 จำเป็นต้องเก็บค่าตัวอย่าง 7 ค่าก่อนหน้า (และค่าเอาต์พุตด้วย) ตอนนี้เมื่อดำเนินการตามลำดับส่วนที่สองโฟลว์ทำงานอย่างไรจากอินพุตไปยังเอาต์พุตฉันต้องเก็บค่าตัวอย่างก่อนหน้านี้เพียง 2 ค่าหรือไม่ หรือผลลัพธ์ของตัวกรองตัวแรกป้อนเช่นเดียวx_inกับตัวกรองที่สองและอื่น ๆ ?
20 filters  filter-design  infinite-impulse-response  biquad  audio  image-processing  distance-metrics  algorithms  interpolation  audio  hardware  performance  sampling  computer-vision  dsp-core  music  frequency-spectrum  matlab  power-spectral-density  filter-design  ica  source-separation  fourier-transform  fourier-transform  sampling  bandpass  audio  algorithms  edge-detection  filters  computer-vision  stereo-vision  filters  finite-impulse-response  infinite-impulse-response  image-processing  blur  impulse-response  state-space  linear-systems  dft  floating-point  software-implementation  oscillator  matched-filter  digital-communications  digital-communications  deconvolution  continuous-signals  discrete-signals  transfer-function  image-processing  computer-vision  3d 

1
ค้นหาเพลงที่คล้ายกันโดยใช้ FFT Spectrums
ฉันได้ทดลองหลายสัปดาห์เพื่อหาวิธีจับคู่ / ค้นหาเพลงที่คล้ายกันในห้องสมุดที่มีแนวดนตรีที่แตกต่างกัน ความพยายามครั้งแรกของฉันคือการตรวจสอบคุณสมบัติเช่น Tempo หรือเสียงเบสที่มีในเพลงที่รวมตัวกันเป็นกลุ่ม แต่ฉันไม่ได้ไปไกลกับวิธีนี้ (การตรวจจับจังหวะการเปลี่ยนแปลงตามปริมาณ) ตั้งแต่ประมาณ 20% ของเพลง Beat เสมอบางครั้ง 1/2 หรือ 1/3 ของพวกเขาและฉันไม่สามารถใช้มันได้ หลังจากพยายามล้มเหลวหลายสัปดาห์ฉันก็มีความคิดใหม่ซึ่งจะอธิบายต่อไปในโพสต์นี้ เพียงแค่ทำให้มันใช้งานได้โดยใช้ Spectrum Samples of Files ทำให้เป็นเหมือน "Average Spectrum" ของไฟล์เพื่อเปรียบเทียบ แนวคิดที่อยู่เบื้องหลังคือตัวอย่างเช่น Hardstyle มีเบสมากกว่าเพลงร็อคโดยเฉลี่ยฉันยังตรวจสอบเรื่องนี้ด้วยการดู Spectrums ใน Audacity ไฟล์ 1: นำไฟล์เต็ม FFT Spectrums (2048 ตัวอย่างขนาด ATM, สัดส่วนการบันทึก Amplitudes) รวมอาร์เรย์สเปกตรัมทั้งหมดใช้ค่าเฉลี่ยของแต่ละ Bin ทำเช่นเดียวกันกับไฟล์อื่นบางไฟล์จัดเก็บผลลัพธ์ทั้งหมด ทำรายการค่า FFT ความแตกต่างระหว่างไฟล์ 1 …
16 audio  fft  music 

4
วิธีที่มีประสิทธิภาพมากที่สุดในการแยกส่วนประกอบความถี่ของสัญญาณเสียงด้วยความแม่นยำของมนุษย์ใกล้เคียงแบบเรียลไทม์
ฉันกำลังพยายามหาวิธีที่จะแยกส่วนประกอบความถี่ของตัวอย่างเสียงตามอำเภอใจ (โดยทั่วไปคือเพลง) ในลักษณะที่คล้ายกับ FFT แต่ในการวิจัยของฉันเกี่ยวกับอัลกอริทึม FFT ฉันได้เรียนรู้ว่ามันมีบางอย่าง ข้อ จำกัด รุนแรงสำหรับวัตถุประสงค์นี้ มี 3 ปัญหาที่ FFT กำลังนำเสนอ: เนื่องจากความละเอียดถังขยะ FFT เทียบเท่ากับขนาดหน้าต่างของคุณเพื่อให้ได้ความแม่นยำที่สมเหตุสมผล (พูด 1 Hz) คุณต้องมีหน้าต่างที่ยาวเกินสมควร (พูด 1 วินาที) ซึ่งหมายความว่าคุณไม่สามารถตรวจพบทรานแซคชันหรือความถี่ที่เพิ่งเปิดใหม่ได้อย่างรวดเร็ว นอกจากนี้ยังหมายความว่าปัญหาจะไม่สามารถแก้ไขได้ด้วย CPU ที่เร็วขึ้นและอัตราการสุ่มตัวอย่างที่สูงขึ้น - ข้อ จำกัด ถูกผูกติดอยู่กับเวลา มนุษย์รับรู้ความถี่ลอการิทึม แต่ถังขยะ FFT อยู่ห่างกันเป็นเส้นตรง เช่นความแตกต่างของ 20hz ที่จุดต่ำสุดของการได้ยินของเรามีขนาดใหญ่มากในขณะที่ความแตกต่างของ 20hz ที่ระดับสูงสุดนั้นไม่สามารถมองเห็นได้ ดังนั้นเพื่อให้ได้ความแม่นยำที่เราต้องการที่ความถี่ต่ำเราต้องคำนวณมากกว่าที่เราต้องการในความถี่สูง ปัญหาเหล่านี้บางอย่างสามารถแก้ไขได้โดยการสอดแทรกระหว่างถังขยะ FFT สิ่งนี้อาจใช้งานได้กับเสียงดนตรีมากเพราะความถี่มักจะอยู่ห่างกันมากและดังนั้นไม่เกิน 1 ความถี่จะรั่วไหลลงในถังขยะคู่ แต่นี่จะไม่เป็นเช่นนั้นเสมอไปโดยเฉพาะอย่างยิ่งสำหรับเสียงที่น่าสนใจเช่นเครื่องดนตรีประเภทเคาะ ดังนั้นการแก้ไขจึงเป็นการคาดเดาจริงๆ …

2
การรับรู้ประสานเสียงประสาน
การถอดเสียงโพลีโฟนิคเพลงในปัจจุบันไม่ได้เป็นปัญหาที่แก้ไขแล้ว วิธีการเกี่ยวกับการผกผันของปัญหาเล็ก ๆ มีลักษณะสเปกตรัมแบบใดบ้าง (จาก STFT) ที่สามารถใช้เพื่อกำจัดคอร์ดดนตรีบางส่วนจากพื้นที่ความน่าจะเป็นหรือไม่? (เช่นตัวอย่างของเสียงส่วนใหญ่น่าจะไม่มีคอร์ด C # หรือคอร์ดเล็ก ๆ น้อย ๆ ที่ลดลงหรือเป็นโน้ตเดี่ยวที่ไม่ใช่คอร์ด ฯลฯ ) สมมติว่าตัวอย่างข้อมูลเสียงมีความนิ่งมากขึ้นหรือน้อยลง (ลบการโจมตีชั่วคราว ฯลฯ ) และเสียงส่วนเกินสำหรับบันทึกย่อส่วนบุคคลหรือทั้งหมดมีแนวโน้มมาก (และคำถามนี้ไม่เกี่ยวกับคอร์ดฤinษี)

1
การเปลี่ยนแปลงใดที่เลียนแบบระบบการได้ยินของมนุษย์มากที่สุด
การแปลงฟูริเยร์มักใช้สำหรับการวิเคราะห์ความถี่ของเสียง อย่างไรก็ตามมันมีข้อเสียเมื่อวิเคราะห์การรับรู้เสียงของมนุษย์ ยกตัวอย่างเช่นถังขยะความถี่เป็นเชิงเส้นในขณะที่หูมนุษย์ตอบสนองความถี่ลอการิทึมไม่เป็นเส้นตรง การแปลงเวฟเล็ตสามารถแก้ไขความละเอียดสำหรับช่วงความถี่ที่แตกต่างกันซึ่งแตกต่างจากการแปลงฟูริเยร์ เวฟแปลงคุณสมบัติของช่วยให้การสนับสนุนชั่วคราวขนาดใหญ่สำหรับความถี่ต่ำในขณะที่รักษาความกว้างชั่วขณะสั้นสำหรับความถี่สูง Morlet เวฟเกี่ยวข้องอย่างใกล้ชิดกับการรับรู้ของมนุษย์ในการได้ยิน สามารถใช้กับการถอดความเพลงและให้ผลลัพธ์ที่แม่นยำมากซึ่งไม่สามารถทำได้โดยใช้เทคนิคการแปลงฟูริเยร์ มีความสามารถในการจับภาพการบรรเลงเพลงสั้น ๆ ซ้ำ ๆ และสลับกันโดยมีเวลาเริ่มต้นและสิ้นสุดที่ชัดเจนสำหรับแต่ละโน้ต คง-Q เปลี่ยน (ที่เกี่ยวข้องอย่างใกล้ชิดกับ Morlet แปลงเวฟเล็ต) นอกจากนี้ยังเหมาะกับข้อมูลดนตรี เนื่องจากเอาต์พุตของการแปลงเป็นแอมพลิจูด / เฟสอย่างมีประสิทธิภาพต่อความถี่ล็อกจึงจำเป็นต้องใช้ถังขยะสเปกตรัมน้อยกว่าเพื่อให้ครอบคลุมช่วงที่กำหนดได้อย่างมีประสิทธิภาพ การแปลงรูปแบบนี้จะช่วยลดความละเอียดของความถี่ด้วยช่องเก็บความถี่ที่สูงขึ้นซึ่งเป็นที่ต้องการสำหรับการใช้งานด้านการได้ยิน มันสะท้อนระบบการได้ยินของมนุษย์โดยที่ความละเอียดสเปกตรัมที่ต่ำกว่าจะดีกว่าในขณะที่ความละเอียดของสัญญาณชั่วคราวจะเพิ่มขึ้นที่ความถี่สูงขึ้น คำถามของฉันคือ: มีการเปลี่ยนแปลงอื่น ๆ ที่เลียนแบบระบบการได้ยินของมนุษย์อย่างใกล้ชิดหรือไม่? มีใครพยายามออกแบบการแปลงสภาพร่างกาย / ระบบประสาทที่ตรงกับระบบการได้ยินของมนุษย์ให้มากที่สุดหรือไม่? ยกตัวอย่างเช่นมันเป็นที่รู้จักกันว่าหูของมนุษย์มีการตอบสนองลอการิทึมกับความเข้มเสียง นอกจากนี้ยังเป็นที่รู้จักกันว่ารูปทรงเท่ากันเสียงดังแตกต่างกันไม่เพียง แต่มีความรุนแรง แต่มีระยะห่างในความถี่ของส่วนประกอบสเปกตรัม เสียงที่มีองค์ประกอบของสเปกตรัมในช่วงคลื่นวิทยุที่สำคัญจะรับรู้ได้ดังกว่าแม้ว่าความดันเสียงทั้งหมดจะยังคงที่ สุดท้ายหูมนุษย์มีจำกัด มติชั่วขึ้นอยู่กับความถี่ บางทีนี่อาจถูกนำมาพิจารณาด้วยเช่นกัน

2
ผลการสังเคราะห์เสียงสำหรับเสียงที่เป็นธรรมชาติ
ขณะนี้ฉันกำลังทำงานกับเครื่องสังเคราะห์หีบเพลงและฉันต้องการให้เสียงเป็นธรรมชาติที่สุด ฉันชอบเสียงคลื่นต่อไปนี้จริง ๆ : https://dl.dropbox.com/u/20437903/onda%20acordeon.wav คลื่นมีลักษณะดังนี้: เมื่อมองไปที่คลื่นดูเหมือนว่ามันได้เพิ่มและประสานกันอย่างกลมกลืน ฉันผิดหรือเปล่า? ฉันยังใหม่กับการสังเคราะห์เสียงและจะขอบคุณมากถ้าใครสามารถโปรดช่วยฉันระบุผลกระทบที่ใช้กับคลื่นและแนวทางบางอย่างเพื่อนำไปใช้ ขอบคุณ
12 music  sound 

2
วิธีการใดที่ใช้สำหรับการแยกแยะความแตกต่างของเสียง (ดนตรี?)
ฉันพยายามค้นคว้าและหาวิธีที่ดีที่สุดในการโจมตีปัญหานี้ มันเลาะเลียบไปกับการประมวลผลเพลงการประมวลผลภาพและการประมวลผลสัญญาณและดังนั้นจึงมีวิธีมากมายในการดู ฉันต้องการสอบถามวิธีการที่ดีที่สุดในการเข้าหามันเนื่องจากสิ่งที่อาจดูซับซ้อนในโดเมน sig-proc บริสุทธิ์อาจเป็นเรื่องง่าย (และแก้ไขแล้ว) โดยผู้ที่ทำภาพหรือการประมวลผลเพลง อย่างไรก็ตามปัญหามีดังนี้: หากคุณยกโทษให้ฉันด้วยการวาดปัญหาเราจะเห็นสิ่งต่อไปนี้: f1f1f_1f4f4f_4 f1f1f_1 f1f1f_1 ปัญหาคือในทางใดที่ฉันจะแก้ไขปัญหานี้เช่นฉันสามารถเขียนลักษณนามที่สามารถแยกแยะระหว่างสัญญาณ -1 สัญญาณ 2 และสัญญาณ 3 นั่นคือถ้าคุณป้อนสัญญาณสัญญาณใดสัญญาณหนึ่งมันควรจะบอกได้ว่าสัญญาณนี้เป็นเช่นนั้น สิ่งที่ดีที่สุดของลักษณนามจะให้เมทริกซ์ความสับสนในแนวทแยง? บริบทเพิ่มเติมบางอย่างและสิ่งที่ฉันคิดเกี่ยวกับป่านนี้: อย่างที่ฉันพูดไปนี้เลาะเลียบทุ่งจำนวนมาก ฉันต้องการสอบถามเกี่ยวกับวิธีการที่อาจมีอยู่ก่อนที่ฉันจะนั่งลงและไปทำสงครามกับสิ่งนี้ ฉันไม่ต้องการประดิษฐ์ล้ออีกครั้งโดยไม่ได้ตั้งใจ นี่คือความคิดบางอย่างที่ฉันได้มองจากมุมมองที่แตกต่างกัน มุมมองการประมวลผลสัญญาณ: สิ่งหนึ่งที่ฉันได้ดูคือทำการวิเคราะห์ Cepstralและจากนั้นอาจใช้Gabor Bandwidthของ cepstrum ในการแยกแยะสัญญาณ -3 จากอีก 2 และจากนั้นวัดจุดสูงสุดสูงสุดของ cepstrum ในการแยกสัญญาณ - 1 จากสัญญาณ -2 นั่นเป็นโซลูชันการทำงานการประมวลผลสัญญาณปัจจุบันของฉัน จุดยืนของการประมวลผลภาพ: ที่นี่ฉันกำลังคิดอยู่เพราะในความเป็นจริงฉันสามารถสร้างภาพที่มีสเปคตรัมได้หรือเปล่า ฉันไม่คุ้นเคยอย่างใกล้ชิดกับส่วนนี้ แต่สิ่งที่เกี่ยวกับการทำ 'เส้น' ตรวจจับโดยใช้การแปลง Houghแล้วอย่างใด 'นับ' …

2
การแปลงค่า pitch bend (MIDI) เป็นค่า pitch“ ปกติ”
ฉันพยายามวิเคราะห์ออฟไลน์ LPC และการสังเคราะห์โดยใช้ rt_lpc (เวลาจริง LPC) การดำเนินการตามที่กำหนดที่นี่ มีฟังก์ชั่นบางอย่างภายในโปรแกรมที่สามารถใช้สำหรับการวิเคราะห์ LPC ออฟไลน์และโปรแกรมสังเคราะห์ รหัส rt_lpc นั้นส่วนใหญ่มีไว้สำหรับผู้แต่งเป็นต้นซึ่งหมายความว่ามันใช้ MIDI หรืออินพุตสัญญาณสายเสียง มีบางรหัสในโปรแกรมที่แปลงค่าระยะห่าง (ที่ได้จากการสัมพันธ์อัตโนมัติ) เป็นbendค่า ความสัมพันธ์มีดังนี้: pitch = (int)( Stk::sampleRate() / midi2pitch[ananya.data[1]] ) / pow( 1.0653f, bend/64.0f*11.0f ); power *= ananya.data[2] / 64.0f; bend = ge.data[1] / 128.0f + ge.data[2] - 64; บางจุด: เป็นวัตถุประเภทที่ดูเหมือนว่าจะมีประชากรได้ทันที ข ยังเป็นวัตถุประเภทที่ดูเหมือนว่าจะมีประชากรได้ทันที ค. …
11 music  pitch 

3
เล่นเพลงช้าลงในขณะที่รักษาความถี่
การเล่นเสียงเพลงด้วยความเร็วที่ช้าลงจะทำให้ระดับเสียงต่ำลง (ความถี่) มีเครื่องมือและทฤษฎีที่จะทำให้การเล่นเพลงช้าลงในขณะที่รักษาความถี่เหมือนเดิมหรือไม่? ฉันคิดว่าสามารถแปลงฟูริเยร์แบบเรียงซ้อนหรือแปลงเวฟเล็ตได้ ดูเหมือนว่าเราจะต้องเลือกขนาดหน้าต่างล่วงหน้าหรือเลือกเวฟเล็ตพื้นฐาน มีทฤษฎีและการประยุกต์ใช้ที่เฉพาะเจาะจงและละเอียดสำหรับการทำเช่นนั้นหรือ

1
การดำเนินการพื้นฐานประเภทใดบ้างที่ทำกับสัญญาณเสียงเพื่อสร้างเสียงที่น่าสนใจ
ฉันไม่รู้ว่าคำถามนี้จะสมเหตุสมผลหรือไม่เพราะฉันใหม่กับ dsp มาก ในการจู่โจมที่ จำกัด ของฉันเกี่ยวกับเสียง dsp ฉันได้เจอ: การปรับความถี่ Amplitude Modulation การสังเคราะห์สารเติมแต่ง การสังเคราะห์การหักลบ คำถามของฉันคือ: เหล่านี้เป็นหมวดหมู่พื้นฐานที่สำคัญของการจัดการสัญญาณ (โดยเฉพาะสำหรับเสียง) หรือไม่ กล่าวอีกนัยหนึ่งว่าเอฟเฟกต์และสิ่งแฟนซีทั้งหมดที่ FL Studio พร้อมกับชุดปลั๊กอินเต็มรูปแบบสามารถทำได้ถูกแบ่งออกเป็นซีรีย์และการรวมกันของการดำเนินงาน 4 ข้อด้านบน? หรือจะมีทั้งพวงมากกว่า? DAW ที่ทันสมัยพร้อมปลั๊กอินสามารถแยกย่อยประเภทใด ๆ ในลักษณะนี้ได้หรือไม่? 4 หมวดหมู่ข้างต้นมีเหตุผลในตัวเองใช่ไหม! พื้นหลังเล็กน้อย: โดยพื้นฐานแล้วฉันกำลังพยายามสร้างซินธิไซเซอร์ / ตัวแก้ไขเสียงขั้นพื้นฐาน (แต่ยืดหยุ่นมาก) เป็นโครงการเพื่อเรียนรู้ทั้งการเขียนโปรแกรมและเสียง dsp การใช้จาวาฉันเริ่มต้นด้วยการเลียนแบบคลาสซินเดอเรเตอร์ในโลกแห่งความจริงขั้นพื้นฐานการเรียกสิ่งต่าง ๆ เช่น Oscillator และ LFO และสิ่งที่คล้ายกัน แต่ทุกครั้งที่ฉันเรียนรู้สิ่งใหม่ฉันพบว่าตัวเองต้องเขียนทุกอย่าง ฉันกำลังพยายามที่จะเริ่มต้นใหม่อีกครั้งและมากับวัตถุพื้นฐานและโครงสร้างของโปรแกรม เพื่อให้ถูกต้องฉันต้องรู้ว่าฉันควรอนุญาตให้วัตถุเหล่านี้โต้ตอบ ฯลฯ ได้อย่างไร ... …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.