คำถามติดแท็ก audio

เสียงหรือในแง่ของการประมวลผลสัญญาณสัญญาณเสียงเป็นการแทนเสียงแบบอะนาล็อกหรือดิจิตอลโดยทั่วไปเป็นแรงดันไฟฟ้า

1
การแปลงฟูริเยร์แบบไม่ต่อเนื่อง - ค้นหาพื้นฐานอย่างรวดเร็วหรือไม่
ครั้งแรกฉันขอโทษเพราะฉันเป็นนักพัฒนาซอฟต์แวร์และเป็นเวลานานมากที่ฉันไม่ได้ดำน้ำในวิชาคณิตศาสตร์ที่บริสุทธิ์ดังนั้นคำถามของฉันอาจดูเหมือนโง่ ฉันหวังว่าไม่ บริบทคือการจดจำเสียงในเพลง หากคุณจดโน้ตดนตรีและใช้การแปลงฟูริเยร์กับมันคุณจะมีจำนวนผลรวมของแอมพลิจูดไม่ จำกัด ตามความถี่ที่กำหนด ตัวอย่างเช่นถ้าฉันเล่นโน้ตที่มีพื้นฐานอยู่FFFในเครื่องดนตรีใด ๆ หลังจากการแปลงฟูริเยร์ฉันจะมีฮาร์โมนิกส์ที่ F,2F,3F,…,nFF,2F,3F,…,nFF, 2F, 3F,\ldots,nF. ความถี่ทุกความถี่จะมีแอมพลิจูดที่กำหนดซึ่งกำหนดเสียงต่ำของเครื่องดนตรี (เปียโนเสียงทรัมเป็ต ... ทั้งหมดตามรอยแยกนี้ แต่คุณจะมีแอมพลิจูดที่แตกต่างกันสำหรับทุกฮาร์โมนิก) ตอนนี้สิ่งที่ฉันต้องการจะทำคือจากสัญญาณเสียงที่ระบุค้นหา FFF. แค่นั้น. มันซับซ้อนกว่าที่คิดเพราะคุณจะมีเสียงรบกวนจากพื้นหลังเสมอ ...FFF ไม่จำเป็นต้องใช้ความถี่พร้อมแอมพลิจูดสูงสุด! ดังนั้นความคิดของฉันสำหรับการค้นหา FFF คือการใช้ DFT (จริง ๆ แล้ว FFT สำหรับความเร็ว) และค้นหาความบ้าคลั่ง FFF, ดังนั้น F+2F+3F+…+nFF+2F+3F+…+nFF + 2F +3F + \ldots + nF สูงสุดในเอาต์พุต FFT คุณคิดว่าเป็นไปได้หรือไม่ คุณคิดว่าเป็นไปได้ในเวลาอันสั้น (สมมติว่า <5 มิลลิวินาที)
9 audio  fft  pitch 

1
อัลกอริทึมการสังเคราะห์การปรับความถี่
จากสิ่งที่ฉันอ่านฉันได้สร้างอัลกอริทึมสำหรับการสังเคราะห์เสียง FM ฉันไม่แน่ใจว่าฉันทำถูก เมื่อสร้างซอร์ฟแวร์ synth เครื่องมือฟังก์ชั่นจะใช้ในการสร้าง oscillator และโมดูเลเตอร์สามารถใช้ในการโมดูลความถี่ของ oscillator นี้ ฉันไม่รู้ว่าการสังเคราะห์ FM ควรจะทำงานเพื่อปรับคลื่นไซน์หรือไม่? อัลกอริทึมใช้ฟังก์ชั่นคลื่นเครื่องมือและดัชนีโมดูเลเตอร์และอัตราส่วนสำหรับโมดูเลเตอร์ความถี่ สำหรับแต่ละโน้ตนั้นจะใช้ความถี่และเก็บค่าเฟสสำหรับสัญญาณพาหะและออสซิลเลเตอร์ ตัวดัดแปลงจะใช้คลื่นไซน์เสมอ นี่คืออัลกอริทึมใน pseudocode: function ProduceSample(instrument, notes_playing) for each note in notes_playing if note.isPlaying() # Calculate signal if instrument.FMIndex != 0 # Apply FM FMFrequency = note.frequency*instrument.FMRatio; # FM frequency is factor of note frequency. note.FMPhase …

2
การจดจำรูปแบบสำหรับข้อมูลชั่วคราว
ฉันพยายามตรวจจับและจำแนกเสียงที่ไม่ใช่คำพูด ขณะนี้ฉันกำลังใช้สเปคตรัมกำลังเคลื่อนที่ซ้อนทับกันจากเสียงการฝึกอบรมเป็นคุณสมบัติที่ฉันกำลังมองหา เมื่อฉันทำการวิเคราะห์ฉันแค่คำนวณจำนวนสเปคตรัมที่ทับซ้อนกันจำนวนเท่ากันดังนั้นจำนวนของฟีเจอร์จะเท่ากัน ตอนนี้ประสิทธิภาพไม่ดีมากมันสามารถตรวจจับความเงียบและไม่เงียบได้เท่านั้น มีเทคนิคอะไรบ้างสำหรับการตรวจจับสัญญาณประเภทนี้? หนึ่งในข้อกังวลของฉันคือสำหรับเสียงที่มีความยาวต่างกันในโดเมนเวลาจะส่งผลให้ความยาวของเวกเตอร์ของคุณลักษณะต่างกันซึ่งฉันไม่สามารถใช้ตัวจําแนกแบบเดียวกันได้ฉันติดอยู่กับสิ่งนี้
9 audio 

1
วิธีแบ่งเซ็กเมนต์เสียงโทรศัพท์ให้เป็นความเงียบ / ไม่เงียบ
ปัญหาของฉันคือฉันไม่รู้พลังงานของเสียงพื้นหลังดังนั้นฉันจึงไม่สามารถ จำกัด พลังงานได้ การประมวลผลเสร็จในเวลาจริงและฉันมีเวลาประมาณ 500 มิลลิวินาทีในการตัดสินใจ เป็นการดีที่ฉันต้องการพยัญชนะที่เงียบสงบซึ่งไม่ใช่ความเงียบ

2
วิธีการใช้การแปลง Hough แบบไล่ระดับสี
ฉันพยายามใช้การแปลง Hough สำหรับการตรวจจับขอบและต้องการใช้ภาพไล่ระดับสีเป็นพื้นฐาน สิ่งที่ฉันได้ทำเพื่อให้ห่างไกลได้รับภาพIที่มีขนาด[M,N]และอนุพันธ์บางส่วนของมันgx, คือการคำนวณมุมการไล่ระดับสีในแต่ละพิกเซลgy ในทำนองเดียวกันผมคำนวณขนาดการไล่ระดับสีเป็นthetas = atan(gy(x,y) ./ gxmagnitudes = sqrt(gx.^2+gy.^2) เพื่อสร้างการแปลง Hough ฉันใช้รหัส MATLAB ต่อไปนี้: max_rho = ceil(sqrt(M^2 + N^2)); hough = zeros(2*max_rho, 101); for x=1:M for y=1:N theta = thetas(x,y); rho = x*cos(theta) + y*sin(theta); rho_idx = round(rho)+max_rho; theta_idx = floor((theta + pi/2) / pi * 100) …

3
จะตรวจสอบผลลัพธ์ FFT ของคลื่นไซน์ได้อย่างไร
ฉันได้รับไฟล์เสียง (คลื่นไซน์) 1,000Hz เป็นอินพุตสำหรับอัลกอริทึม FFT ของฉัน ฉันมีตัวอย่างสเปกตรัมพลังงาน 8192 ตัวอย่างในอาร์เรย์ อะไรคือวิธีที่ดีที่สุดและง่ายที่สุดในการตรวจสอบว่าผลลัพธ์ของฉันถูกหรือผิด? ถ้าฉันให้ไฟล์เสียงเงียบผลลัพธ์จะเป็นศูนย์สำหรับตัวอย่างทั้งหมด ในไซน์ wav ค่า o / p จะเพิ่มขึ้นจาก 20 (ตัวอย่างที่ 0) เป็น 26059811 (ตัวอย่างที่ 743) และค่อยๆลดลงเป็น 40 หากฉันได้รับแนวคิดเกี่ยวกับช่วงเอาต์พุตจากนั้นฉันสามารถพิสูจน์ได้ทางเทคนิคว่า FFT ทำงานได้หรือไม่ ความคิดใด ๆ ที่จะเป็นประโยชน์ อ้างถึงลิงค์นี้สำหรับข้อสงสัยทางเทคนิคใด ๆ
9 fft  audio 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.