คำถามติดแท็ก voice

4
วิธีแยกเสียงจากการกรน
พื้นหลัง: ฉันกำลังทำงานกับโปรแกรม iPhone (พาดพิงถึงใน หลาย อื่น ๆ โพสต์ ) ที่ "ฟัง" นอนกรน / การหายใจในขณะที่หนึ่งคือนอนหลับและกำหนดว่ามีสัญญาณของการหยุดหายใจขณะหลับ (ในขณะที่ก่อนหน้าจอสำหรับ "นอนห้องปฏิบัติการ" การทดสอบ) แอปพลิเคชั่นส่วนใหญ่ใช้ "ความแตกต่างของสเปกตรัม" เพื่อตรวจจับกรน / ลมหายใจและทำงานได้ค่อนข้างดี (มีความสัมพันธ์ 0.85--0.90) เมื่อทดสอบกับการบันทึกแล็บในห้องปฏิบัติการ (ซึ่งจริง ๆ แล้วค่อนข้างมีเสียงดัง) ปัญหา: เสียง "ห้องนอน" ส่วนใหญ่ (พัดลม ฯลฯ ) ฉันสามารถกรองด้วยเทคนิคต่าง ๆ และมักจะตรวจจับการหายใจในระดับ S / N ที่หูมนุษย์ไม่สามารถตรวจพบได้อย่างน่าเชื่อถือ ปัญหาคือเสียงรบกวน ไม่ใช่เรื่องผิดปกติที่จะมีโทรทัศน์หรือวิทยุทำงานในพื้นหลัง (หรือเพียงแค่ให้ใครบางคนกำลังพูดอยู่ในระยะไกล) และจังหวะของเสียงที่ใกล้เคียงกับการหายใจ / การนอนกรน ในความเป็นจริงฉันใช้งานการบันทึกของ Bill …

4
วิธีการเลียนแบบ / คัดลอก / ปลอมเสียงของใครบางคน?
มีแอปพลิเคชั่นใดที่มีอยู่เพื่อสุ่มตัวอย่างเสียงของใครบางคนและใช้เพื่อปรับแต่งเสียงอื่น ๆ หรือสังเคราะห์ข้อความให้มีลักษณะคล้ายกับต้นฉบับหรือไม่ ตัวอย่างเช่นการสาธิตการอ่านออกเสียงข้อความโดย AT&Tช่วยให้คุณสามารถเลือกเสียงและภาษาจากค่าที่ตั้งไว้ล่วงหน้าที่ฉันเดาขึ้นอยู่กับเสียงมนุษย์บางส่วนที่ได้รับการสุ่มตัวอย่าง คุณเรียกกระบวนการนี้อย่างไร มันคือการปรับเสียง? การสังเคราะห์เสียง?
19 modulation  voice 

4
การเขียนโปรแกรม Vocoder
ฉันต้องการตั้งโปรแกรมตัวสังเคราะห์เสียงของฉันเองเช่น"Songify"แต่ฉันไม่สามารถหาอัลกอริธึมของตัวแปลได้อย่างง่าย บางทีคุณสามารถอธิบายหรือบอกตำแหน่งที่จะหาข้อมูลเกี่ยวกับวิธีการทำงานของ Vocoder

3
กรองข้อความจากสัญญาณเสียงที่มีเสียงดัง
ฉันพยายามถอดรหัสข้อความที่ซ่อนอยู่ในไฟล์เสียงที่มีเสียงดังมาก (.wav) (ฉันคิดว่ามันเป็นเสียงสีขาวพร้อมเสียงพึมพำเพิ่มเติม) ข้อความที่เป็นเลขหกหลัก ฉันไม่มีรายละเอียดเพิ่มเติมเกี่ยวกับเสียงรบกวน ฉันพยายามใช้ตัวกรอง low-pass ด้วยความหวังว่าการกำจัดความถี่ที่สูงกว่าส่วนใหญ่จะทำให้ฉันได้ยินตัวเลข แต่ดูเหมือนว่าฉันจะไม่สามารถกำจัดเสียงพึมพำต่ำพอที่จะได้ยินเสียงได้ดีพอ ความพยายามของฉันเป็นดังนี้ (ฟังก์ชั่นการจ้างงานfreq_space_low_pass_filterรวมอยู่ท้าย): [data, SampleRate, NbitsPerSample]=wavread('noisy_msg6.wav'); y=data(:,1); % we will work only with one channel in this demo N=length(y); %number of sample points t=( (1:N)*1/SampleRate ).'; % time spacing is 1/SampleRate and we want column vector Y=fft(y); spectrum_freq=fourier_frequencies(SampleRate, N); Freq3db=100; [spectrum_filtered,g_vs_freq]=freq_space_low_pass_filter(Y, SampleRate, …

1
ทฤษฎีที่อยู่เบื้องหลังการเข้ารหัสการทำนายเชิงเส้น (LPC)
ทฤษฎีเบื้องหลัง LPC คืออะไร เหตุใดการใช้งาน LPC บางอย่างจึงมีความทนทานต่อการส่งผ่านหรือการเข้ารหัสข้อผิดพลาดเชิงปริมาณมากกว่าแผนการเข้ารหัสเสียงที่บีบอัดอื่น ๆ สามารถใช้วิธีการ LPC สำหรับการทำนายคำในระยะสั้นหรือแบบเดียวกับการใช้ตัวกรองคาลมานได้หรือไม่? การใช้ LPC มีเงื่อนไขหรือข้อ จำกัด อะไรบ้าง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.