คำถามติดแท็ก noise

ในการประมวลผลสัญญาณรบกวนสามารถพิจารณาข้อมูลที่ไม่พึงประสงค์แบบสุ่มโดยไม่มีความหมาย

1
คำจำกัดความต่างๆสำหรับ
คำนิยามของดูเหมือนจะเป็นหอคอยบาเบลในอุตสาหกรรม คำจำกัดความของมีอะไรบ้าง(รู้สึกฟรีกับแอปพลิเคชันของไซต์) และสามารถวัดได้อย่างแม่นยำสำหรับแอปพลิเคชันนั้น ๆS N RS N RSNR\rm SNRS N RSNR\rm SNR คำถามเฉพาะของฉันเกี่ยวกับคือ:S N RSNR\rm SNR เราจะวัดสำหรับระบบสื่อสารได้อย่างไรถ้าเรายังไม่สามารถบรรลุเวลาสุ่มตัวอย่างบิตที่ดีที่สุดและสิ่งที่เราต้องทำงานด้วยคือสัญญาณทั้งหมดในเครื่องรับถึงและรวมถึงซองจดหมายของ I และ ช่อง Q ดูโพสต์นี้สำหรับบริบทS N RSNR\rm SNR เมื่อเราได้รับการสุ่มตัวอย่างบิตที่ดีที่สุดและได้รับ softbits แล้ววิธีที่ดีที่สุดในการวัด (หรือ ) วิธีหนึ่งที่ฉันใช้คือ: E b N 0 10 บันทึก10 [ mean { | s n | 2 }S N RSNR\rm SNREขยังไม่มีข้อความ0EbN0E_bN_010 บันทึก10[ …
13 noise  bpsk  snr 

4
เหตุใดฉันจึงเห็นเสียงกริ่งในเอาต์พุตของตัวกรองดิจิตอลที่มีช่วงการเปลี่ยนภาพแคบ
ฉันกำลังทำ eq 'สุดขีด' บางอย่างสำหรับเอ็ฟเฟ็กต์ mangling spectral พร้อมเสียง ฉันใช้ตัวกรองผนังอิฐและตัวกรองผ่านและวงปฏิเสธที่แคบมาก (ปลั๊กอิน vst) และฉันต้องการทราบว่ามีอะไรที่ฉันสามารถทำได้เกี่ยวกับ pre / post 'ring' พร้อมตัวกรองแบบ linear / phase phase ที่น้อยที่สุดโดยใช้ . น่าเสียดายที่ฉันต้องใช้ความลาดชันสูงชัน ฉันเตรียมที่จะใช้เฟสขั้นต่ำเนื่องจากหลีกเลี่ยงเสียงกริ่งล่วงหน้า โดยเฉพาะฉันสงสัยว่า: อะไรทำให้เกิดความผันผวนในการตอบสนองต่อแรงกระตุ้นหลังจากอินพุตในตัวกรองขั้นต่ำ aa การทำ osccilations เหล่านี้เป็นสาเหตุของเสียง pre และ post 'ringing' ซึ่งเพิ่มเข้าไปใน passband ด้วยการกรองลาดชันหรือไม่? ออสซิลเลชั่นอยู่และทำให้ความถี่เสียงเรียกเข้าเป็นความถี่เดียวกันเสมอหรือความถี่เสียงเรียกเข้าขึ้นอยู่กับสัญญาณอินพุตหรือไม่? ขอบคุณมากสำหรับความเชี่ยวชาญของคุณ ฉันหวังว่าจะตอบสนองใด ๆ หุบเหว

2
ลดระดับเสียงพูดเพื่อลบเนื้อหาทางอารมณ์
ฉันยินดีที่จะรับข้อเสนอแนะทั้งใน R หรือ Matlab แต่รหัสที่ฉันแสดงด้านล่างคือ R-only ไฟล์เสียงที่แนบมาด้านล่างเป็นการสนทนาสั้น ๆ ระหว่างคนสองคน เป้าหมายของฉันคือการบิดเบือนคำพูดของพวกเขาเพื่อให้เนื้อหาทางอารมณ์จะกลายเป็นไม่รู้จัก ความยากลำบากคือฉันต้องการพื้นที่ว่างสำหรับการบิดเบือนนี้พูดได้ตั้งแต่ 1 ถึง 5 โดยที่ 1 คือ 'อารมณ์ที่จดจำได้สูง' และ 5 คือ 'อารมณ์ที่ไม่รู้จัก' มีสามวิธีที่ฉันคิดว่าฉันสามารถใช้เพื่อให้บรรลุด้วยอาร์ 'ความสุข' คลื่นเสียงดาวน์โหลดได้จากที่นี่ ดาวน์โหลด 'โกรธ' คลื่นเสียงจากที่นี่ วิธีแรกคือการลดความเข้าใจโดยรวมโดยการลดเสียงรบกวน โซลูชันนี้มีการนำเสนอด้านล่าง (ขอบคุณ @ carl-witthoft สำหรับคำแนะนำของเขา) สิ่งนี้จะลดทั้งความเข้าใจและเนื้อหาทางอารมณ์ของคำพูด แต่มันเป็นวิธีที่ 'สกปรก' - ยากที่จะทำให้ถูกต้องเพื่อให้ได้พื้นที่พาราเมทริกเพราะสิ่งเดียวที่คุณสามารถควบคุมได้คือความกว้างของเสียง require(seewave) require(tuneR) require(signal) h <- readWave("happy.wav") h <- cutw(h.norm,f=44100,from=0,to=2)#cut down to …
12 matlab  audio  noise 

2
การตรวจจับ drum bpm ในไฟล์. wav ที่มีเสียงดัง
ฉันกำลังมองหาอัลกอริทึม (s) เพื่อแก้ปัญหาต่อไปนี้: ด้วยการจับเสียง. wav ที่มีเสียงดัง (เสียงลม + เสียงเสียดสีบนไมโครโฟน) วิธีการตรวจสอบ BPM ของการตีกลองแบบนุ่ม ฉันพยายามทำเรื่องนี้แล้ว แต่ผลลัพธ์ค่อนข้างแย่เนื่องจากซอฟต์แวร์ mp3 ที่เกี่ยวข้องจำนวนมากสำหรับการวิเคราะห์และการสร้างรหัสลายนิ้วมือ ไม่มีใครให้ข้อมูลเกี่ยวกับวิธีการใช้งานจริง ฉันตระหนักถึงอัลกอริทึมในการลบเสียงรบกวน แต่ยังทำให้ฉันมีปัญหาในการตรวจจับ BPM และขึ้นอยู่กับวิธีแก้ไขปัญหา BPM เป็นไปได้ว่าฉันไม่จำเป็นต้อง denoise (เนื่องจากกลองมีแนวโน้มที่จะอยู่ในความถี่และเสียงรบกวนที่ต่ำกว่าในระดับที่สูงกว่า low-pass แบบง่ายอาจเพียงพอในการประมวลผลล่วงหน้า)

3
การจำลองประสิทธิภาพ ADC: วิธีการคำนวณ SINAD จาก FFT?
ในขณะที่ทำงานกับปัญหานี้ฉันเริ่มมีข้อสงสัยว่าคำจำกัดความเริ่มต้นของฉัน Sผมยังไม่มีข้อความA D = 10 บันทึก10( หน้าฉΣผม( หน้าผม) -หน้า0- หน้าฉ) dBSINAD=10log10⁡(pf∑i(pi)−p0−pf)dBSINAD = 10 \log_{10} \left( \frac{p_f} {\sum_i{(p_i)} - p_0 - p_f} \right)dB ถูกต้อง. ในสมการนี้คือกำลังที่ FFT bin ที่ความถี่ ,คือกำลังของ bin ความถี่ที่มีความถี่สัญญาณและคือส่วนประกอบ DC ผลรวมกว่าสะสมส่วนประกอบความถี่ทั้งหมดก่อนที่จะถอดส่วนประกอบ DCและสัญญาณความถี่p_f x p f f p 0ฉันp 0 p fพีxpxp_xxxxพีฉpfp_fฉffพี0p0p_0ผมiiพี0p0p_0พีฉpfp_f โดยเฉพาะอย่างยิ่งฉันไม่แน่ใจเกี่ยวกับส่วนซึ่งฉันตีความจากคำอธิบาย WikipediaΣผม( หน้าผม)∑i(pi)\sum_i(p_i) อัตราส่วนของ (a) พลังของสัญญาณเสียงมอดูเลตดั้งเดิมเช่นจากตัวพาความถี่คลื่นวิทยุที่ปรับไปจนถึง (b) พลังเสียงที่เหลือเช่นพลังเสียงรบกวนบวก …
11 fft  noise 

4
ข้อผิดพลาดในการสร้างปริมาณเสียงรบกวนอย่างไร
ฉันเรียนรู้เกี่ยวกับการสุ่มตัวอย่างและ DSP ด้วยตัวเอง ฉันมีเวลายากที่จะเข้าใจว่าข้อผิดพลาดเชิงปริมาณส่งผลให้เกิดเสียงรบกวนอย่างไร ฉันคิดว่าฉันพลาดความเข้าใจพื้นฐาน แต่ไม่สามารถบอกได้ว่ามันคืออะไร ดังนั้นการคลาดเคลื่อนเชิงปริมาณจึงสร้างเสียงรบกวนได้อย่างไร
11 noise  sampling 

1
กู้คืนส่วนโค้งจากการรวบรวมคะแนนที่มีเสียงดัง
พื้นหลัง: ฉันพยายามสร้างระบบที่ติดตามฟองอากาศจำนวนหนึ่งในวิดีโอ ฉันกำลังใช้การตรวจจับฟองในกรณีภาพเดียวโดยใช้การแปลงแบบ Hough เนื่องจากการบดเคี้ยวเบลอและปัจจัยอื่น ๆ การตรวจจับนี้จะไม่แม่นยำ 100% ฉันกำลังปรับขั้นตอนการตรวจจับสำหรับการเรียกคืนสูงอาจมีค่าใช้จ่ายของความแม่นยำ เมื่อดำเนินการเสร็จแล้วและนำไปใช้กับลำดับของเฟรมจากวิดีโอฉันจะมีจำนวนการตรวจจับที่สามารถกำหนดลักษณะเป็นจุดในพื้นที่ 4D - ตำแหน่ง x, ตำแหน่ง y, ตำแหน่งรัศมีและดัชนีเฟรม มีขั้นตอนที่สามารถกู้โค้งจากคลาวด์ 4D point นี้ได้หรือไม่?

2
อะไรคือความแตกต่างระหว่าง 'de-noising' และสิ่งที่เรารู้กันทั่วไปว่าเป็นวิธีการกรองเพื่อกำจัดเสียงรบกวน?
คำถามง่ายๆสวย - ฉันพยายามคิดออกว่าอะไรแตกต่างกันระหว่าง 'de-noising' สัญญาณและเพียงแค่กรอง (ตามที่เรารู้ทั่วไป) เพื่อลบเสียง เป็นกรณีของการทับซ้อนคำศัพท์หรือมีบางสิ่งที่แตกต่างกันโดยพื้นฐานหรือไม่? ทำไมถึงเรียกว่า 'ลบเสียงรบกวน' แก้ไข: บางทีที่สำคัญมากเมื่อเราพูดถึงการกรองสัญญาณเพื่อเพิ่ม SNR ของมันให้มากที่สุดเรามักจะหมายถึง AWGN ในบริบทของภาษาพูด ดังนั้น 'เสียง' ที่ถูกอ้างถึงในการลดเสียงรบกวนยัง AWGN และถ้าเป็นเช่นนั้นการขจัดเสียงรบกวนก็เป็นวิธีที่แตกต่างกันในการลบออกหรือเป็นเสียงประเภทอื่น (ไม่ใช่แบบเกาส์สีและอื่น ๆ ) เริ่มด้วย?
11 noise 

1
การตอบสนองความถี่โดยประมาณของตัวกรองค่ามัธยฐาน
ตัวกรองค่ามัธยฐานเป็นกระบวนการที่ไม่เป็นเชิงเส้นและสูญเสียดังนั้นจึงไม่มีการตอบสนองความถี่แบบปิดเช่นเดียวกับตัวกรอง FIR (พูดตัวกรองแบบกล่องที่มีความยาวเท่ากัน) ในระบบ LTI แต่สิ่งที่คล้ายกับการตอบสนองความถี่ของตัวกรองมัธยฐานสามารถประมาณได้อย่างไร สเกลนี้มีความยาวของตัวกรองแบบกลางอย่างไร ภายใต้เงื่อนไขใดหรือสำหรับระดับสัญญาณใดการประมาณนี้อาจเป็นสนามเบสบอล "ปิด" การประมาณนี้ของสัญญาณใดที่อาจผิดพลาดมาก? ตัวกรองค่ามัธยฐานแบบใดที่สร้างขึ้นโดยมีการบิดเบือนโดเมนหรือเสียงรบกวนเพิ่มเติม

2
คุณจะบอกได้อย่างไรว่ามีสัญญาณ (เมื่อสัญญาณของคุณดูเหมือนเสียงรบกวน)
นี่คือเครื่องตรวจกรนของฉันอีกครั้ง ฉันได้รับการตรวจจับสัญญาณที่ดีเมื่อมีสิ่งใดอยู่ในนั้น - สามารถติดตามจากเสียงกรนกราดผนังเพื่อการหายใจที่คุณไม่ได้ยินแม้แต่ในการบันทึก ปัญหาคือฉันไม่สามารถบอกได้เมื่อสัญญาณลดลงต่ำกว่าระดับที่ตรวจพบได้และแอพเป็นเพียง "ได้ยินสิ่ง" และน่าเสียดายที่การกรน / การหายใจมักจะผิดปกติพอที่ความสัมพันธ์แบบง่าย ๆ หรือช่วงเวลาคล้ายกันนั้นไม่น่าจะช่วยอะไรได้มากนัก (และอาจเป็นไปได้ว่าในบางกรณีเสียงดังกว่าปกติในการหายใจ) ดังนั้นจะมีเทคนิคใดที่ฉันขาดหายไปในการหาเมื่อไม่มีสัญญาณหรือไม่? ดูเหมือนว่าฉันกำลังเผชิญหน้ากับสถานที่ที่ยากลำบากที่นี่เนื่องจาก "สัญญาณ" เป็นเสียงเริ่มต้น (และนี่อาจเกี่ยวข้องกับปัญหาอื่นที่ฉันมี: น่าแปลกที่ฉันไม่สามารถวัดระดับสัญญาณได้อย่างแม่นยำแม้จะค่อนข้างดังเนื่องจากฉันต้องใช้ค่าเฉลี่ยและอัตราส่วนการหมุนเพื่อตรวจจับสัญญาณต่อไป ประเภทข้อมูลระดับจะหายไปฉันกำลังมองหาเทคนิคเพื่อสร้างมันขึ้นมาใหม่) เทคนิคพื้นฐาน (สำหรับ Yoda) สัญญาณเสียงถูกสุ่มตัวอย่าง (โดยทั่วไปที่ 8000Hz ด้วยเหตุผลต่าง ๆ ) แล้ว FFTed ใน 1024 บล็อก (ในการทดลองของฉัน Hamming ฟิลเตอร์และบล็อกที่ทับซ้อนกันดูเหมือนจะมีผลเพียงเล็กน้อยแม้ว่าสิ่งเหล่านั้นอาจได้รับการตรวจสอบในภายหลัง) FFT ถูกแบ่งออกเป็น "วงดนตรี" (ปัจจุบัน 5 ขนาดเอียงเล็กน้อยเพื่อวางรายละเอียดเพิ่มเติมในระดับต่ำ) และ "ความแตกต่างของสเปกตรัม" และระดับของแต่ละวงจะถูกรวมเข้าด้วยกัน ค่าเฉลี่ยระยะยาวของค่าสูงสุดที่ จำกัด ใช้เป็น "เกณฑ์" และการปรับตั้งค่าอคติต่อไปจะใช้เพื่อรักษาอัตรา …
11 noise  snr 

1
การปรับสัญญาณ / การตรวจจับการสะดุดในกระแสข้อมูลราบรื่นขึ้น
(แก้ไข: คำถามนี้ตามมาจากการแยกข้อมูลบัตรแถบแม่เหล็กจาก WAV ดิบ ) นี่คือสัญญาณของฉัน (บรรทัดบนสุด) และใช้ตัวกรอง IIR พื้นฐาน (บรรทัดล่างสุด) (แก้ไข: งานของฉันคือการแบ่งสัญญาณออกเป็นไบนารี 0 (ความถี่ F) และไบนารี 1 (ความถี่ 2F) - นั่นคือสาเหตุที่เรียกว่า F2F ดังนั้นฉันต้องประมวลผลในลักษณะที่รับประกันไม่มียอดปลอมในขณะที่ ภาพหน้าจอทำให้ดูไม่สำคัญมีปัญหาที่อาจเกิดขึ้นจากการเพิ่มขึ้นเป็นสองเท่าและการได้รับผลบวกที่ผิดพลาดในร่องระหว่างยอดเขาจริง) คำถามของฉันคือมีวิธีใดบ้างที่ทำให้สัญญาณนี้ราบรื่น IIR เป็นทางออกที่ดีที่สุดของฉันหรือไม่ ฉันเห็นความเป็นไปได้อย่างน้อยสามประการ: IIR y [n] = 0.9 * y [n-1] + 0.1 * x [n] โดยที่ y [x] = 0 เมื่อ x <0 …
11 filters  noise 

1
การลบเสียงรบกวนจากสัญญาณ F2F
(คำถามนี้เกี่ยวข้องกับการดึงข้อมูลบัตรแถบแม่เหล็กแบบไบนารีจาก WAV ดิบ ) ฉันกำลังแยกลำดับเลขฐานสองออกจากแถบแม่เหล็กบนบัตรเครดิต อย่างที่คุณเห็นสัญญาณจะลดลงอย่างชัดเจนในที่เดียว นอกจากนี้ยังมีการย่อยสลายเล็กน้อยทางด้านซ้ายของภาพ เพียงแค่ใช้ IIR (เช่น ) ปรับให้เรียบ แต่สัญญาณที่ได้จะไม่ราบรื่นทางคณิตศาสตร์ ถ้าฉันแยกสัญญาณสองสามครั้งเสียงจะกลับมาพร้อมกับการแก้แค้น:Xo ยูที= 0.9 Xo ยูทีl a s t+ 0.1 XฉันnXโอยูเสื้อ=0.9Xโอยูเสื้อล.asเสื้อ+0.1XผมnX_{\rm out} = 0.9X_{\rm out_{last}} + 0.1X_{\rm in} คำถามของฉันคือ: ฉันสามารถลบเสียงรบกวนในลักษณะที่ตราสารอนุพันธ์ออกมาได้หรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร แก้ไข:นี่คือภาพโคลสอัพของคลื่นที่เสียหายบางส่วน: แก้ไข (2): สองวิธีที่ฉันกำลังพิจารณา: ประการแรกฉันสามารถทำการประมาณเทย์เลอร์ของสัญญาณทั้งสองด้านของเซกเตอร์ที่เสียหายและผสมผสานการประมาณเข้าด้วยกัน ประการที่สองฉันสามารถ FFT ลบส่วนประกอบความถี่สูงและย้อนกลับ FFT ฉันจะลองวิธีที่สองตอนนี้ ...
11 fft  noise 

1
ตัวกรองคาลมาน - เข้าใจเมทริกซ์ความแปรปรวนร่วมของเสียง
อะไรคือความสำคัญของเมทริกซ์ความแปรปรวนร่วมเสียงในกรอบตัวกรองคาลมาน ฉันหมายถึง: เมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนความแปรปรวนQ , และ เสียงการวัดความแปรปรวนเมทริกซ์R ในเวลาใดก็ได้ที ฉันจะตีความเมทริกซ์เหล่านี้ได้อย่างไร พวกเขาเป็นตัวแทนอะไร พวกเขาพูดคุยกันหรือไม่ว่าเสียงของการสังเกตหนึ่งเสียงแตกต่างกันไปตามเสียงของการสังเกตการณ์อื่นในเวกเตอร์สถานะหรือไม่

1
การลดเสียงรบกวนสำหรับการรู้จำเสียงแตกต่างจากการลดเสียงรบกวนที่ควรทำให้คำพูด“ เข้าใจได้” สำหรับมนุษย์มากขึ้นอย่างไร
นี่เป็นคำถามที่ให้ความสนใจฉันมาระยะหนึ่งแล้วส่วนใหญ่เป็นเพราะฉันกำลังทำงานเกี่ยวกับการลดเสียงรบกวนสำหรับระบบรู้จำเสียงพูดที่มีอยู่ด้วยตัวเอง เอกสารส่วนใหญ่เกี่ยวกับเทคนิคการลดเสียงรบกวนดูเหมือนจะมุ่งเน้นไปที่การทำให้การพูดเข้าใจได้ง่ายขึ้นสำหรับมนุษย์หรือวิธีการปรับปรุงคำที่คลุมเครือเช่น "คุณภาพการพูด" ฉันแน่ใจว่าโดยใช้เกณฑ์เช่นนี้คุณสามารถระบุตัวกรองที่ทำให้สัญญาณเสียงพูดที่ฟังง่ายขึ้นสำหรับมนุษย์ อย่างไรก็ตามฉันไม่แน่ใจว่าสามารถปรับเกณฑ์เหล่านี้ได้อย่างง่ายดายเมื่อพยายามประเมินสัญญาณเสียงพูดที่ได้รับการแปลเพื่อปรับปรุงความแม่นยำของระบบรู้จำเสียง ฉันไม่พบเอกสารที่พูดถึงความแตกต่างนี้จริงๆ ความชัดเจนของเสียงพูดและคุณภาพเสียงพูดสัมพันธ์กับความแม่นยำของระบบรู้จำเสียงพูดหรือไม่? มีมาตรการวัตถุประสงค์ที่สามารถประเมินว่า "ดี" สัญญาณเสียงพูด denoised สำหรับระบบรู้จำเสียงพูดได้เช่นกันถ้าได้รับการพูดที่ชัดเจน หรือเป็นวิธีเดียวที่จะทราบว่าเทคนิคการลดเสียงรบกวนของคุณนั้นดีแค่ไหนในการฝึกอบรมระบบรู้จำเสียงพูดสำหรับข้อมูลที่ถูกแปลและดูความถูกต้อง? ฉันจะมีความสุขถ้ามีคนชี้ให้ฉันไปในทิศทางที่ถูกต้องหรืออาจมอบเอกสารบางอย่างเกี่ยวกับเรื่องนี้ ขอบคุณล่วงหน้า!

2
อะไรคือสิ่งที่ได้มาจากพล็อตสหสัมพันธ์ข้าม?
สมมติว่าเรามีสัญญาณเสียงสองตัวคือ x (t) และ y (t) ที่ได้รับผลกระทบจากเสียงดังที่แสดงด้านล่าง และเราต้องการเชื่อมโยงสัญญาณทั้งสองนี้และพล็อตสหสัมพันธ์แสดงดังด้านล่าง ในพล็อตสหสัมพันธ์นี้มีค่าสูงสุดประมาณ -11 msec ฉันพยายามเข้าใจว่าเราตีความจุดสูงสุดนี้ในพล็อตนี้ได้อย่างไร มันหมายความว่าอะไร? โปรดอธิบายฉันด้วยว่าเราได้อะไรจากการแปลงฟูริเยร์ของฟังก์ชันสหสัมพันธ์ ขอบคุณล่วงหน้า!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.