การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

5
Convolution เชิงเส้นและแบบวงกลมคืออะไร?
ฉันมีความเข้าใจพื้นฐานของสัญญาณและการโน้มน้าวใจ เท่าที่ฉันรู้มันแสดงให้เห็นถึงความคล้ายคลึงกันของสองสัญญาณ ฉันขอคำอธิบายเป็นภาษาอังกฤษธรรมดาของ: สังวัตนาเชิงเส้นและแบบวงกลมคืออะไร ทำไมมันถึงสำคัญ สถานการณ์จริงที่ใช้

4
Convolution สามารถแสดงเป็นการคูณเมทริกซ์ได้อย่างไร (แบบฟอร์มเมทริกซ์)
ฉันรู้ว่าคำถามนี้อาจไม่เกี่ยวข้องกับการเขียนโปรแกรม แต่ถ้าฉันไม่เข้าใจทฤษฎีที่อยู่เบื้องหลังการประมวลผลภาพฉันจะไม่สามารถนำบางสิ่งไปใช้ในทางปฏิบัติ ถ้าฉันเข้าใจถูกต้องตัวกรองเกาส์เซียนจะถูกโน้มน้าวด้วยภาพเพื่อลดสัญญาณรบกวนเนื่องจากพวกมันคำนวณค่าเฉลี่ยของพื้นที่ใกล้เคียงของพิกเซลและพวกมันมีประโยชน์มากในการตรวจจับขอบเนื่องจากคุณสามารถใช้ความเบลอและได้ภาพในเวลาเดียวกันด้วย เพียงแค่สนทนากับอนุพันธ์ของฟังก์ชันเกาส์เซียน แต่ทุกคนสามารถอธิบายฉันได้หรือให้การอ้างอิงบางอย่างแก่ฉันเกี่ยวกับวิธีคำนวณ เช่นเครื่องตรวจจับขอบของ Cannyพูดถึงตัวกรอง Gaussian 5x5 แต่พวกเขารับหมายเลขเหล่านั้นได้อย่างไร และพวกเขาเปลี่ยนจากการโน้มน้าวอย่างต่อเนื่องเป็นการคูณเมทริกซ์ได้อย่างไร

3
ทำความเข้าใจเกี่ยวกับองค์ประกอบ Cb และ Cr ของ YCbCr Color Space
ฉันคุ้นเคยกับการเพิ่มเติม (RGB), substractive (CMYK), และ coloraces เหมือน HSV แต่บทความที่ฉันพยายามจะเข้าใจในขณะนี้ดำเนินการในพื้นที่สีYCbCrสำหรับการแบ่งส่วนภาพ / ความหมายของวัตถุ ฉันใช้เวลาส่วนใหญ่ในตอนเช้าเพื่อหาสิ่งที่จะอธิบาย YCbCr ตามธรรมชาติ แต่ฉันก็ไม่เข้าใจ ฉันได้รับคำอธิบายที่ดีและเข้าใจง่ายเกี่ยวกับแนวคิดทั่วไปที่อยู่เบื้องหลังพื้นที่สีนี้ ที่นี่และคำอธิบายว่ามันถูกใช้สำหรับการเข้ารหัส / บีบอัดภาพจากพวกเหล่านี้ได้อย่างไร (ทั้งหมดบนภาพถ่าย) สูตรสำหรับการคำนวณจาก YCbCr RGB เป็นมั่นเหมาะสามารถเข้าถึงได้บนวิกิพีเดีย ฉันได้รับแรงจูงใจสำหรับการเป็นตัวแทนนี้ฉันได้รับองค์ประกอบ Y ที่มีข้อมูลระดับสีเทาที่สำคัญที่สุด (ต่อสายตามนุษย์) เกี่ยวกับภาพ ฉันได้รับ Cb และ Cr นำข้อมูลเกี่ยวกับสีและ (เนื่องจากความรู้สึกของคน (ใน) ความรู้สึก) พวกเขาสามารถบีบอัดได้โดยไม่สูญเสียคุณภาพที่มองเห็นได้ แต่องค์ประกอบ Chrominance แต่ละอันนั้นแสดงถึงอะไร? ในขณะที่ผู้เขียนบทความกล่าวว่า "ข้อมูล chrominance เป็นสิ่งสำคัญที่สุดในการกำหนดวัตถุ" ในวิธีการของพวกเขาและฉันไม่สามารถเข้าใจสิ่งที่ฉันกำลังอ่านกับ "Y คือความเข้ม Cb และ …

1
การลดเสียงรบกวนสำหรับการรู้จำเสียงแตกต่างจากการลดเสียงรบกวนที่ควรทำให้คำพูด“ เข้าใจได้” สำหรับมนุษย์มากขึ้นอย่างไร
นี่เป็นคำถามที่ให้ความสนใจฉันมาระยะหนึ่งแล้วส่วนใหญ่เป็นเพราะฉันกำลังทำงานเกี่ยวกับการลดเสียงรบกวนสำหรับระบบรู้จำเสียงพูดที่มีอยู่ด้วยตัวเอง เอกสารส่วนใหญ่เกี่ยวกับเทคนิคการลดเสียงรบกวนดูเหมือนจะมุ่งเน้นไปที่การทำให้การพูดเข้าใจได้ง่ายขึ้นสำหรับมนุษย์หรือวิธีการปรับปรุงคำที่คลุมเครือเช่น "คุณภาพการพูด" ฉันแน่ใจว่าโดยใช้เกณฑ์เช่นนี้คุณสามารถระบุตัวกรองที่ทำให้สัญญาณเสียงพูดที่ฟังง่ายขึ้นสำหรับมนุษย์ อย่างไรก็ตามฉันไม่แน่ใจว่าสามารถปรับเกณฑ์เหล่านี้ได้อย่างง่ายดายเมื่อพยายามประเมินสัญญาณเสียงพูดที่ได้รับการแปลเพื่อปรับปรุงความแม่นยำของระบบรู้จำเสียง ฉันไม่พบเอกสารที่พูดถึงความแตกต่างนี้จริงๆ ความชัดเจนของเสียงพูดและคุณภาพเสียงพูดสัมพันธ์กับความแม่นยำของระบบรู้จำเสียงพูดหรือไม่? มีมาตรการวัตถุประสงค์ที่สามารถประเมินว่า "ดี" สัญญาณเสียงพูด denoised สำหรับระบบรู้จำเสียงพูดได้เช่นกันถ้าได้รับการพูดที่ชัดเจน หรือเป็นวิธีเดียวที่จะทราบว่าเทคนิคการลดเสียงรบกวนของคุณนั้นดีแค่ไหนในการฝึกอบรมระบบรู้จำเสียงพูดสำหรับข้อมูลที่ถูกแปลและดูความถูกต้อง? ฉันจะมีความสุขถ้ามีคนชี้ให้ฉันไปในทิศทางที่ถูกต้องหรืออาจมอบเอกสารบางอย่างเกี่ยวกับเรื่องนี้ ขอบคุณล่วงหน้า!

2
OFDM และ GFDM ต่างกันอย่างไร
ฉันพยายามที่จะเข้าใจความแตกต่างระหว่าง OFDM (Multiplexing Division Division Orthogonal) และ GFDM (Generalized Frequency Division Multiplexing) ซึ่งใช้เป็นเทคนิคการมอดูเลตแบบหลายหน่วยในการสื่อสารไร้สาย เท่าที่ฉันทราบ OFDM ใช้ subcarriers มุมฉากและ GFDM อยู่กับ subcarriers ที่ไม่ใช่ orthogonal เมื่อออกแบบเครื่องส่งสัญญาณ GFDM อาจเป็นเทคนิคการปรับสำหรับระบบ 5G เนื่องจากมีการพูดคุยกันในพื้นที่การวิจัย ใครช่วยอธิบายเพิ่มเติมเกี่ยวกับการออกแบบ GFDM และความแตกต่างจาก OFDM ได้บ้าง? จุดประสงค์ของการใช้ GFDM คืออะไรเมื่อออกแบบเครื่องส่งสัญญาณ subcarriers ถูกสร้างขึ้นหลัง IFFT? ใน GFDM บล็อก IFFT ทำงานอย่างไรเมื่อสร้าง subcarriers สิ่งที่เกี่ยวกับ subcarrier pulse shaping ใน …

3
เล่นเพลงช้าลงในขณะที่รักษาความถี่
การเล่นเสียงเพลงด้วยความเร็วที่ช้าลงจะทำให้ระดับเสียงต่ำลง (ความถี่) มีเครื่องมือและทฤษฎีที่จะทำให้การเล่นเพลงช้าลงในขณะที่รักษาความถี่เหมือนเดิมหรือไม่? ฉันคิดว่าสามารถแปลงฟูริเยร์แบบเรียงซ้อนหรือแปลงเวฟเล็ตได้ ดูเหมือนว่าเราจะต้องเลือกขนาดหน้าต่างล่วงหน้าหรือเลือกเวฟเล็ตพื้นฐาน มีทฤษฎีและการประยุกต์ใช้ที่เฉพาะเจาะจงและละเอียดสำหรับการทำเช่นนั้นหรือ

2
ความแตกต่างระหว่างความแตกต่างของ Gaussian, Laplace of Gaussian และเวฟเวฟ Hat Mexican คืออะไร
มีสามเทคนิคที่ใช้ใน CV ที่ดูเหมือนกันมาก แต่มีความแตกต่างเล็กน้อยคือ: Laplacian แห่งเกาส์เซียน:∇2[ g( x , y, t ) ∗ f( x , y) ]∇2[g(x,y,t)∗f(x,y)]\nabla^2\left[g(x,y,t)\ast f(x,y)\right] ความแตกต่างของ Gaussians:[ g1( x , y, t ) ∗ f( x , y) ] - [ g2( x , y, t ) ∗ f( x , y) ][g1(x,y,t)∗f(x,y)]−[g2(x,y,t)∗f(x,y)] \left[g_1(x,y,t)\ast f(x,y)\right] - …

1
FSK Demodulation, การกู้คืนเวลาบิต
ฉันกำลังใช้การมอดูเลต FSK อะคูสติกและ demodulation ฉันไม่ใช่คนประมวลผลสัญญาณดังนั้นความช่วยเหลือใด ๆ เกี่ยวกับการกู้คืนเวลาบิตจะได้รับการชื่นชมมาก ขณะนี้ฉันใช้ตัว demodulator โดยใช้ฟิลเตอร์ที่จับคู่สองตัวสำหรับแต่ละโทน (ที่มีเฟส90∘90∘90^{\circ}สำหรับการตรวจจับที่ไม่สอดคล้องกัน) โดยทั่วไปเอาต์พุตของตัวกรองแต่ละตัวจะเป็นยอดเขาที่มีแอมพลิจูดต่างกัน ฉันมีสองคำถาม: ฉันจะกู้คืนบิตเวลาได้อย่างไร สิ่งใดที่คุณแนะนำสำหรับการเริ่มต้นการซิงโครไนซ์แพ็คเก็ต (เจี๊ยบ, บาร์โค้ด, โกลเด้นโค๊ดและอื่น ๆ )? ฉันใช้อัลกอริธึมการ์ดเนอร์ แต่ฉันไม่แน่ใจว่ามันใช้ได้หรือไม่และอย่างไร พิจารณาฉันกำลังทำงานกับ 2 ความถี่ที่มีบิตเรตที่ 800 bps โดยใช้การ์ดเสียง

2
อะไรคือสิ่งที่ได้มาจากพล็อตสหสัมพันธ์ข้าม?
สมมติว่าเรามีสัญญาณเสียงสองตัวคือ x (t) และ y (t) ที่ได้รับผลกระทบจากเสียงดังที่แสดงด้านล่าง และเราต้องการเชื่อมโยงสัญญาณทั้งสองนี้และพล็อตสหสัมพันธ์แสดงดังด้านล่าง ในพล็อตสหสัมพันธ์นี้มีค่าสูงสุดประมาณ -11 msec ฉันพยายามเข้าใจว่าเราตีความจุดสูงสุดนี้ในพล็อตนี้ได้อย่างไร มันหมายความว่าอะไร? โปรดอธิบายฉันด้วยว่าเราได้อะไรจากการแปลงฟูริเยร์ของฟังก์ชันสหสัมพันธ์ ขอบคุณล่วงหน้า!

3
อัลกอริทึมผลบิดเบือนดิจิตอล
ฉันอ่านหนังสือ DAFX โดย Udo Zölzerเกี่ยวกับผลการบิดเบือนที่หน้า 124-125 และมันบอกว่าฟังก์ชั่นการจำลองการบิดเบือนที่เหมาะสมได้รับจากฟังก์ชั่น: ฉ( x ) = x| x |( 1 - ex2/ | x |)f(x)=x|x|(1−ex2/|x|)f(x)=\frac{x}{|x|}\left(1-e^{x^2/|x|}\right) ใครสามารถอธิบายสูตรนี้และสัญญาณที่เราได้รับ จากสิ่งที่ฉันเข้าใจ 'x' คือสัญญาณตัวอย่างดังนั้นนี่คือลำดับของตัวเลข | x | อะไร หมายความว่าอย่างไร มันหมายถึงค่าสัมบูรณ์ของ x สำหรับแต่ละค่าตัวอย่าง? ดังนั้นหากฉันต้องการใช้การจำลองผลกระทบการบิดเบือนนี้ ฉันจำเป็นต้องรู้ความยาวของ x (ได้จากจำนวนตัวอย่าง) ในลูปฉันต้องคำนวณสูตรนี้สำหรับค่าตัวอย่างแต่ละค่า หลังจากลูปสิ้นสุดฉันได้รับสัญญาณที่บิดเบี้ยว (ในรูปแบบดิจิตอล) หลังจากนั้นฉันต้องแปลงเป็นสัญญาณอะนาล็อกเพื่อให้ฉันได้ยิน

4
Radix-4 FFT เมื่อเทียบกับ Radix-2
การใช้ Radix-4 เร็วกว่าการแปลงรหัส Radix-2 FFT ที่เท่ากันหรือไม่? และถ้าเป็นเช่นนั้นทำไมมันจะเร็วขึ้น?
10 fft 

2
การประมวลผลภาพ - การนับนิวเคลียส
ฉันกำลังพยายามสร้างโปรแกรมที่สามารถนับจำนวนนิวเคลียสในภาพ: สิ่งที่ฉันทำไปแล้วคือขั้นตอนต่อไปนี้: ใช้ Alternating Sequential Filter (การปิดและเปิดภาพด้วยองค์ประกอบโครงสร้างที่ใหญ่ขึ้นเรื่อย ๆ ) ใช้การแปลงระยะทาง ใช้การแบ่งส่วนลุ่มน้ำโดยใช้ภาพแปลงระยะทางในการตรวจจับขั้นต่ำ ซึ่งให้ผลลัพธ์ต่อไปนี้ (โดยที่แต่ละสีแสดงถึงนิวเคลียสใหม่นับ): อย่างที่เราเห็นมีความไม่สมบูรณ์จำนวนมากโดยเฉพาะนิวเคลียสที่มากเกินไป ฉันจะบอกว่าเหตุผลของปัญหานั้นคือวิธีที่ฉันกำหนดขั้นต่ำสำหรับการแปลงลุ่มน้ำ (โดยใช้การแปลงระยะทาง) แต่ฉันไม่มีความคิดอื่น ๆ สำหรับการกำหนดขอบเขตขั้นต่ำในกรณีนั้น เมื่อการแปลงระยะทางสร้างขั้นตอนน้อยที่สุดตามความกลมของวัตถุฉันต้องการทราบทางเลือกที่ดีกว่าในการปัดเศษนิวเคลียสมากกว่าตัวกรองสลับลำดับ (ดูที่ภาพด้านบนเราสามารถอนุมานได้ว่า "เกิน" ส่วนใหญ่มาจาก นิวเคลียสที่โค้งมนน้อยลง) ฉันต้องการทราบวิธีที่ดีกว่าในการกำหนดให้ minima สำหรับการแปลงลุ่มน้ำ

3
มีวิธีรับการตอบสนองแบบแรงกระตุ้นของระบบที่ไม่ต่อเนื่องโดยเพียงแค่รู้ว่ามันตอบสนองต่อฟังก์ชันขั้นตอนของหน่วยแยก
ในเวลาต่อเนื่องมันเป็นไปได้; u(t)⟶system⟶y(t)⟹δ(t)=du(t)dt⟶system⟶dy(t)dt=h(t)u(t)⟶system⟶y(t)⟹δ(t)=du(t)dt⟶system⟶dy(t)dt=h(t) u(t){\longrightarrow} \boxed{\quad\textrm{system}\quad} {\longrightarrow} y(t)\implies \delta(t)=\frac{du(t)}{dt}{\longrightarrow}\boxed{\quad\textrm{system}\quad}{\longrightarrow} \frac{dy(t)}{dt}=h(t) เช่นเดียวกันกับระบบเวลาที่ไม่ต่อเนื่องเช่น δ[ t ] = dคุณ[ t ]dเสื้อที่ไหน: { δ[ t ]คุณ[ t ]คือ delta time ที่ไม่ต่อเนื่องเป็นฟังก์ชั่นขั้นตอนหน่วยเวลาแบบแยกδ[t]=du[t]dtwhere:{δ[t]is the discrete time deltau[t]is the discrete time unit step function \delta[t]=\frac{du[t]}{dt} \quad\textrm{where:}\begin{cases} \delta[t] &\textrm{is the discrete time delta}\\ u[t] & \textrm{is the discrete time unit …

1
ความหนาแน่นสเปกตรัมพลังงานกับความหนาแน่นสเปกตรัมพลังงาน
ฉันอ่านสิ่งต่อไปนี้บน Wikipedia : ความหนาแน่นสเปกตรัมพลังงาน: ความหมายข้างต้นของความหนาแน่นพลังงานสเปกตรัมที่เหมาะสมที่สุดสำหรับ ชั่วคราวเช่นชีพจรเหมือนสัญญาณที่มีการแปลงฟูริเยร์ของสัญญาณอยู่ สำหรับสัญญาณต่อเนื่องที่อธิบายตัวอย่างเช่นกระบวนการทางกายภาพแบบคงที่มันสมเหตุสมผลมากกว่าที่จะกำหนด power spectrum density (PSD) ซึ่งอธิบายว่าอำนาจของสัญญาณหรืออนุกรมเวลาถูกกระจายไปตามความถี่ที่ต่างกันเช่นในตัวอย่างง่ายๆ ให้ไว้ก่อนหน้านี้ ฉันไม่เข้าใจย่อหน้านั้นมากนัก ส่วนแรกบอกว่า " สำหรับสัญญาณบางอย่าง .. การแปลงฟูริเยร์ไม่มีอยู่ " สำหรับสัญญาณใด (ในบริบทที่เรากำลังพูดถึง) การแปลงฟูริเยร์ไม่มีอยู่และเราจำเป็นต้องหันไปใช้ PSD แทนที่จะใช้ความหนาแน่นสเปกตรัมพลังงานหรือไม่ เมื่อได้รับความหนาแน่นสเปกตรัมพลังงานเหตุใดเราจึงไม่สามารถคำนวณได้โดยตรง ทำไมเราต้องประเมินมัน ในที่สุดในหัวข้อนี้ฉันได้อ่านเกี่ยวกับวิธีการที่ใช้ Kayser-windows เมื่อคำนวณ PSD เมื่อเวลาผ่านไป จุดประสงค์ของหน้าต่างเหล่านี้ในการประมาณค่า PSD คืออะไร?

2
เราจะหาเสียงอย่าง Gaussian, Rayleigh, Gamma และเสียงแบบเอ็กซ์โปเนนเชียลได้จากที่ไหนในโลกแห่งความเป็นจริง?
ฉันรู้ว่าขณะถ่ายภาพจากกล้องอาจมีจุดรบกวนเกิดขึ้นในภาพ บ่อยครั้งที่มันถูกอธิบายว่าเป็นเกาส์ แต่เสียงอื่น ๆ ที่เกิดขึ้นในโลกแห่งความเป็นจริง กรุณาช่วย!
10 noise 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.