การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

3
วิธีการตรวจจับการเปลี่ยนแปลง "รวดเร็ว" ในการประมวลผลสัญญาณ
ฉันกำลังทำงานในโครงการที่เราวัดความสามารถในการบัดกรีของส่วนประกอบ สัญญาณที่วัดได้จะมีเสียงดัง เราจำเป็นต้องประมวลผลสัญญาณแบบเรียลไทม์เพื่อให้เราสามารถรับรู้การเปลี่ยนแปลงที่เริ่มต้นในเวลา 5,000 มิลลิวินาที ระบบของฉันใช้ตัวอย่างค่าจริงทุก ๆ 10 เสี้ยววินาที - แต่สามารถปรับให้เป็นการสุ่มตัวอย่างช้าลง ฉันจะตรวจสอบการตกนี้ที่ 5,000 มิลลิวินาทีได้อย่างไร คุณคิดอย่างไรเกี่ยวกับอัตราส่วนสัญญาณ / เสียงรบกวน เราควรมุ่งเน้นและพยายามรับสัญญาณที่ดีขึ้นหรือไม่ มีปัญหาที่ทุกการวัดมีผลลัพธ์ที่แตกต่างกันและบางครั้งการปล่อยจะน้อยกว่าตัวอย่างนี้ ลิงก์ไปยังไฟล์ข้อมูล (ไม่เหมือนกันกับไฟล์ที่ใช้สำหรับแปลง แต่แสดงสถานะระบบล่าสุด) https://docs.google.com/open?id=0B3wRYK5WB4afV0NEMlZNRHJzVkk https://docs.google.com/open?id=0B3wRYK5WB4afZ3lIVzhubl9iV0E https://docs.google.com/open?id=0B3wRYK5WB4afUktnMmxfNHJsQmc https://docs.google.com/open?id=0B3wRYK5WB4afRmxVYjItQ09PbE0 https://docs.google.com/open?id=0B3wRYK5WB4afU3RhYUxBQzNzVDQ

2
แปลง Z ของ downsampler
ในบทความนี้หรือการกรองหลายระดับผู้เขียนสร้างความสัมพันธ์ทางคณิตศาสตร์ต่อไปนี้ ให้เป็นผลลัพธ์ของ downsampler แบบนั้นyDyDy_D yD[n]=x[Mn]yD[n]=x[Mn]y_D[n] = x[Mn] โดยที่คือปัจจัยการสุ่มตัวอย่าง กล่าวอีกนัยหนึ่งเราเก็บตัวอย่าง -th ทุกสัญญาณดั้งเดิม จากนั้นผู้เขียนจะดำเนินการดังต่อไปนี้:เอ็มMMMMMM ... การแปลง z ของถูกกำหนดโดยyD[n]yD[n]y_D[n] YD[z]=1M∑k=0M−1X[z1/MWk]YD[z]=1M∑k=0M−1X[z1/MWk]Y_D[z]=\frac{1}{M}\sum_{k=0}^{M-1}X[z^{1/M}W^k] ที่เป็น -point ไม่ต่อเนื่องฟูริเยร์แปลงเคอร์เนลคือ M} M e ( - j 2 π k ) / MWkWkW^kMMMe(−j2πk)/Me(−j2πk)/Me^{(-j2\pi k)/M} เราจะเปลี่ยนจากการแสดงออกในอดีตไปสู่ยุคหลังได้อย่างไร? ความสัมพันธ์ระหว่าง DFT และ Z-transform ที่อนุญาตให้มีการเปลี่ยนแปลงดังกล่าวคืออะไร?

2
จะสร้างแกนความถี่สำหรับความยาว FFT ที่เท่ากันและคี่ได้อย่างไร
ฉันสามารถขอความช่วยเหลือเกี่ยวกับวิธีทำให้แกนความถี่เปลี่ยนจากความถี่ลบเป็นความถี่บวก (เป็นเฮิรตซ์) ซึ่งจะเป็นแกน x ในผลลัพธ์ FFT แต่ให้ FFT ยาวหรือคี่ความยาวคี่ ฉันมีปัญหาในการทำใน MATLAB (สมมติว่าคุณรู้จักความถี่การสุ่มตัวอย่าง f_s)

1
ทำการสุ่มสัญญาณด้วย decimate
ฉันกำลังทดลองกับการทำลายสัญญาณในกรณีนี้หน่วยกระตุ้น ฉันใช้ Python กับ pylab ครั้งแรกฉันสร้างหน่วยแรงกระตุ้นและฆ่ามันด้วย 5 x = r_[zeros(0), 1, zeros(100)] N = 2 ** 14 q = 5 y = decimate(x, q, ftype="fir") subplot(211) title("Original") stem(range(len(x)), x) subplot(212) title("Decimated - FIR") stem(range(len(y)), y) figure() subplot(211) semilogx(log(abs(fft(x, N)))) subplot(212) y = decimate(x, q, ftype="fir") semilogx(log(abs(fft(y, N)))) ผลลัพธ์นี้มีแผนการต่อไปนี้ ฉันเพิ่มตัวอย่างการหน่วงเวลาก่อนอิมพัลส์โดยการเปลี่ยน x …
12 decimation 

1
การสุ่มตัวอย่างของฟังก์ชั่นต่อเนื่อง: Kronecker's หรือ Dirac's delta?
ฉันอ่านบทความเกี่ยวกับสัญญาณและฉันสับสนมากเกี่ยวกับปัญหาในชื่อคำถามของฉัน พิจารณาฟังก์ชันต่อเนื่องของเวลา ,ที่ฉันตัวอย่างในช่วงเวลาที่ไม่สม่ำเสมอที่ N สำหรับฉันแล้วมันสมเหตุสมผลแล้วที่ฟังก์ชันตัวอย่างคือ: โดยที่คือdelta ของ Kronecker (เท่ากับเมื่อศูนย์อื่น ๆ ) อย่างไรก็ตามในบทความนี้ผู้เขียนกำหนดสัญญาณตัวอย่างเป็น: ที่ไหนเอฟ( T ) T k k = 1 , 2 , . . , N f s ( t ) = N ∑ k = 1 δ t , t k f ( t ) , ( 1 …
12 sampling 

2
การตรวจจับจำนวนเส้นด้ายในภาพผ้า
ฉันเป็นผู้ใช้งานมือใหม่ในการประมวลผลภาพและทำงานในโครงการเพื่อกำหนดจำนวนเส้นด้ายในภาพสิ่งทอเช่น warps และ wefts (ตั้งฉากและเส้นด้ายขนานกับแกน x) ฉันพยายามตรวจสอบเส้นด้ายด้วยการหาผลรวมของคอลัมน์และแถวสำหรับการแปรปรวนและผ้าตามลำดับ แต่ดูเหมือนจะไม่ทำงานเพราะภาพไม่ได้โฟกัสและคมชัดมาก นอกจากนี้วิธีการนี้ยังไวต่อการจัดเรียงของเส้นด้ายในเนื้อผ้า กรุณาเสนออัลกอริทึมที่ดีกว่าถ้าเป็นไปได้สำหรับการตรวจสอบเส้นด้าย นอกจากนี้หากมีความเป็นไปได้ที่จะทำให้เส้นด้ายตรงสำหรับภาพที่จับทุก ฉันลอง IMROTATE แต่สร้างพื้นที่สีดำในภาพซึ่งรบกวนผลรวมของแถวและอัลกอริทึมที่ล้มเหลว ความช่วยเหลือใด ๆ ในเรื่องนี้จะมีค่ามากสำหรับฉัน ขอบคุณ

1
การพิจารณาว่าเสียงที่คล้ายกันนั้นเกี่ยวกับคำพูดของมนุษย์
ในขณะที่กำลังมองหาคำตอบสำหรับปัญหานี้ฉันพบว่าบอร์ดนี้จึงตัดสินใจที่จะข้ามโพสต์คำถามของฉันนี้จาก Stack Overflow ฉันกำลังค้นหาวิธีการกำหนดความคล้ายคลึงกันระหว่างเซ็กเมนต์เสียงและเสียงของมนุษย์ซึ่งแสดงเป็นตัวเลข ฉันค้นหาค่อนข้างน้อย แต่สิ่งที่ฉันพบจนถึงขณะนี้ (รายละเอียดด้านล่าง) ไม่ตรงกับสิ่งที่ฉันต้องการ: วิธีหนึ่งคือการใช้ซอฟต์แวร์รู้จำเสียงพูดเพื่อให้ได้คำจากส่วนเสียง อย่างไรก็ตามวิธีนี้ไม่สามารถเกิดขึ้นได้ว่าเสียง "คล้ายกัน" นั้นเป็นอย่างไรสำหรับการพูดของมนุษย์ บ่อยครั้งที่สามารถบอกได้ว่ามีคำในเสียงหรือไม่ แต่ถ้าไม่มีคำที่ชัดเจนก็ไม่สามารถบอกได้ว่าเสียงนั้นมีคำดังกล่าวหรือไม่ ตัวอย่าง: CMU Sphinx , Dragonfly , SHoUT วิธีการที่มีแนวโน้มมากขึ้นเรียกว่าVoice Activity Detection (VAD) อย่างไรก็ตามสิ่งนี้มีปัญหาเหมือนกัน: อัลกอริธึม / โปรแกรมที่ใช้ VAD มักจะส่งคืนว่ากิจกรรมถึงขีด จำกัด หรือไม่และไม่มีค่า "ความคล้ายคลึงกัน" ก่อนหรือหลังเกณฑ์ดังกล่าว อีกทางเลือกหนึ่งคือมองหาปริมาณไม่คล้ายกับคำพูดของมนุษย์ ตัวอย่าง: Speex , Listener , FreeSWITCH ความคิดใด ๆ

4
อัลกอริทึมสำหรับการคำนวณ FFT ในแบบคู่ขนาน
ฉันพยายามทำให้การคำนวณ FFT เป็นคู่ขนานกับไฟล์สัญญาณขนาดเทราไบต์ ตอนนี้ FFT ที่ใช้ไลบรารีโอเพ่นซอร์สนั้นใช้เวลาหลายชั่วโมงแม้แต่วิ่งผ่าน CUDA บน GPU ที่เร็วที่สุดที่ฉันมี กรอบที่ฉันพยายามปรับให้เข้ากับกระบวนการนี้คือ Hadoop ในแง่พื้นฐานมาก Hadoop กระจายปัญหาบนโหนดเซิร์ฟเวอร์จำนวนเท่าใดก็ได้ในลักษณะดังต่อไปนี้: •คุณแบ่งไฟล์อินพุตของคุณเป็นคู่ (คีย์, ค่า) •คู่เหล่านี้จะถูกป้อนเข้าสู่อัลกอริทึม“ แผนที่” ซึ่งจะแปลงคู่ (คีย์, ค่า) ของคุณให้เป็นคู่อื่น ๆ (คีย์, ค่า) ตามสิ่งที่คุณใส่ไว้ในแผนที่ •จากนั้นเฟรมเวิร์กจะรวบรวมเอาท์พุต (คีย์, ค่า) ทั้งหมดจากแผนที่และเรียงลำดับตามคีย์รวมถึงการรวมค่าด้วยคีย์เดียวกันให้กับคู่เดียวดังนั้นคุณจึงจบลงด้วย (คีย์รายการ (ค่า 1, ค่า 2, .. )) คู่ • คู่เหล่านี้จะถูกป้อนเข้าสู่อัลกอริธึม "ลด" ซึ่งจะส่งผลให้คู่ (คีย์, ค่า) คู่เป็นผลลัพธ์สุดท้ายของคุณ (เขียนลงไฟล์) มีแอพพลิเคชั่นมากมายสำหรับโมเดลนี้ในทางปฏิบัติเช่นการประมวลผลบันทึกเซิร์ฟเวอร์ แต่ฉันมีเวลายากที่จะใช้เฟรมเวิร์กเพื่อตัดค่า …
12 fft 

2
ผลการสังเคราะห์เสียงสำหรับเสียงที่เป็นธรรมชาติ
ขณะนี้ฉันกำลังทำงานกับเครื่องสังเคราะห์หีบเพลงและฉันต้องการให้เสียงเป็นธรรมชาติที่สุด ฉันชอบเสียงคลื่นต่อไปนี้จริง ๆ : https://dl.dropbox.com/u/20437903/onda%20acordeon.wav คลื่นมีลักษณะดังนี้: เมื่อมองไปที่คลื่นดูเหมือนว่ามันได้เพิ่มและประสานกันอย่างกลมกลืน ฉันผิดหรือเปล่า? ฉันยังใหม่กับการสังเคราะห์เสียงและจะขอบคุณมากถ้าใครสามารถโปรดช่วยฉันระบุผลกระทบที่ใช้กับคลื่นและแนวทางบางอย่างเพื่อนำไปใช้ ขอบคุณ
12 music  sound 

1
ความแตกต่างระหว่างความหนาแน่นสเปกตรัมพลังงานกำลังสเปกตรัมและอัตราส่วนกำลัง
ความหนาแน่นของสเปกตรัมกำลังงานสำหรับสัญญาณไม่ต่อเนื่องคืออะไร ฉันมักจะอยู่ภายใต้ข้อสันนิษฐานที่รับการแปลงฟูริเยร์ของสัญญาณแล้วอัตราส่วนของช่วงความถี่ที่ต้องการในช่วงความถี่ทั้งหมดจะให้อัตราส่วนกำลังสำหรับช่วงความถี่นั้นซึ่งเท่ากับความหนาแน่นสเปกตรัมพลังงาน มันผิดหรือเปล่า? การอ่านกระดาษนักเรียนทำให้ฉันสับสนเพราะมันบอกว่าจะคำนวณ PSD แล้ว 'พลังสัมบูรณ์และสเปกตรัมเชิงสัมพัทธ์ในวงที่ต้องการ' เช่นกัน พวกเขาแตกต่างกันอย่างไร ถ้าใช่จะคำนวณได้อย่างไร

2
ความสัมพันธ์ระหว่างซิกมาใน Laplacian ของ Gaussian กับซิกมาสทั้งสองในความแตกต่างของเกาส์คืออะไร?
ฉันเข้าใจว่าตัวกรอง Laplacian-of-Gaussian สามารถประมาณได้โดยตัวกรอง Difference-of-Gaussians และอัตราส่วนของซิกมาสทั้งสองสำหรับหลังควรเป็น 1: 1.6 สำหรับการประมาณที่ดีที่สุด อย่างไรก็ตามฉันไม่แน่ใจว่า sigmas ทั้งสองในความแตกต่างของ Gaussians เกี่ยวข้องกับ sigma สำหรับ Laplacian ของ Gaussian ได้อย่างไร sigma ที่เล็กกว่าในอดีตเท่ากับ sigma ของยุคหลังหรือไม่? ซิกม่าที่ใหญ่กว่านี้ไหม? หรือความสัมพันธ์เป็นอย่างอื่น?

4
มีสิ่งที่ผิดเพี้ยนแบบไม่ จำกัด เชิงเส้นหรือไม่?
ดังนั้นหากคุณสร้างคลื่นสี่เหลี่ยมโดยเพียงแค่สลับสัญญาณระหว่างค่าสองค่าที่ขอบเขตตัวอย่างมันจะสร้างอนุกรมฮาร์โมนิกที่ไม่สิ้นสุดซึ่งเป็นนามแฝงและให้เสียงต่ำกว่าพื้นฐานของคุณซึ่งได้ยินได้มาก การแก้ปัญหาคือการสังเคราะห์แบบ จำกัด วงดนตรีไม่ว่าจะโดยใช้การสังเคราะห์แบบเติมแต่งหรือขั้นตอนแบบ จำกัด วงเพื่อสร้างรูปแบบของคลื่นที่เหมือนกับว่าคุณได้ จำกัด วงคลื่นสี่เหลี่ยมทางคณิตศาสตร์ในอุดมคติก่อนที่จะสุ่มตัวอย่าง: http://flic.kr/p/83JMjT แต่ฉันเพิ่งรู้ว่าถ้าคุณใช้การขยายขนาดใหญ่กับคลื่นไซน์ดิจิตอลและจากนั้นคลิปมันแบบดิจิทัลมันจะสร้างรูปร่างคลื่นสี่เหลี่ยมที่เหมือนกันโดยไม่มีปรากฏการณ์กิ๊บส์ ดังนั้นมันจึงเป็นผลิตภัณฑ์ที่มีการบิดเบือนนามแฝงใช่ไหม ดังนั้นใดบิดเบือนไม่เชิงเส้นในโดเมนดิจิตอลที่ผลิตฮาร์โมนินอกขีด จำกัด Nyquist จะผลิตสินค้าที่มีการบิดเบือน aliased? (แก้ไข: ฉันได้ทำการทดสอบและยืนยันว่าส่วนนี้เป็นจริง) มีสิ่งที่บิดเบือนวง จำกัด ในการจำลอง (ในโดเมนดิจิตอล) ผลกระทบของการบิดเบือน (ในโดเมนอนาล็อก) ก่อนที่วง จำกัด และการสุ่มตัวอย่าง? ถ้าเป็นเช่นนั้นคุณจะทำอย่างไร ถ้าฉันค้นหา "bandlimited distortion" ฉันพบการอ้างอิงถึงชื่อพหุนาม Chebyshev แต่ฉันไม่รู้ว่าจะใช้พวกมันอย่างไรหรือพวกมันใช้งานได้เฉพาะคลื่นไซน์หรืออะไร: เครื่องมือนี้ไม่ได้พยายามสร้างความผิดเพี้ยนแบบ จำกัด วง ผู้ที่สนใจในการบิดเบือนวง จำกัด ควรตรวจสอบการใช้ชื่อพหุนาม Chebyshev เพื่อสร้างผล การบิดเบี้ยวของไฮเพอร์โบลิกแทนเจนต์ "Chebyshev polynomial" - การสร้างฟังก์ชั่นที่มีคุณสมบัติสำคัญที่พวกเขามีวงดนตรี จำกัด - ภายในเช่นที่พวกเขาไม่แนะนำฮาร์โมนิกสเปกตรัมปลอมเนื่องจากการทับซ้อน …

2
การประมาณโฟกัสอัตโนมัติ?
การวิเคราะห์แบบใดที่อาจใช้กับชุดการฝึกอบรมภาพสองมิติขาวดำหรือบิตแมปเพื่อประเมินหรือเปรียบเทียบคุณภาพสัมพัทธ์ของการเป็น "อยู่ในโฟกัส" มีวิธีที่มีประสิทธิภาพในการคำนวณมาตรวัดแบบสเกลาร์ในบางสิ่งบางอย่างเช่นความเปรียบต่างโดยรวมความสว่างของแสงหรือสิ่งประดิษฐ์อื่น ๆ ที่เกิดจากการเบลอของโฟกัสนอกหรือไม่

3
เหตุใดตัวกรองสัญญาณหยุดของฉันจึงลดทอนความถี่อื่น ๆ ได้
นี่คือรหัสของฉันสำหรับสัญญาณสองโทนซึ่งฉันใช้แถบหยุดเพื่อลบเสียงที่สูงขึ้นแล้วพล็อตก่อน (เป็นสีน้ำเงิน) และหลัง (เป็นสีแดง) ในโดเมนความถี่หลังจากสังสัยสัญญาณของฉันด้วยสัมประสิทธิ์ตัวกรอง . หากคุณใส่รหัสนี้ใน Matlab คุณจะเห็นได้อย่างชัดเจนว่าตัวกรองความถี่สูงได้ถูกลบออกไปเรียบร้อยแล้ว แต่ด้วยเหตุผลบางอย่างความกว้างของความถี่ต่ำได้ถูกตัดลงครึ่งหนึ่งและยิ่งฉันเพิ่ม # ของสัมประสิทธิ์ตัวกรองมากขึ้น ยิ่งทำให้เส้นโค้งทั้งหมดของฉันแบนลงทำไมจึงเกิดสิ่งนี้ขึ้น และฉันจะป้องกันได้อย่างไรเพื่อที่วงหยุดจะไม่เผยแพร่ออกไปด้านนอก? นี่คือภาพและรหัส: fSampling = 8000; tSampling = 1 / f การสุ่มตัวอย่าง t = 0: t การสุ่มตัวอย่าง: 0.005; F0 = 1,000; F1 = 3000; xt = sin (2 * pi * F0 * t) + sin (2 * …
12 filters  matlab 

5
การสุ่มตัวอย่างก่อนขึ้นความสัมพันธ์ข้ามไร้ประโยชน์หรือไม่
พิจารณากรณีง่าย ๆ ที่สัญญาณสองตัวจากเซ็นเซอร์ที่แตกต่างกันสองตัวมีความสัมพันธ์ข้ามกันและการหน่วงเวลาของการมาถึงคำนวณจาก absissa ของจุดสูงสุดของฟังก์ชั่นความสัมพันธ์ข้าม ตอนนี้ให้เราสมมติต่อไปว่าเนื่องจากข้อ จำกัด ด้านมิติของทั้งเสาอากาศและข้อ จำกัด ของอัตราการสุ่มตัวอย่างสูงสุดที่เป็นไปได้การหน่วงเวลาที่สามารถบรรลุได้สูงสุดคือซึ่งสอดคล้องกับ 10 ตัวอย่างDDD ปัญหา: เนื่องจากข้อ จำกัด เหล่านั้นล่าช้าคำนวณของคุณอาจแตกต่างกันไปจากจำนวนเต็มค่าระหว่าง 0 ถึง 10 ตัวอย่างที่:10 นี่เป็นปัญหาเนื่องจากสิ่งที่ฉันต้องการจริง ๆ คือการเลือกปฏิบัติความล่าช้าเล็กน้อยระหว่างสัญญาณทั้งสองที่ส่งผลต่อเสาอากาศของฉันและการเปลี่ยนขนาดหรืออัตราการสุ่มตัวอย่างไม่ใช่ตัวเลือก0≤D≤100≤D≤100 \le D \le 10 ความคิดบางอย่าง: สิ่งแรกที่ฉันคิดในกรณีนี้คือการอัปเกรดสัญญาณก่อนที่จะทำการเชื่อมโยงข้ามกัน อย่างไรก็ตามฉันคิดว่านี่เป็น 'การโกง' อย่างใดเพราะฉันไม่ได้เพิ่มข้อมูลใหม่ใด ๆ ลงในระบบ ฉันไม่เข้าใจว่าการยกตัวอย่างไม่ได้เป็น 'การโกง' ในแง่หนึ่ง ใช่เรากำลังสร้างสัญญาณของเราใหม่โดยใช้ข้อมูลความถี่ที่สังเกตได้ในปัจจุบัน แต่สิ่งนี้ให้ความรู้หนึ่งที่สัญญาณเริ่มต้นอย่างแท้จริงระหว่างพูดและอย่างไร ข้อมูลนี้มีอยู่ที่ไหนในสัญญาณดั้งเดิมที่พิจารณาว่าการเริ่มต้นสัญญาณล่าช้าแบบเศษส่วนจริง ๆ นั้นอยู่ที่ ?D = 8 D = 7.751D=7D=7D=7D=8D=8D=8D=7.751D=7.751D=7.751 คำถาม): นี่คือ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.