การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

1
การวัดการหน่วงเวลาของสัญญาณเสียง
ก่อนที่ทุกคนจะตะโกนใส่ฉันฉันก็ตระหนักว่าคำถามนี้ถูกถามมาหลายครั้งแล้ว ฉันรับรองว่าฉันได้อ่านคำถามและคำตอบที่มีอยู่แล้ว แต่ฉันยังสับสนเกี่ยวกับปัญหา ฉันมีแหล่งกำเนิดเสียงที่เล่นเพลง (A) ในสภาพแวดล้อมที่ปิด ฉันมีไมโครโฟนที่ฉันใช้บันทึก A. ฉันเหลือไฟล์ wav สองไฟล์ซึ่งมีลักษณะและความยาวเท่ากัน (จำนวนตัวอย่าง) เป้าหมายของฉันคือคำนวณเวลาที่ใช้ในการเข้าถึงไมโครโฟน ฉันพยายามคำนวณโดยใช้ความสัมพันธ์ข้าม (numpy): # Delay estimation corr = numpy.convolve(original_audio, recorded_audio, 'full') delay = int(len(corr)/2) - numpy.argmax(corr) distance = delay / sample_rate * 343 # sample_rate == 22050, m/s = speed of sound print("Distance full: %.2f cm" % (distance …

4
การแปลงแบบ DFT ใช้คลื่นสามเหลี่ยมแทนคลื่นบาป
เรารู้ว่า DFT (การแปลงฟูริเยร์แบบแยก) แบ่งสัญญาณเป็นคลื่นความถี่ไซน์หลายความถี่ มีการแปลงที่ทำสิ่งเดียวกัน แต่สำหรับคลื่นสามเหลี่ยม สำหรับจุดประสงค์ของฉันฉันแค่พูดคุยเกี่ยวกับสัญญาณ 1-d (เช่นแรงดันไฟฟ้า ฯลฯ ) ฉันกำลังศึกษาข้อมูลการลงทุนในตลาดหุ้นในอดีตและฉันแค่ต้องการดูการกลับตัวของหุ้นบางตัว กล่าวอีกนัยหนึ่งฉันต้องการดำเนินการ "low-pass" ในราคาหุ้นโดยใช้การแปลงนี้ แก้ไข: ถ้าใช่ฉันจะทำอย่างไร
9 fft  dft  transform 

1
การใช้ตัวกรองคาลมานสำหรับตำแหน่ง, ความเร็ว, ความเร่ง
ฉันเคยใช้ตัวกรองคาลมานสำหรับสิ่งต่าง ๆ ในอดีต แต่ตอนนี้ฉันสนใจที่จะใช้หนึ่งในการติดตามตำแหน่งความเร็วและการเร่งความเร็วในบริบทของตำแหน่งการติดตามสำหรับแอพสมาร์ทโฟน มันทำให้ฉันรู้สึกว่านี่ควรเป็นตัวอย่างของตัวกรองเชิงเส้นคาลมาน แต่ฉันไม่สามารถหาลิงก์ออนไลน์ใด ๆ ที่พูดถึงเรื่องนี้ได้ ฉันสามารถนึกถึงวิธีการต่าง ๆ ในการทำเช่นนี้ แต่แทนที่จะค้นคว้าจากศูนย์บางทีคนที่นี่สามารถชี้ให้ฉันไปในทิศทางที่ถูกต้อง:ไม่มีใครรู้วิธีที่ดีที่สุดในการตั้งค่าระบบนี้หรือไม่? ตัวอย่างเช่นเมื่อพิจารณาประวัติตำแหน่งล่าสุดแล้ววิธีที่ดีที่สุดในการทำนายจุดถัดไปในพื้นที่สถานะตัวกรองคาลมานคืออะไร อะไรคือข้อดีและข้อเสียของการรวมการเร่งความเร็วในพื้นที่รัฐ หากการวัดทั้งหมดอยู่ในตำแหน่งถ้าความเร็วและความเร่งอยู่ในพื้นที่รัฐระบบจะไม่เสถียรหรือไม่? ฯลฯอีกวิธีหนึ่งไม่มีใครรู้ว่ามีการอ้างอิงที่ดีสำหรับการประยุกต์ใช้ตัวกรองคาลมานนี้หรือไม่?ขอบคุณ

3
ทำไมการเพิ่มสัญญาณรุ่นที่ล่าช้าไปยังตัวมันเองจึงสร้างสัญญาณที่ถูกกรอง?
ฉันถูกถามคำถามนี้และไม่สามารถหาคำตอบในจุดที่ไม่เกี่ยวข้องกับโดเมนความถี่ได้ (โดยทั่วไปแล้วว่าประสิทธิภาพร่วมของลำดับการหน่วงเวลาเป็นการตอบสนองแบบแรงกระตุ้นของตัวกรอง FIR) ใครบ้างมีความเข้าใจซึ่งทำให้กระบวนการนี้ 'ชัดเจน'?
9 filters 

1
การนับ vechicles ในภาพ
ฉันพยายามใช้อัลกอริทึมสำหรับการนับจำนวนรถยนต์เป็นภาพเรียบร้อยแล้ว ฉันได้ลองใช้วิธีการสำหรับการนับยานพาหนะในการแสดงตนของยานพาหนะหลายภาพในภาพการจราจร มันประเมินพื้นหลังจากชุดของภาพต่าง ๆ ฉันได้ดูเทคนิคอื่น ๆ เพื่อจุดประสงค์นี้และสิ่งเหล่านี้ในทางเดียวหรืออื่น ๆ ใช้การประเมินพื้นหลังทั้งจากชุดภาพหรือต้องการวิดีโอ ฉันมีภาพอินพุตภาพจราจรที่พื้นหลัง (อาจเป็นถนนในเอกสารส่วนใหญ่) แทบจะมองไม่เห็น ยิ่งไปกว่านั้นภาพนั้นมาจากพื้นที่ที่แตกต่างกันดังนั้นจึงไม่มีพื้นหลังเหมือนกัน ฉันควรดำเนินการอย่างไรในกรณีนั้น ฉันคิดว่าถ้าอย่างใดฉันสามารถตรงกับโครงสร้างของยานพาหนะ (รถยนต์) แล้วพวกเขาอาจจะสามารถจับคู่ แต่ฉันไม่รู้ว่าสิ่งนี้เป็นไปได้หรือไม่และเป็นวิธีการดำเนินการต่อเนื่องจากภาพมียานพาหนะที่ถูกบดบังหลายคันเช่นกัน คำแนะนำใด ๆ หรือแม้กระทั่งงานวิจัยก็ยินดีต้อนรับ ภาพตัวอย่างมีดังนี้:

1
ฉันสามารถใช้การแปลงรูปแบบใดเพื่อ“ ซูม” ในส่วนเฉพาะของสเปกตรัมของสัญญาณ
หากฉันจำได้อย่างถูกต้องจะมีการเปลี่ยนแปลงของ DFT ที่สามารถใช้ในการวิเคราะห์ย่านความถี่เฉพาะของสัญญาณ มันเรียกว่าอย่างไร

1
การแบ่งส่วนและติดตามยานพาหนะ
ฉันทำงานเกี่ยวกับโปรเจคมาระยะหนึ่งเพื่อตรวจจับและติดตามยานพาหนะในวิดีโอที่ถ่ายจาก UAV ในขณะนี้ฉันใช้ SVM ที่ได้รับการฝึกอบรมเกี่ยวกับการนำเสนอคุณสมบัติถุงของคุณลักษณะท้องถิ่นที่ดึงมาจากยานพาหนะและภาพพื้นหลัง จากนั้นฉันใช้วิธีตรวจจับหน้าต่างแบบเลื่อนเพื่อลองและ จำกัด ยานพาหนะในรูปภาพซึ่งฉันต้องการติดตาม ปัญหาคือวิธีการนี้ช้าและตัวตรวจจับของฉันไม่น่าเชื่อถือเท่าที่ฉันต้องการดังนั้นฉันจึงได้รับผลบวกที่ผิดพลาดเล็กน้อย ดังนั้นฉันจึงพิจารณาที่จะพยายามแบ่งส่วนรถยนต์จากพื้นหลังเพื่อค้นหาตำแหน่งโดยประมาณเพื่อลดพื้นที่การค้นหาก่อนที่จะใช้ตัวจําแนกของฉัน แต่ฉันไม่แน่ใจว่าจะไปเกี่ยวกับเรื่องนี้อย่างไรและหวังว่าจะมีคนช่วย นอกจากนี้ฉันได้อ่านเกี่ยวกับการแบ่งส่วนการเคลื่อนไหวด้วยเลเยอร์โดยใช้ออปติคัลโฟลว์เพื่อแบ่งเฟรมตามโมเดลโฟลว์ไม่มีใครมีประสบการณ์ใด ๆ กับวิธีการนี้ถ้าเป็นเช่นนั้นคุณสามารถให้อินพุตบางส่วนได้หรือไม่ ปัญหาของฉัน UPDATE : ฉันโพสต์คำถามนี้ไว้ใน stack overflow ด้วยและมีคำตอบที่ยอดเยี่ยมฉันได้ใช้ความคิดนี้ไปแล้วและมันก็ทำงานได้ดีมากและตอนนี้ฉันก็กำลังตรวจสอบการใช้ optical flow นอกเหนือจากเทคนิคนี้ ด้านล่างเป็นสองเฟรมจากวิดีโอตัวอย่าง กรอบ 0: กรอบ 5:

1
ลบเสียงรบกวนบนขอบ (deffects การบีบอัด)
ฉันมีรูปการ์ตูนที่ถูกบีบอัด ตัวอย่าง: พวกเขามีเสียงดังซึ่งไม่ง่ายที่จะลบ แม้ว่าพิกเซลจะอยู่บนพื้นหลังสีเทา แต่พิกเซลของเสียงนั้นอาจมีสีที่แตกต่างกันมากและถ้าฉันดูที่ฮิสโตแกรม (ของภาพระดับสีเทา) ของภาพเหล่านั้น แต่ฉันไม่สามารถลบสีที่มีค่าซึ่งไม่ใช่สีหลักเพราะมีความเสี่ยงที่จะลบคุณลักษณะที่สำคัญบางอย่าง (เช่นตา) นอกจากนี้ฉันพยายามที่จะทำให้ภาพโปสเตอร์ (ตัวอย่างนำเสนอ 8 สี) แต่บางพิกเซลยังคงอยู่ นอกจากนี้ฉันได้ลองใช้ตัวกรองแบบกลาง แต่ไม่สามารถขจัดเสียงรบกวนที่หนักหน่วง (ฉันใช้ตัวกรอง 3 * 3) โปรดให้วิธีการบางอย่างที่สามารถกำจัดเสียงรบกวนได้อย่างมีประสิทธิภาพในกรณีนี้ ฉันจะขอบคุณสำหรับความช่วยเหลือใด ๆ !

5
ความหมายที่แท้จริงของระบบที่ไม่เสถียรใน DSP คืออะไร?
ในระบบกายภาพฉันเข้าใจว่าอะไรคือความหมายของเสถียรภาพหรือความไม่แน่นอน แอมพลิฟายเออร์ในการดำเนินงานตัวอย่างเช่นหากทำงานในการตอบรับเชิงบวกจะทำให้อิ่มตัวหรือเริ่ม osscilating (เช่นจะไม่มีสถานะเสถียรใด ๆ ) ชัดเจนสำหรับฉัน แต่ฉันไม่สามารถเข้าใจสิ่งที่เราหมายถึงเมื่อเราพูดว่าตัวกรอง IIR (หรือระบบดิจิตอลอื่น ๆ ) สามารถกลายเป็นไม่เสถียรมาก ภายใน Digital Signal Proccessor เกิดอะไรขึ้นสิ่งที่เกิดขึ้นกับเอาท์พุททางกายภาพ? เราหมายถึงอะไรโดยระบบที่ไม่เสถียรในบริบทนี้

2
จะถอดรหัส soft DQPSK ได้อย่างไร?
ฉันถอดรหัสซอฟต์ D-BPSK ได้สำเร็จโดยการหาจุดดอทโปรดัคของตำแหน่งกลุ่มดาวของสัญลักษณ์และสัญลักษณ์ก่อนหน้า หากผลลัพธ์คือ> = 1 แสดงว่าเฟสสัญลักษณ์ไม่เปลี่ยนแปลงและบิตเป็นศูนย์ หากผลลัพธ์คือ <= -1 ดังนั้นเฟสจะถูกเลื่อนและผลลัพธ์จะเป็นหนึ่ง ในระหว่าง -1 ถึง 1 ผลลัพธ์จะเป็น 0 หรืออ่อน 1 ฉันไม่สามารถหาวิธีการทำสิ่งเดียวกันกับ D-QPSK ฉันสามารถใช้เฟสได้ แต่นี่เป็นการทิ้งข้อมูลจำนวนมากที่สามารถช่วยให้ตัวถอดรหัสนุ่ม กระดาษนี้จะอธิบายวิธีการทำและให้สูตร (10): ข1= R e {sns* * * *n - 1} ,ข2= ฉันm {sns* * * *n - 1}b1=Re{snsn−1∗},b2=Im{snsn−1∗}b_1 = \mathrm{Re}\{s_n s^*_{n-1}\}, b_2 = \mathrm{Im}\{s_n s^*_{n-1}\} แต่ฉันไม่เข้าใจสัญกรณ์ …

1
หมุนภาพ 3 มิติ
ฉันมีภาพสามมิติของอ๊อกซิเจนที่ไม่ใช่ isotropic ซึ่งฉันใช้การหมุนทั่วไป ฉันจะกำหนดขนาดวอกเซลที่เหมาะสมสำหรับภาพที่หมุนได้อย่างไร ฉันต้องการลดการสูญเสียข้อมูลให้น้อยที่สุด แต่หลีกเลี่ยงการสุ่มตัวอย่างมากเกินไปเพื่อป้องกันไม่ให้ภาพใหญ่เกินไป

2
การแปลงฟูริเยร์ลอการิทึม (LFT) บนสัญญาณเสียง
ฉันพยายามวิเคราะห์เพลงให้มากที่สุด แน่นอนฉันลอง FFT แต่มีปัญหาบางอย่าง ฉันพบว่าความถี่ต่ำมีความละเอียดต่ำกว่าการได้ยินของมนุษย์ ฉันลองใช้ FFT เป็นเวลานานเพื่อแก้ไขปัญหานี้ แต่ถึงแม้จะวิเคราะห์ด้วย 8192 ตัวอย่าง / s ในอัตราตัวอย่าง 44100Hz (หมายถึงไม่มีการแก้ปัญหาเวลา) ฉันได้รับความละเอียดไม่เพียงพอสำหรับความถี่ต่ำ ฉันพบว่ามีวิธีแก้ปัญหาน้อย ประการแรกการแก้ไขกำลังสองบนถังขยะ FFT แต่ดูเหมือนจะไม่ใช่วิธีที่สมบูรณ์แบบ ปัญหาของวิธีนี้คือ: 1. 'ถ้าฉันต้องการหา freqs ระหว่าง freq bins ฉันควรเลือกถังขยะสามอันเพื่อทำการแก้ไข?' 2. 'แม้ฉันจะทำสิ่งนี้ไม่มีข้อมูลเพิ่มเติมที่เกิดขึ้นจริง ฉันรู้ว่าการแก้ไขเป็นวิธีที่ยุ่งยากมาก ' ประการที่สองการดึง freq แต่ละช่องด้วยความถี่ที่ต้องการดังนั้นฉันสามารถแยกลอการิทึมแบบลอการิทึม แต่มีปัญหาต้นทุนการคำนวณที่สำคัญ: (อาจมากกว่า) N ^ 2 ประการที่สาม LFT (การแปลงลอการิทึมฟูริเยต์) ผู้ร้องขอนี้ใช้ตัวอย่างระยะห่างแบบลอการิทึมและให้ผลลัพธ์ที่ตรงกับความต้องการของฉันด้วยความเร็วที่รวดเร็วอย่างไม่น่าเชื่อ /programming/1120422/is-there-an-fft-that-uses-a-logarithmic-division-of-frequency แต่ฉันไม่รู้ด้วยอัลกอริธึมนั้น ฉันพยายามที่จะเข้าใจกระดาษและนำไปใช้ แต่มันเป็นไปไม่ได้เพราะขาดทักษะภาษาอังกฤษและคณิตศาสตร์ของฉัน ดังนั้นฉันต้องการความช่วยเหลือในการใช้ …
9 audio  fft 

2
ช่วงเวลาภาพดิจิตอลเป็นภาษาอังกฤษธรรมดา
ฉันกำลังศึกษา OpenCV และในการมองเห็นคอมพิวเตอร์และการประมวลผลภาพผู้คนพูดถึง blobs, contours, พื้นที่ที่เชื่อมต่อกันและบางครั้งฉันก็ได้ยินวลี "ช่วงเวลาภาพ" ฉันรู้บทความเกี่ยวกับ Wikipedia เกี่ยวกับเรื่องนี้แต่ฉันคิดว่ามันเป็นเทคนิคเกินไป ฉันไม่ต้องการเจาะลึกลงไปในพื้นหลังของคณิตศาสตร์ แต่ฉันอยากรู้ว่าฉันกำลังพูดถึงอะไร ใครช่วยอธิบายให้ฉันรู้ว่าช่วงเวลาภาพเป็นภาษาอังกฤษธรรมดา

1
Scalogram (และระบบการตั้งชื่อที่เกี่ยวข้อง) สำหรับ DWT?
ความเข้าใจของฉันเกี่ยวกับ scalogram คือว่าสำหรับแถวใดแถวหนึ่งคะแนนการประมาณการของสัญญาณอินพุตด้วย wavelet ที่การกระจัดที่เฉพาะเจาะจงนั้นปรากฏขึ้น ข้ามแถวสิ่งเดียวกันใช้ แต่สำหรับเวฟเล็ตเวอร์ชันขยาย ฉันคิดว่าสามารถกำหนด scalograms สำหรับการแปลงเวฟเล็ตทุกประเภทนั่นคือสำหรับ: การแปลงเวฟเล็ตอย่างต่อเนื่อง การแปลงเวฟเล็ตแบบไม่ต่อเนื่อง การแปลงเวฟเล็ตซ้ำซ้อน อย่างไรก็ตามจากการตรวจสอบต่อไปดูเหมือนว่า scalogram นั้นสามารถนิยามได้เฉพาะ CWT เท่านั้น จากนี้ฉันมีคำถามที่เกี่ยวข้องกันหลายอย่างที่ Google ไม่ได้ทำเพื่อ ATM คำถาม: เป็นความจริงหรือไม่ที่ scalogram ไม่ได้ถูกกำหนดสำหรับ DWT หรือ RWT? ถ้าเป็นเช่นนั้นทำไมไม่ ให้เราบอกว่าสัญญาณความยาวมีการสลายตัว 10 ระดับโดยใช้ DWT หากทุกระดับถูกพล็อตเป็นรูปภาพ (นั่นคือภาพ ) ภาพนี้เรียกว่าอะไร?ยังไม่มีข้อความNN10 x N10xN10xN เป็นตัวอย่างของ 'scalogram' ของ DWT นี่คือตัวอย่างหนึ่งสำหรับ AWGN: เกี่ยวกับสัญญาณเดียวกันสมมติว่าเราแทนพล็อตการประมาณ MRA ของสัญญาณในทุกระดับ (ดังนั้นอีกครั้งเป็น …

1
ฉันจะตรวจจับหลุมบ่อโดยใช้มาตรความเร่งที่ติดตั้งในยานพาหนะได้อย่างไร
ฉันกำลังเรียน DSP และ FFT ฉันยังใหม่กับเรื่องนี้มากและได้ทำอุปกรณ์อิเล็กทรอนิกส์มาเป็นเวลานานกับ Arduino และงานอดิเรก เมื่อเร็ว ๆ นี้ฉันกำลังทำโครงการโดยมีเป้าหมายที่จะทำแผนที่หลุมบ่อตามการเดินทางประจำวันของคุณในรถวัดความหยาบของถนน นี่ไม่ใช่โปรไฟล์ถนน แต่ความขรุขระของการขับขี่ที่ผู้ขับขี่รู้สึกในระหว่างการเดินทาง ฉันมีการเร่งความเร็วเพื่อติดตั้งการเร่งความเร็ว "แนวตั้ง" ของแกน Z เมื่อหลุมบ่อถูกกระแทกกระแทกและสปริงก็รองรับแรงตามแบบจำลองของรถในไตรมาสเพื่อความเรียบง่าย โดยทั่วไปฉันต้องการสร้างเครื่องตรวจจับที่จะตรวจจับหลุมบ่อโดยใช้ FFT เพื่อค้นหาความถี่ที่มีอิทธิพลของการเร่งความเร็วในแนวตั้งจากนั้นฉันอาจจับคู่กับรูปแบบการตรวจจับการชนประตูของประตูรถหรือฝาครอบหลุมคน อาจจะเป็นหลุมบ่อในอนาคต ฉันไม่แน่ใจว่า FFT เป็นวิธีที่จะไปได้หรือไม่คำแนะนำและความคิดใด ๆ ที่ได้รับการชื่นชมอย่างมากฉันได้สร้างตัวกรองความถี่ต่ำเพื่อกรองการสั่นสะเทือนความถี่สูงจากรถไฟไดรฟ์และเครื่องยนต์ ความคิดใด ๆ เกี่ยวกับความรู้สึก "หยาบ" ของผู้โดยสาร / ผู้ขับขี่ในรถยนต์? ฉันกำลังคิดที่จะทำการทดสอบบนถนนบนถนนที่เรียบถนนลูกรังถนนอิฐถนนที่ไม่ดีและเกิดขึ้นกับขีด จำกัด ของขนาดของการเร่งความเร็วในแนวตั้งและทำให้สเกลในสิ่งที่ถือว่าเป็น "หยาบ" หลุมบ่อที่ตรวจพบจะถูกบันทึกด้วยตำแหน่ง GPS ของพวกเขาฉันพยายามใช้ Rasberry Pi สำหรับสิ่งนี้ด้วยการจัดเก็บข้อมูลและความเร็วของมันเป็นโครงการที่ดีสำหรับมัน ขอขอบคุณสำหรับความช่วยเหลือหรือความคิดใด ๆ ชื่นชมหนังสือแบบฝึกหัดภูมิปัญญา ฯลฯ UPDATE: นำข้อมูลเพิ่มเติมมาที่นี่: /electronics/56238/accelerometer-data-smoothing-filtering-pothole-detection
9 fft 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.