การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

6
ความสัมพันธ์ระหว่างการประมวลผลสัญญาณและวิศวกรรมระบบควบคุม?
วิศวกรรมระบบควบคุมและการประมวลผลสัญญาณดิจิตอลเป็นหลักสูตร / วิชาที่สำคัญของวิศวกรรมไฟฟ้า แต่วิชา / หลักสูตรทั้งสองนี้เกี่ยวข้องกันอย่างไร นอกจากนี้โปรดแจ้งให้เราทราบว่ามีแหล่งข้อมูลอะไรบ้างที่แนะนำ (หนังสือแบบฝึกหัดการบรรยาย ฯลฯ ) เกี่ยวกับวิศวกรรมระบบควบคุมและวิธีเริ่มทำงานกับมันในระดับเทคนิค? เนื่องจากเรามีคำตอบในลิงค์ด้านล่าง แต่คำตอบนั้นเกี่ยวกับทรัพยากร dsp ฉันกำลังมองหาแหล่งข้อมูลเกี่ยวกับวิศวกรรมระบบควบคุม ตัวอย่างคำตอบของคำขอ refrence

3
ภาพถ่ายง่าย ๆ มีข้อมูลมากกว่าภาพวาดที่ซับซ้อนหรือไม่?
ฉันหวังว่าคำถามนี้เหมาะสมสำหรับไซต์นี้ ฉันเจอข้อความนี้ในThe Three Body Problemนวนิยายของ Liu Cixin: อาจารย์ได้วางภาพสองภาพ: หนึ่งเป็นที่มีชื่อเสียงราชวงศ์ซ่งภาพวาดพร้อมแม่น้ำในช่วงเทศกาลเชงเม้งเต็มรูปแบบของการปรับรายละเอียดที่อุดมไปด้วย; อีกรูปหนึ่งเป็นรูปถ่ายของท้องฟ้าในวันที่แดดจ้าท้องฟ้าสีครามอันกว้างใหญ่แตกหักโดยก้อนเมฆ ... เนื้อหาข้อมูลของภาพถ่าย - เอนโทรปี - เกินขนาดภาพหนึ่งหรือสองภาพ ภาพตัวแทน: มันเป็นเรื่องจริงเหรอ? เราอธิบายปรากฏการณ์ที่ไม่เข้าใจได้ง่ายอย่างไร

1
การเปลี่ยนแปลงใดที่เลียนแบบระบบการได้ยินของมนุษย์มากที่สุด
การแปลงฟูริเยร์มักใช้สำหรับการวิเคราะห์ความถี่ของเสียง อย่างไรก็ตามมันมีข้อเสียเมื่อวิเคราะห์การรับรู้เสียงของมนุษย์ ยกตัวอย่างเช่นถังขยะความถี่เป็นเชิงเส้นในขณะที่หูมนุษย์ตอบสนองความถี่ลอการิทึมไม่เป็นเส้นตรง การแปลงเวฟเล็ตสามารถแก้ไขความละเอียดสำหรับช่วงความถี่ที่แตกต่างกันซึ่งแตกต่างจากการแปลงฟูริเยร์ เวฟแปลงคุณสมบัติของช่วยให้การสนับสนุนชั่วคราวขนาดใหญ่สำหรับความถี่ต่ำในขณะที่รักษาความกว้างชั่วขณะสั้นสำหรับความถี่สูง Morlet เวฟเกี่ยวข้องอย่างใกล้ชิดกับการรับรู้ของมนุษย์ในการได้ยิน สามารถใช้กับการถอดความเพลงและให้ผลลัพธ์ที่แม่นยำมากซึ่งไม่สามารถทำได้โดยใช้เทคนิคการแปลงฟูริเยร์ มีความสามารถในการจับภาพการบรรเลงเพลงสั้น ๆ ซ้ำ ๆ และสลับกันโดยมีเวลาเริ่มต้นและสิ้นสุดที่ชัดเจนสำหรับแต่ละโน้ต คง-Q เปลี่ยน (ที่เกี่ยวข้องอย่างใกล้ชิดกับ Morlet แปลงเวฟเล็ต) นอกจากนี้ยังเหมาะกับข้อมูลดนตรี เนื่องจากเอาต์พุตของการแปลงเป็นแอมพลิจูด / เฟสอย่างมีประสิทธิภาพต่อความถี่ล็อกจึงจำเป็นต้องใช้ถังขยะสเปกตรัมน้อยกว่าเพื่อให้ครอบคลุมช่วงที่กำหนดได้อย่างมีประสิทธิภาพ การแปลงรูปแบบนี้จะช่วยลดความละเอียดของความถี่ด้วยช่องเก็บความถี่ที่สูงขึ้นซึ่งเป็นที่ต้องการสำหรับการใช้งานด้านการได้ยิน มันสะท้อนระบบการได้ยินของมนุษย์โดยที่ความละเอียดสเปกตรัมที่ต่ำกว่าจะดีกว่าในขณะที่ความละเอียดของสัญญาณชั่วคราวจะเพิ่มขึ้นที่ความถี่สูงขึ้น คำถามของฉันคือ: มีการเปลี่ยนแปลงอื่น ๆ ที่เลียนแบบระบบการได้ยินของมนุษย์อย่างใกล้ชิดหรือไม่? มีใครพยายามออกแบบการแปลงสภาพร่างกาย / ระบบประสาทที่ตรงกับระบบการได้ยินของมนุษย์ให้มากที่สุดหรือไม่? ยกตัวอย่างเช่นมันเป็นที่รู้จักกันว่าหูของมนุษย์มีการตอบสนองลอการิทึมกับความเข้มเสียง นอกจากนี้ยังเป็นที่รู้จักกันว่ารูปทรงเท่ากันเสียงดังแตกต่างกันไม่เพียง แต่มีความรุนแรง แต่มีระยะห่างในความถี่ของส่วนประกอบสเปกตรัม เสียงที่มีองค์ประกอบของสเปกตรัมในช่วงคลื่นวิทยุที่สำคัญจะรับรู้ได้ดังกว่าแม้ว่าความดันเสียงทั้งหมดจะยังคงที่ สุดท้ายหูมนุษย์มีจำกัด มติชั่วขึ้นอยู่กับความถี่ บางทีนี่อาจถูกนำมาพิจารณาด้วยเช่นกัน

3
ส่งข้อมูลผ่านเสียงระหว่างคอมพิวเตอร์ 2 เครื่อง (ระยะทางใกล้มาก)
ฉันกำลังเขียนตัวอย่างเกี่ยวกับการส่งข้อมูลผ่านเสียงระหว่างคอมพิวเตอร์ 2 เครื่อง ข้อกำหนดบางประการ: ระยะทางอยู่ใกล้มากนั่นคือคอมพิวเตอร์ 2 เครื่องนั้นอยู่ติดกัน เสียงรบกวนน้อยมาก (ฉันไม่คิดว่าครูของฉันจะเปิดเพลงร็อคเป็นแหล่งเสียง) ข้อผิดพลาดเป็นที่ยอมรับได้: ตัวอย่างเช่นถ้าฉันส่ง "การสื่อสารด้วยวิทยุ" ถ้าคอมพิวเตอร์อีกเครื่องได้รับ "RadiQ CommunEcation" ก็ไม่เป็นไร ถ้าเป็นไปได้: ไม่มีส่วนหัว, ธง, checksum, .... เนื่องจากฉันต้องการตัวอย่างพื้นฐานที่แสดงให้เห็นถึงพื้นฐานของการส่งข้อมูลผ่านเสียง ไม่จำเป็นต้องแฟนซี ฉันลองใช้การเปลี่ยนความถี่เสียงตามลิงค์นี้: Lab 5 APRS (ระบบรายงานแพ็กเกจอัตโนมัติ) และได้ผลลัพธ์บางส่วน: หน้า Github ของฉัน แต่มันก็ไม่เพียงพอ ฉันไม่ทราบวิธีการกู้คืนนาฬิกาการซิงโครไนซ์ ... (ลิงก์มี Phase Locked Loop เป็นกลไกการกู้คืนเวลา แต่ดูเหมือนจะไม่เพียงพอ) ดังนั้นฉันคิดว่าฉันควรหาวิธีที่ง่ายกว่า พบลิงค์ที่นี่: ข้อมูลเสียงและกลับ Modulation / demodulation พร้อม source code …
12 audio  modulation  sound  fsk 

4
คำแนะนำสำหรับหนังสือ - การเขียนรหัส DSP ใน C
ฉันกำลังมองหาหนังสือดีๆสักเล่มที่แสดงให้เห็นว่าคุณเขียนโค้ดใน C เพื่อทำวิธีหลัก DSP ทั้งหมดได้อย่างไร FFT ฟิลเตอร์กรองความถี่ต่ำและสูง Auto-สัมพันธ์ การประมวลผลเสียงรบกวน และพื้นฐานทั้งหมดของ DSP จากทฤษฏีไปเป็นรหัสจริงใน C ตัวอย่างเช่นฉันมี 1,000 ตัวอย่างตอนนี้ฉันต้องการคำนวณ FFT ของมันลบเสียงแล้วนำกลับมาที่แกนเวลา มีบางสิ่งที่ดีที่ครอบคลุมสิ่งเหล่านี้ทั้งหมดหรือไม่?

2
เหตุใดไฟล์ JPEG บางไฟล์ในฉากเดียวกันจึงใหญ่กว่าไฟล์อื่น ๆ มาก
ฉันใช้กล้อง IP Foscam FI8910W เพื่อดูฉากคงที่ภายใต้สภาพแสงที่คงที่ เมื่อฉันดึงกรอบคว้ากลับมามันมีขนาดประมาณ 35 KB ฉันสามารถทำสิ่งนี้ซ้ำแล้วซ้ำอีกและมันจะอยู่ที่ประมาณ 35 KB แต่ค่อนข้างผันผวนเนื่องจากเสียงต่าง ๆ ที่เกิดขึ้นจากการจับภาพอิเล็กทรอนิกส์ ความผันผวนแบบสุ่มนี้เป็นเพียงลำดับสูงสุด 1 KB ประมาณ 2,500 เฟรมทุกขนาดภาพของเฟรมจะอยู่ที่ 70 KB ไม่มีการคืบขึ้นไปอย่างค่อยเป็นค่อยไปหากคุณกำลังคิดถึงเสียงความร้อนเมื่อกล้องอุ่นขึ้น 1 เฟรมจะเป็น 70 KB (ish) จากนั้นจะกลับไปที่เฟรมขนาด 35 KB เรื่องนี้เกิดขึ้นก่อนหน้ากับการวิ่งอีกครั้งเพื่อดูฉากอื่น ขนาดไฟล์ทั่วไปคือ 39 KB และจาก 10,000 เฟรม 4 ไฟล์มีขนาด 77 KB ฮิสโตแกรมขนาดภาพมีลักษณะดังนี้: - ก่อนที่คุณจะถามฉันได้ทำการบันทึกหนึ่งในเฟรมเหล่านี้แล้วและดูเหมือนว่ากรอบอื่น ๆ ทั้งหมดจะมีความผันผวนของสัญญาณรบกวน พวกเขามีจำนวนสีที่ไม่ซ้ำกันประมาณ 23,000 ดังนั้นมันจึงไม่ใช่มอดลงบนเลนส์แบบสุ่มเพียง …
12 jpeg 

3
การเข้ารหัสการประมวลผลภาพ
ฉันสงสัยว่าภาษาใดดีที่สุดสำหรับการประมวลผลภาพ ฉันรู้ว่า MATLAB มีห้องสมุดและชุมชนผู้ใช้ที่ดี ฉันไม่ได้ตรวจสอบมันมีสำหรับหลามเช่นกัน ภาษาที่มีประสิทธิภาพที่สุดสำหรับสิ่งนี้คืออะไร?

1
วิธีการคำนวณจุดคงที่ at2 บน FPGA
ฉันต้องการคอมพิวเตอร์atan2(x,y)ใน FPGA ที่มีกระแสข้อมูลเข้า / ออกอย่างต่อเนื่อง ฉันจัดการเพื่อใช้มันโดยใช้เมล็ด CORDIC ที่ยังไม่ผ่านการควบคุม แต่เพื่อให้ได้ความแม่นยำที่ฉันต้องการฉันต้องดำเนินการซ้ำ 32 ครั้ง สิ่งนี้นำไปสู่ ​​LUT จำนวนมากที่อุทิศให้กับภารกิจนี้ ฉันพยายามเปลี่ยนโฟลว์เพื่อใช้เมล็ด CORDIC ที่ไม่ได้ควบคุมบางส่วน แต่แล้วฉันต้องการความถี่สัญญาณนาฬิกาคูณเพื่อรันลูปซ้ำ ๆ ในขณะที่ยังคงอินพุต / เอาต์พุตไหลต่อเนื่อง ด้วยสิ่งนี้ฉันไม่สามารถทำตามกำหนดเวลาได้ atan2(x,y)ดังนั้นตอนนี้ฉันกำลังเอื้อมมือออกหาวิธีทางเลือกของการใช้คอมพิวเตอร์ ฉันคิดเกี่ยวกับการใช้ตารางการค้นหา block-RAM พร้อมการแก้ไข แต่เนื่องจากมี 2 ตัวแปรฉันจะต้องใช้ตารางการค้นหา 2 มิติและนี่เป็นทรัพยากรที่ใช้ทรัพยากรมากในแง่ของการใช้งาน block-RAM ฉันคิดถึงการใช้ความจริงที่atan2(x,y)เกี่ยวข้องatan(x/y)กับการปรับควอดเรน ปัญหาเกี่ยวกับสิ่งนี้คือx/yต้องการการแบ่งที่แท้จริงเนื่องจากyไม่ใช่ค่าคงที่และการแบ่งส่วนบน FPGA นั้นใช้ทรัพยากรอย่างมาก มีวิธีการใหม่ ๆ ที่จะนำไปใช้atan2(x,y)กับ FPGA ที่จะส่งผลให้การใช้ LUT ลดลง แต่ยังให้ความแม่นยำที่ดีหรือไม่?
12 algorithms 

4
เลขยกกำลังที่ซับซ้อนเป็นฟังก์ชันเฉพาะของระบบ LTI หรือไม่
มีตัวอย่างของ eigenfunction ของระบบ linear time invariant (LTI) ที่ไม่ใช่เลขชี้กำลังเชิงซ้อนหรือไม่? Eigenfunctions ของ LTI Systems ของ Justin Romberg กล่าวว่า eigenfuctions นั้นมีอยู่จริง แต่ฉันไม่สามารถหามันได้

3
STFT และ DWT (เวฟเล็ต)
STFT สามารถใช้กับข้อมูลเสียงได้สำเร็จ (พร้อมด้วยไฟล์. wav soundfile) เพื่อทำการปรับเปลี่ยนโดเมนความถี่บางอย่าง (ตัวอย่าง: กำจัดเสียงรบกวน) ด้วยN=441000(เช่น 10 วินาทีในอัตราการสุ่มตัวอย่างfs=44100) windowsize=4096, overlap=4, STFT ผลิต approximatively 430x4096อาร์เรย์ (ตอนแรกประสานงาน: กรอบเวลาสองประสานงานความถี่ bin) การแก้ไขสามารถทำได้ในอาเรย์นี้และการสร้างใหม่สามารถทำได้ด้วยoverlap-add (*) มันเป็นวิธีการที่เป็นไปได้ที่จะทำสิ่งที่คล้ายกันกับแสง ? (DWT) คือรับรูปร่างที่คล้ายกันa x bโดยมีaกรอบเวลาและbถังขยะความถี่ทำการปรับเปลี่ยนบางอย่างในอาเรย์นี้และในตอนท้ายการกู้คืนสัญญาณหรือไม่ ได้อย่างไร เวฟเล็ตเทียบเท่ากับการทับซ้อนกันคืออะไร ฟังก์ชั่น Python เกี่ยวข้องกับอะไร (ฉันไม่พบตัวอย่างง่ายๆของการดัดแปลงเสียงด้วยpyWavelets... )? (*): นี่คือกรอบ STFT ที่สามารถใช้ได้: signal = stft.Stft(x, 4096, 4) # x is the input modified_signal …
12 fft  wavelet  dft  python  stft 


2
เมื่อใดฉันจึงควรคำนวณ PSD แทนสเปกตรัมขนาด FFT ธรรมดา
ฉันมีสัญญาณเสียงพูดสามสิบวินาทีที่เก็บตัวอย่างที่ 44.1 kHz ตอนนี้ฉันต้องการที่จะแสดงให้เห็นว่าคำพูดที่มีความถี่ อย่างไรก็ตามฉันไม่แน่ใจว่าสิ่งใดจะเป็นวิธีที่ดีที่สุดในการทำเช่นนั้น ดูเหมือนว่าบางครั้งเราคำนวณค่าสัมบูรณ์ของการแปลงฟูริเยร์และบางครั้งความหนาแน่นของสเปกตรัมกำลัง หากฉันเข้าใจอย่างถูกต้องหลังจะทำงานเพื่อที่ฉันจะแบ่งสัญญาณของฉันออกเป็นส่วน ๆ ทำ FFT ทีละส่วนแล้วหาผลรวมเหล่านี้ ฟังก์ชั่นหน้าต่างมีส่วนเกี่ยวข้องอย่างใด คุณช่วยอธิบายให้ฉันฟังหน่อยได้ไหม? ฉันใหม่กับ DSP

3
ฉันจะเริ่มต้นกับ Wavelets ได้อย่างไร
โครงการปัจจุบันของเราต้องการให้เราทำการวิเคราะห์โดยใช้การแปลงเวฟเล็ต ใครช่วยแนะนำหนังสือที่ใช้งานได้ดีให้ฉันด้วยตัวอย่างจาก MATLAB หรือ C ขณะนี้ฉันกำลังอ่านบทช่วยสอนบางอย่างแต่มันไม่ได้ทำให้ฉันรู้สึกเหมือนมีการแปลงฟูริเยร์ ฉันต้องการหนังสือที่มีตัวอย่างการปฏิบัติมากมายพร้อมซอร์สโค้ด ขอบคุณสำหรับคำแนะนำของคุณ

7
รับค่าสูงสุดของสัญญาณหากความถี่อยู่ระหว่างสอง bin center
โปรดสมมติว่าต่อไปนี้: ความถี่พื้นฐานของสัญญาณได้รับการประมาณโดยใช้ FFT และวิธีการประมาณความถี่บางอย่างและอยู่ระหว่างศูนย์ bin สองแห่ง ความถี่ในการสุ่มตัวอย่างได้รับการแก้ไข ความพยายามในการคำนวณไม่ใช่ปัญหา เมื่อทราบความถี่แล้ววิธีใดที่แม่นยำที่สุดในการประเมินค่าสูงสุดของสัญญาณขั้นพื้นฐาน วิธีหนึ่งอาจเป็นสัญญาณแผ่นเวลาเป็นศูนย์เพื่อเพิ่มความละเอียด FFT เช่นที่ศูนย์ช่องเก็บจะอยู่ใกล้กับความถี่โดยประมาณ ในสถานการณ์นี้จุดหนึ่งที่ฉันไม่แน่ใจเกี่ยวกับคือถ้าฉันสามารถเป็นศูนย์ได้มากเท่าที่ฉันต้องการหรือหากมีข้อบกพร่องบางอย่างในการทำเช่นนั้น อีกอันหนึ่งคือศูนย์ bin ที่ฉันควรเลือกหลังจากการเติมศูนย์เป็นศูนย์ที่ฉันได้รับค่าสูงสุดจาก (เพราะอาจไม่มีความถี่ของดอกเบี้ยที่น่าสนใจแม้แต่หลังจากการเติมเต็มศูนย์) อย่างไรก็ตามฉันยังสงสัยว่ามีวิธีอื่นที่อาจให้ผลลัพธ์ที่ดีกว่าได้หรือไม่ผู้ประเมินที่ใช้ค่าสูงสุดของศูนย์ bin สองแห่งรอบข้างเพื่อประเมินมูลค่าสูงสุดตามความถี่ที่น่าสนใจ

2
ฉันจะตรวจสอบได้อย่างไรว่าสัญญาณไม่ต่อเนื่องเป็นระยะ ๆ
ฉันต้องการทราบวิธีที่ฉันสามารถตรวจสอบว่าชุดของข้อมูลเป็นระยะหรือไม่ ฉันต้องการใช้การแปลงฟูริเยร์ / ซีรีส์ ข้อมูลของฉันมีลักษณะเป็นช่วง ๆ [111100001111000110010101010000101] หรือเป็นระยะ [11001100110011001100] และฉันต้องตัดสินใจว่ามันคืออะไรโดยอัตโนมัติ ฉันสามารถทำการวิเคราะห์หรือคำนวณประเภทใดเพื่อตรวจสอบว่าสัญญาณเป็นระยะหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.