การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

1
กู้คืนส่วนโค้งจากการรวบรวมคะแนนที่มีเสียงดัง
พื้นหลัง: ฉันพยายามสร้างระบบที่ติดตามฟองอากาศจำนวนหนึ่งในวิดีโอ ฉันกำลังใช้การตรวจจับฟองในกรณีภาพเดียวโดยใช้การแปลงแบบ Hough เนื่องจากการบดเคี้ยวเบลอและปัจจัยอื่น ๆ การตรวจจับนี้จะไม่แม่นยำ 100% ฉันกำลังปรับขั้นตอนการตรวจจับสำหรับการเรียกคืนสูงอาจมีค่าใช้จ่ายของความแม่นยำ เมื่อดำเนินการเสร็จแล้วและนำไปใช้กับลำดับของเฟรมจากวิดีโอฉันจะมีจำนวนการตรวจจับที่สามารถกำหนดลักษณะเป็นจุดในพื้นที่ 4D - ตำแหน่ง x, ตำแหน่ง y, ตำแหน่งรัศมีและดัชนีเฟรม มีขั้นตอนที่สามารถกู้โค้งจากคลาวด์ 4D point นี้ได้หรือไม่?

3
วิธีการตอบสนองที่ซับซ้อนเฉลี่ย (และเหตุผล)?
ฉันกำลังพัฒนาซอฟต์แวร์ที่คำนวณการตอบสนองของระบบโดยการเปรียบเทียบ FFT ของสัญญาณอินพุตและเอาต์พุต สัญญาณอินพุทและสัญญาณเอาท์พุตนั้นแบ่งออกเป็น windows และสำหรับแต่ละหน้าต่างสัญญาณจะถูกลบและแบ่งโดยฟังก์ชันฮันน์ การตอบสนองของอุปกรณ์สำหรับหน้าต่างนั้นจะเป็นอัตราส่วนของ FFT ของข้อมูลที่ประมวลผล ฉันเชื่อว่าข้างต้นเป็นขั้นตอนมาตรฐานแม้ว่าฉันอาจจะอธิบายได้ไม่ดี ปัญหาของฉันมาในวิธีการรวมการตอบสนองจากหน้าต่างหลายบาน เท่าที่ฉันเห็นวิธีการที่ถูกต้องคือการหาค่าเฉลี่ยที่ซับซ้อนในทุกหน้าต่าง การตอบสนองของแอมพลิจูดและเฟสนั้นจะเป็นแอมพลิจูดและเฟสของค่าเฉลี่ยค่าเชิงซ้อนที่แต่ละความถี่: av_response = sum_windows(response) / n av_amplitude = sqrt(real(av_response)**2 + imag(av_response)**2) av_phase = atan2(imag(av_response), real(av_response)) ด้วยการวนซ้ำโดยอ้อมผ่านช่องเก็บความถี่ แต่ฉันถูกขอให้เปลี่ยนสิ่งนี้เพื่อคำนวณแอมพลิจูดและเฟสในแต่ละหน้าต่างก่อนจากนั้นจึงเฉลี่ยแอมพลิจูดและเฟสในหน้าต่างทั้งหมด: amplitude = sqrt(real(response)**2 + imag(response)**2) av_amplitude = sum_windows(amplitude) / n phase = atan2(imag(response), real(response)) av_phase = sum_windows(phase) / n ฉันได้แย้งว่าสิ่งนี้ไม่ถูกต้องเนื่องจากมุมเฉลี่ย "ผิด" …

2
การตรวจจับระดับพิทช์แบบเรียลไทม์
ฉันพยายามใช้เกมร้องเพลงที่จะวิเคราะห์อินพุตไมโครโฟนดิบและบอกผู้เล่นว่าเขาร้องเพลงดีแค่ไหน ที่ต้องทำในเวลาจริง ฉันได้เจอหัวข้อมากมายที่ถามคำถามเดียวกัน แต่ฉันก็ยังไม่ได้ทำเพราะอาจขาดประสบการณ์และความรู้พื้นฐานทางคณิตศาสตร์ ฉันใช้อัลกอริทึมตามบทความของ pitch shift ของเว็บไซต์ DSPDimension: http://www.dspdimension.com/admin/pitch-shifting-using-the-ft/ ฉันแยกความถี่และขนาดที่แท้จริงเหมือนกับที่อธิบายในบทความ แต่ฉันไม่รู้ว่าพบความถี่พื้นฐานด้วยสิ่งนี้ ฉันพยายามที่จะรับถังที่มีขนาดใหญ่ที่สุด แต่ให้ผลลัพธ์ที่ถูกต้องสำหรับสัญญาณพิทช์ที่สูงขึ้นมันไม่สำคัญว่าปัจจัยการสุ่มตัวอย่างใดที่ฉันใช้ฉันยังคงได้รับข้อมูลที่ไม่ดีสำหรับสัญญาณความถี่ต่ำ วิธีนี้ผิดหรือฉันอยู่ในเส้นทางที่ถูกต้อง แต่เพิ่งพลาดบางอย่าง ขอบคุณล่วงหน้า, แก้ไข: ฉันลืมที่จะพูดถึงว่าฉันเพียง แต่สนใจในระดับสนามดังนั้นมันก็โอเคถ้าพื้นฐานหายไป แต่ฉันมีเสียงที่ดังมากในตัวอย่าง EDIT2: ขอบคุณทุกคนฉันเพิ่งทำอัลกอริทึมรุ่นที่ใช้งานได้อย่างมีเสน่ห์ ปัญหาการประมาณระดับเสียงต่ำเกิดจากการทดสอบอินพุตของฉัน เมื่อฉันร้องโน้ตมันตรงกันอย่างถูกต้อง นอกจากนี้ฉันกำลังพิจารณาฮาร์มอนิกทั้งหมดตอนนี้ไม่ใช่แค่ยอดเขาสูงสุด

3
การกำหนดความถี่และระยะเวลาของคลื่น
ฉันกำลังรวบรวมข้อมูลอุณหภูมิจากตู้เย็น ข้อมูลดูเหมือนเป็นคลื่น ฉันต้องการกำหนดระยะเวลาและความถี่ของคลื่น (เพื่อให้ฉันสามารถวัดได้ว่าการดัดแปลงตู้เย็นมีผลกระทบใด ๆ ) ฉันใช้ R และฉันคิดว่าฉันต้องใช้ FFT กับข้อมูล แต่ฉันไม่แน่ใจว่าจะไปจากที่นั่น ฉันยังใหม่กับ R และการวิเคราะห์สัญญาณดังนั้นความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก! นี่คือคลื่นที่ฉันกำลังผลิต: นี่คือรหัส R ของฉัน: require(graphics) library(DBI) library(RSQLite) drv <- dbDriver("SQLite") conn <- dbConnect(drv, dbname = "s.sqlite3") query <- function(con, query) { rs <- dbSendQuery(con, query) data <- fetch(rs, n = -1) dbClearResult(rs) data …
11 frequency  wave 

3
การใช้ตัวแปรสุ่มแบบเกาส์โดยใช้ตัวแปรสุ่มแบบสุ่ม
ฉันกำลังพยายามเขียนฟังก์ชั่น C ++ ที่จะคืนค่าสุ่มแบบเกาส์ตามค่าเฉลี่ยและความแปรปรวน มีฟังก์ชั่นห้องสมุดrand()ซึ่งจะส่งกลับตัวเลขสุ่มระหว่างและ0 ไม่ได้มีค่าคงที่ แต่มันก็ guarantied ว่ามันจะมีอย่างน้อย2 15 - 1 PDF มันเหมือนกันRAND_MAXRAND_MAX215- 1215−12^{15}-1 ฉันใช้ทฤษฎีขีด จำกัด กลางเพื่อแปลงrand()ให้เป็นตัวแปรเกาส์เซียน สิ่งที่ฉันทำอย่างแน่นอนคือการโทรหาrand()เวลาที่ผู้ใช้ระบุจากนั้นเพิ่มค่าส่งคืนจากนั้นเลื่อนค่าเฉลี่ยเป็นค่าเฉลี่ยของผู้ใช้ที่ระบุ ในการวางแผนข้างต้นผมเรียกว่ากำเนิดของฉัน Gaussian สุ่มสำหรับครั้งและความถี่ที่พล็อตของค่าผลตอบแทน อย่างที่คุณเห็นความแปรปรวนของมันนั้นใหญ่มากเนื่องจากมันถูกสร้างขึ้นโดยผลรวมของค่าสุ่มอื่น ๆ มากมาย10710710^7 มันจะส่งกลับตัวแปร Gaussian ที่ประสบความสำเร็จด้วย Gaussian PDF และค่าเฉลี่ยที่ระบุ อย่างไรก็ตามปัญหาคือความแปรปรวน ฉันติดอยู่ที่จุดนี้เพราะฉันไม่รู้วิธีเปลี่ยนความแปรปรวนเป็นค่าที่ผู้ใช้ระบุ นี่คือรหัสของฉัน (ไม่สมบูรณ์ในตอนนี้ระบบจะละเว้นพารามิเตอร์ "Variance"): template <class T> T Random::GetGaussian(T Mean /*= 0*/, T Variance /*= 1*/) { T …
11 random 

2
การแปลงค่า pitch bend (MIDI) เป็นค่า pitch“ ปกติ”
ฉันพยายามวิเคราะห์ออฟไลน์ LPC และการสังเคราะห์โดยใช้ rt_lpc (เวลาจริง LPC) การดำเนินการตามที่กำหนดที่นี่ มีฟังก์ชั่นบางอย่างภายในโปรแกรมที่สามารถใช้สำหรับการวิเคราะห์ LPC ออฟไลน์และโปรแกรมสังเคราะห์ รหัส rt_lpc นั้นส่วนใหญ่มีไว้สำหรับผู้แต่งเป็นต้นซึ่งหมายความว่ามันใช้ MIDI หรืออินพุตสัญญาณสายเสียง มีบางรหัสในโปรแกรมที่แปลงค่าระยะห่าง (ที่ได้จากการสัมพันธ์อัตโนมัติ) เป็นbendค่า ความสัมพันธ์มีดังนี้: pitch = (int)( Stk::sampleRate() / midi2pitch[ananya.data[1]] ) / pow( 1.0653f, bend/64.0f*11.0f ); power *= ananya.data[2] / 64.0f; bend = ge.data[1] / 128.0f + ge.data[2] - 64; บางจุด: เป็นวัตถุประเภทที่ดูเหมือนว่าจะมีประชากรได้ทันที ข ยังเป็นวัตถุประเภทที่ดูเหมือนว่าจะมีประชากรได้ทันที ค. …
11 music  pitch 

1
วิธีการประมวลผลภาพสำหรับการเลือกแหลมคม
ฉันมีอินพุตเป็นภาพไบนารี 3Dและผลลัพธ์ที่ต้องการด้านล่าง: การป้อนข้อมูล: ผลลัพธ์ที่ต้องการ: ฉันควรมองหาวิธีการประมวลผลภาพแบบใดหากฉันมีเพียงวัตถุแหลมคมเหลืออยู่เช่นเดียวกับผลลัพธ์ที่ต้องการด้านบน

2
ตัวชี้วัดที่ดีสำหรับการเปรียบเทียบแพทช์ภาพในเชิงคุณภาพ
ฉันพยายามที่จะ "จับคู่" แพทช์สี่เหลี่ยมเล็ก ๆ ในภาพ เมื่อดูอย่างรวดเร็วครั้งแรกดูเหมือนว่ามีเหตุผลที่จะทำการเปรียบเทียบรูปแบบระยะทางแบบยุคลิดของสองอาร์เรย์เพื่อรับค่า "ความคล้ายคลึงกัน" วิธีนี้ใช้งานได้ดีในหลายกรณี (ตัวแก้ไข "ที่ดีที่สุด" (ค่าต่ำสุด) ตามตัวชี้วัดนี้จะมีลักษณะคล้ายกับตัวแก้ไขแบบสอบถาม) อย่างไรก็ตามมีหลายกรณีที่ทำให้เกิดการแข่งขันที่แย่มาก ตัวอย่างเช่นใช้แพทช์คู่เหล่านี้: กำแพงอิฐสองแผ่นคะแนน 134 (นี่คือผลรวมของส่วนประกอบของความแตกต่างของพิกเซลแบบสัมบูรณ์เฉลี่ย): หนึ่งชิ้นของกำแพงอิฐ, หนึ่งหญ้าเต็มไปด้วยคะแนน 123! สำหรับมนุษย์ "ชัดเจน" หญ้าไม่ตรงกับอิฐ แต่ตัวชี้วัดนี้พูดเป็นอย่างอื่น ปัญหาอยู่ในรูปแบบสถิติท้องถิ่น ถ้าฉันใช้บางอย่างเช่นการเปรียบเทียบฮิสโตแกรมฉันจะสูญเสียข้อมูลเชิงพื้นที่ทั้งหมด - เช่นถ้าแพทช์เป็นหญ้าที่ด้านบนและอิฐที่ด้านล่างมันจะจับคู่กับแพทช์ที่มีหญ้าอยู่ด้านล่างและอิฐที่ด้านบน การแข่งขันอื่น "ผิดปกติอย่างเห็นได้ชัด") มีตัวชี้วัดที่ผสมผสานแนวคิดทั้งสองนี้เข้ากับค่าที่สมเหตุสมผลซึ่งจะประเมินว่า "คล้ายกัน" สำหรับคู่ที่ 1 ข้างต้น แต่ไม่เหมือนกันสำหรับตัวอย่างของแพทช์และกระจกแนวตั้งของฉันหรือไม่ ข้อเสนอแนะใด ๆ ที่ได้รับการชื่นชม!

4
การจดจำรูปภาพ
กำลังมองหาระบบโอเพนซอร์ซที่อนุญาตให้ใช้ในเชิงพาณิชย์เพื่อทำการจดจำรูปภาพในคอลเล็กชั่นภาพขนาดใหญ่และเติบโตแบบออร์แกนิกของภาพสองมิติ ปรับขนาดของภาพ มุมที่ใช้ในการถ่ายภาพ การซิงค์สีออฟเซ็ตหมายความว่าเนื่องจากความผิดปกติในการจับภาพและการแสดงผลสีของภาพต้นฉบับนั้นแตกต่างกันไปในแต่ละอินสแตนซ์ การครอบตัดภาพ การเพิ่มลายน้ำหรือข้อความ รูปแบบการโฟกัสที่เป็นไปได้ซึ่งหมายความว่าการจับภาพไม่ได้อยู่ในโฟกัสไม่ใช่ว่ามีการใช้ตัวกรองการปรับแต่งภาพ ฉันโอเคกับการต้องฝึกอบรมแอปพลิเคชันตราบใดที่ผลตอบแทนจากการทำเช่นนั้นจะลดลง - กล่าวว่าในระยะยาวฉันคาดว่าจำนวนอินสแตนซ์ 2-D จะเติบโตมากกว่าสองสามพันครั้งแรกถึงร้อย จากหลายพัน แต่นั่นเป็นระยะยาวและฉันมีความสุขที่จะมีวิธีแก้ปัญหาที่ใช้งานได้ดีกับชุดฝึกอบรม 1,000 ตัวอย่างและ 10 ตัวอย่างต่อตัวอย่าง UPDATE:สิทธิ์ใช้งานจะต้องสามารถใช้สำหรับการแจกจ่ายภายในเชิงพาณิชย์โดยไม่ต้องปล่อยซอร์สโค้ดแม้แต่ภายในสำหรับผู้ที่มีไบนารี รหัสจะไม่ถูกขายเพียงใช้ภายใน แต่ไม่ใช่ผู้ใช้ทุกคนจะสามารถเข้าถึงซอร์สโค้ดได้เพียงแค่ส่วนต่อประสาน

3
วิธีการสร้างฟิลเตอร์ชดเชยการบิดเบือน
ฉันกำลังสร้างแชนเนลไลเซอร์ที่ประกอบด้วยตัวปรับแต่งเสียงที่ซับซ้อนตัวถอดรหัสCICและตัวกรองการชดเชย / การทำลายล้าง FIR ตัวกรอง FIR สุดท้ายอาจนำไปใช้เป็นตัวกรองมากกว่าหนึ่งตัว คำถามของฉันคือฉันจะออกแบบตัวกรองอย่างไรเพื่อชดเชยการตอบสนองความถี่ที่ไม่แบนของตัวกรอง CIC คุณสร้างการตอบสนองความถี่ที่คุณต้องการโดยการคำนวณส่วนกลับของการตอบสนองของ CIC แล้วเรียกใช้ผ่าน FFT ผกผันเพื่อรับการตอบสนองต่อแรงกระตุ้น อย่างที่คุณเห็นแม้ว่าปัญหาเฉพาะของฉันเกี่ยวข้องกับตัวกรอง CIC คำถามของฉันคือเกี่ยวกับวิธีที่คุณสร้างตัวกรองการชดเชยความผิดเพี้ยนใด ๆ ขอบคุณที่สละเวลา.

2
สถานะปัจจุบันของศิลปะในการแก้ไขสัญญาณเสียง
คำถามสามข้อ: เมตริกทั้งหมดสามารถใช้เพื่อวัดคุณภาพการแก้ไขด้วยเสียงได้อย่างเป็นกลางหรือไม่ (แต่ในแง่ของจิตวิเคราะห์หากเป็นไปได้) จากการวัดเหล่านั้นสถานะปัจจุบันของศิลปะในการแก้ไขเสียงคืออะไร สมมติว่าฉันต้องเรนเดอร์สองไฟล์จากลำดับของบันทึกย่อจากเครื่องมือเสมือนในความละเอียดสองค่าจากนั้นเปรียบเทียบการอัปแซมปลิงของไฟล์หนึ่งไฟล์กับเวอร์ชันที่เรนเดอร์ความถี่สูงซอฟต์แวร์ใดที่สามารถใช้เปรียบเทียบ - เป็นการดีที่ใช้เมตริกที่กล่าวถึงก่อนหน้านี้ จนถึงตอนนี้จากที่ฉันได้รวบรวมผู้ทดลองใช้เหล่านี้มีคุณภาพที่ดีที่สุด http://www.mega-nerd.com/SRC/ http://sox.sourceforge.net/SoX/ http://www.izotope.com/tech/src/ หนึ่งในปัญหาที่ resamplers เหล่านี้ดูเหมือนจะมีก่อนและหลังการเรียกเข้า ฉันควรทราบว่าสิ่งที่น่าสนใจที่สำคัญคือการสร้างสัญญาณใหม่ (ตราบเท่าที่คำนั้นสมเหตุสมผล) ดังนั้นการสุ่มสัญญาณมากกว่าการสุ่มตัวอย่าง แก้ไข: ประสิทธิภาพเวลาการแก้ไขไม่เกี่ยวข้องในบริบทนี้ ขอแสดงความนับถือ :-)
11 audio  sampling 

2
อะไรคือความแตกต่างระหว่าง 'de-noising' และสิ่งที่เรารู้กันทั่วไปว่าเป็นวิธีการกรองเพื่อกำจัดเสียงรบกวน?
คำถามง่ายๆสวย - ฉันพยายามคิดออกว่าอะไรแตกต่างกันระหว่าง 'de-noising' สัญญาณและเพียงแค่กรอง (ตามที่เรารู้ทั่วไป) เพื่อลบเสียง เป็นกรณีของการทับซ้อนคำศัพท์หรือมีบางสิ่งที่แตกต่างกันโดยพื้นฐานหรือไม่? ทำไมถึงเรียกว่า 'ลบเสียงรบกวน' แก้ไข: บางทีที่สำคัญมากเมื่อเราพูดถึงการกรองสัญญาณเพื่อเพิ่ม SNR ของมันให้มากที่สุดเรามักจะหมายถึง AWGN ในบริบทของภาษาพูด ดังนั้น 'เสียง' ที่ถูกอ้างถึงในการลดเสียงรบกวนยัง AWGN และถ้าเป็นเช่นนั้นการขจัดเสียงรบกวนก็เป็นวิธีที่แตกต่างกันในการลบออกหรือเป็นเสียงประเภทอื่น (ไม่ใช่แบบเกาส์สีและอื่น ๆ ) เริ่มด้วย?
11 noise 

4
การเขียนโปรแกรม Vocoder
ฉันต้องการตั้งโปรแกรมตัวสังเคราะห์เสียงของฉันเองเช่น"Songify"แต่ฉันไม่สามารถหาอัลกอริธึมของตัวแปลได้อย่างง่าย บางทีคุณสามารถอธิบายหรือบอกตำแหน่งที่จะหาข้อมูลเกี่ยวกับวิธีการทำงานของ Vocoder

3
วิธีการลบพื้นหลังบางอย่างจากภาพ?
นี่เป็นภาพที่ได้จากการกรองกาบอร์ ... มีวิธีลบเส้นข้างในภาพบ้างยกเว้นความคลาดเคลื่อนสีขาวนวล ลองการวางแนวของตัวกรอง gabor อื่นแล้วให้ทำตามผลลัพธ์ต่อไปนี้: หลังจากการนวดแป้ง: พอใช้ได้ แต่ไม่ดี หลังจากมัธยฐานกรอง: ขอบคุณล่วงหน้า

2
วิธี demodulate สัญญาณ OFDM
ฉันกำลังดูการถอดรหัสสัญญาณ OFDM ซึ่งประกอบด้วยผู้ให้บริการ 6 ราย (หรือโทนเสียง) ซึ่งเป็น BPSK ที่ปรับและโทนเสียงนำซึ่งช่วยปรับจูน นี่เป็นครั้งแรกที่ฉันได้ทำงานกับ OFDM ดังนั้นฉันจำเป็นต้องรู้ว่าฉันกำลังเข้าใกล้สิ่งนี้อย่างถูกต้องหรือไม่ วิธีคิดของฉันในการถอดรหัสคือใช้น้ำเสียงนักบินเพื่อปรับเทียบ (เนื่องจากผู้รับอาจจะผิดพลาดเล็กน้อย) จากนั้นมีฟิลเตอร์พาสแบนด์หกแถบเพื่อแยกแต่ละพาหะซึ่งเป็น demodulated ตามปกติ มีใครเห็นปัญหานี้บ้างไหม? หรือคุณสามารถแนะนำวิธีที่ดีกว่าในการทำสิ่งนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.