การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

5
การตรวจจับ "แม่น้ำ" ในข้อความ
ในการแลกเปลี่ยนเท็กซ์ TeX เราได้พูดคุยกันถึงวิธีการตรวจจับ "แม่น้ำ" ในย่อหน้าในคำถามนี้ ในบริบทนี้แม่น้ำเป็นแถบพื้นที่สีขาวซึ่งเป็นผลมาจากการจัดแนวระหว่างคำในช่องว่างโดยไม่ตั้งใจ ตั้งแต่นี้จะค่อนข้างกวนใจกับผู้อ่านแม่น้ำที่ไม่ดีจะถือเป็นอาการของการพิมพ์ที่ไม่ดี ตัวอย่างของข้อความที่มีแม่น้ำคือแม่น้ำสายนี้ที่มีแม่น้ำสองสายไหลตามแนวทแยงมุม มีความสนใจในการตรวจจับแม่น้ำเหล่านี้โดยอัตโนมัติเพื่อให้สามารถหลีกเลี่ยงได้ (อาจเกิดจากการแก้ไขข้อความด้วยตนเอง) Raphink กำลังก้าวหน้าในระดับ TeX (ซึ่งรู้ตำแหน่งของ glyph และกล่อง bounding เท่านั้น) แต่ฉันรู้สึกมั่นใจว่าวิธีที่ดีที่สุดในการตรวจจับแม่น้ำคือการประมวลผลภาพบางส่วน (เนื่องจากรูปร่าง glyph มีความสำคัญมากและไม่สามารถใช้ได้กับ TeX) . ฉันได้ลองหลายวิธีในการดึงแม่น้ำออกจากภาพด้านบน แต่ความคิดง่ายๆของฉันในการใช้การเบลอของรูปวงรีในปริมาณเล็กน้อยดูเหมือนจะไม่ดีพอ ฉันยังลองเรดอนด้วยการกรองแบบ Hough ที่มีการแปลง แต่ฉันก็ไม่ได้อยู่กับสิ่งเหล่านั้น แม่น้ำนั้นมองเห็นได้ในวงจรตรวจจับคุณสมบัติของดวงตามนุษย์ / เรตินา / สมองและอย่างใดฉันก็คิดว่ามันน่าจะแปลได้ว่าเป็นการดำเนินการกรองบางอย่าง แต่ฉันไม่สามารถทำงานได้ ความคิดใด ๆ โดยเฉพาะฉันกำลังมองหาการดำเนินการบางอย่างที่จะตรวจจับแม่น้ำสองสายในภาพด้านบน แต่ไม่มีการตรวจจับเชิงบวกที่ผิดพลาดอื่น ๆ จำนวนมากเกินไป แก้ไข: endolith ถามว่าทำไมฉันกำลังทำตามวิธีการประมวลผลภาพเนื่องจากใน TeX เราสามารถเข้าถึงตำแหน่ง glyph, spacings และอื่น …

8
ทำไมการแปลงฟูริเยร์จึงสำคัญมาก?
ทุกคนพูดถึงการแปลงฟูริเยร์เมื่อพูดถึงการประมวลผลสัญญาณ ทำไมการประมวลผลสัญญาณจึงมีความสำคัญมากและมันบอกอะไรเราเกี่ยวกับสัญญาณ มันใช้ได้กับการประมวลผลสัญญาณดิจิตอลหรือใช้กับสัญญาณอะนาล็อกด้วยหรือไม่

6
โดเมนความถี่แสดงถึงอะไรในกรณีของภาพ
ฉันเพิ่งเรียนรู้เกี่ยวกับโดเมนความถี่ในภาพ ฉันสามารถเข้าใจคลื่นความถี่ในกรณีของคลื่น มันหมายถึงความถี่ที่มีอยู่ในคลื่น ถ้าเราวาดคลื่นความถี่ของcos(2πft)cos⁡(2πft)\cos(2\pi f t)เราได้รับสัญญาณที่แรงกระตุ้น−f−f-fและ+f+f+f F และเราสามารถใช้ตัวกรองที่สอดคล้องกันเพื่อดึงข้อมูลเฉพาะ แต่คลื่นความถี่หมายถึงอะไรในกรณีของภาพ? เมื่อเราใช้ FFT ของภาพใน OpenCV เราจะได้ภาพแปลก ๆ ภาพนี้แสดงถึงอะไร? และแอปพลิเคชันของมันคืออะไร? ฉันอ่านหนังสือบางเล่ม แต่พวกเขาให้สมการทางคณิตศาสตร์มากมายแทนที่จะเป็นนัยยะทางกายภาพ ดังนั้นทุกคนสามารถให้คำอธิบายง่ายๆเกี่ยวกับโดเมนความถี่ในภาพด้วยแอปพลิเคชันอย่างง่ายในการประมวลผลภาพได้หรือไม่?

9
ความสำคัญทางกายภาพของความถี่ลบคืออะไร?
นี่เป็นหนึ่งในหลุมในบล็อกชีสเชดดาร์ของฉันในการทำความเข้าใจ DSP ดังนั้นการตีความทางกายภาพของการมีความถี่เชิงลบคืออะไร หากคุณมีโทนเสียงจริงในบางความถี่และเป็น DFT คุณจะได้รับผลลัพธ์ทั้งความถี่บวกและลบ - ทำไมและอย่างไรสิ่งนี้เกิดขึ้นได้อย่างไร มันหมายความว่าอะไร? แก้ไข: 18 ตุลาคม 2011 ฉันได้ให้คำตอบของฉันเอง แต่ขยายคำถามเพื่อรวมรากของสาเหตุที่ความถี่เชิงลบต้องมีอยู่
83 frequency 

6
ทำไมฉันต้องเป็นศูนย์สัญญาณก่อนที่จะทำการแปลงฟูริเยร์?
ในคำตอบของคำถามก่อนหน้านี้มีการระบุว่าควร zero-pad สัญญาณอินพุต (เพิ่มศูนย์ไปยังจุดสิ้นสุดเพื่อให้คลื่นอย่างน้อยครึ่งหนึ่งเป็น "ช่องว่าง") เหตุผลนี้คืออะไร
77 fft  zero-padding 

4
อะไรคือความแตกต่างระหว่างการแปลงฟูริเยร์และการแปลงโคไซน์?
ในการรู้จำเสียงส่วนหน้าส่วนใหญ่ทำการประมวลผลสัญญาณเพื่อให้สามารถดึงคุณสมบัติออกจากสตรีมเสียง การแปลงฟูริเยร์แบบไม่ต่อเนื่อง (DFT) ถูกนำมาใช้สองครั้งในกระบวนการนี้ ครั้งแรกคือหลังจากการเปิดหน้าต่าง หลังจาก Mel Binning นี้ถูกนำไปใช้และจากนั้นก็แปลงฟูเรียร์อื่น ฉันได้สังเกตเห็นว่ามันเป็นเรื่องธรรมดาในตัวรู้จำเสียงพูด (ส่วนหน้าเริ่มต้นในCMU Sphinxเป็นต้น) เพื่อใช้การแปลงแบบโคไซน์แบบแยกส่วน (DCT) แทนที่จะเป็น DFT สำหรับการดำเนินการครั้งที่สอง ความแตกต่างระหว่างการดำเนินการทั้งสองนี้คืออะไร ทำไมคุณต้องทำ DFT ในครั้งแรกและจากนั้น DCT เป็นครั้งที่สอง
75 dct  dft 

3
เหตุใดจึงเป็นความคิดที่ดีในการกรองโดยการทำให้ถังขยะ FFT เป็นศูนย์?
มันง่ายมากในการกรองสัญญาณโดยการทำ FFT ที่มันลบช่องว่างบางส่วนแล้วทำการ IFFT ตัวอย่างเช่น t = linspace(0, 1, 256, endpoint=False) x = sin(2 * pi * 3 * t) + cos(2 * pi * 100 * t) X = fft(x) X[64:192] = 0 y = ifft(X) ส่วนประกอบความถี่สูงจะถูกลบออกอย่างสมบูรณ์โดยตัวกรอง FFT "brickwall" นี้ แต่ฉันได้ยินมาว่านี่ไม่ใช่วิธีการที่ดีที่จะใช้ เหตุใดจึงเป็นความคิดที่ไม่ดี มีสถานการณ์ที่เป็นตัวเลือกที่ดีหรือไม่? [ ตามที่แนะนำโดย pichenettes ]
72 fft  filters 

4
อะไรคือความหมายของ“ การตอบสนองต่อแรงกระตุ้น” และ“ การตอบสนองความถี่” ของระบบ
ทุกคนสามารถระบุความแตกต่างระหว่างการตอบสนองความถี่และการตอบสนองต่อแรงกระตุ้นในภาษาอังกฤษแบบง่ายได้หรือไม่?

4
อะไรคือทางเลือกฟรีของ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้?
เท่าที่ฉันเข้าใจทั้ง SURF และ SIFT นั้นได้รับการคุ้มครองสิทธิบัตร มีวิธีการอื่นใดที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้อย่างอิสระหรือไม่? สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตรวจสอบสิทธิบัตร: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html

9
เหตุใดเราจึงใช้พื้นที่สี HSV บ่อยครั้งในการมองเห็นและการประมวลผลภาพ
ฉันเห็นพื้นที่สี HSV ใช้ทั่วสถานที่: สำหรับการติดตามการตรวจจับของมนุษย์ ฯลฯ ... ฉันสงสัยว่าทำไม มันเกี่ยวกับพื้นที่สีนี้ที่ทำให้ดีกว่าการใช้ RGB?

6
หากมนุษย์สามารถได้ยินเสียงความถี่สูงถึง 20 kHz เท่านั้นทำไมเสียงเพลงจึงถูกสุ่มตัวอย่างที่ 44.1 kHz
ฉันอ่านในบางสถานที่ว่าเพลงส่วนใหญ่มีการสุ่มตัวอย่างที่ 44.1 kHz ในขณะที่เราได้ยินได้มากถึง 20 kHz เท่านั้น ทำไมล่ะ

4
เหตุใดเสียงคงที่ทีวีจึงเป็นสีดำและสีขาวเสมอ
โทรทัศน์แคโทดเรย์ Tube (CRT) ที่ทันสมัยที่สุดในปัจจุบันผลิตขึ้นหลังจากปี 1960 (หลังจากการนำมาตรฐาน NTSC และ PAL) มาใช้สนับสนุนการถอดรหัสสัญญาณสีแบบวงจร เป็นที่ทราบกันดีว่ามาตรฐานสีใหม่ถูกสร้างขึ้นเพื่อให้ทีวีชุดใหม่สามารถใช้งานร่วมกับการออกอากาศเก่าและขาวดำของวันได้ มาตรฐานสีใหม่เพิ่มข้อมูลสีในความถี่พาหะที่สูงขึ้น (แต่ในช่วงเวลาเดียวกันของความส่องสว่าง) ข้อมูลสีจะตรงหลังจากที่จุดเริ่มต้นของเส้นแนวนอนแต่ละและเป็นที่รู้จักในฐานะcolorburst ดูเหมือนว่าเมื่อคุณป้อนสัญญาณรบกวนลงในโทรทัศน์ทีวีไม่ควรสร้างเสียงสีดำและสีขาว แต่ยังมีสัญญาณรบกวนสีเนื่องจากจะมีข้อมูลสีในแต่ละเส้นแนวนอนใหม่ที่แต่ละเฟรมควรอยู่ แต่นี่ไม่ใช่กรณีที่ทีวีสีทั้งหมดยังคงส่งเสียงสีดำและสีขาว! เหตุใดจึงเป็นเช่นนี้ นี่คือตัวอย่างสัญญาณของการสแกนในแนวนอนครั้งเดียว และนี่คือภาพที่ได้หากการสแกนในแนวนอนทั้งหมดเหมือนกัน (คุณจะได้แท่ง)
58 noise  color  analog  video 

7
ฉันจะใช้การเชื่อมโยงข้ามกันเพื่อพิสูจน์ไฟล์เสียงสองไฟล์ที่เหมือนกันได้อย่างไร
ฉันต้องทำ cross correlation ของไฟล์เสียงสองไฟล์เพื่อพิสูจน์ว่ามันคล้ายกัน ฉันใช้ FFT ของไฟล์เสียงสองไฟล์และมีค่าสเปกตรัมพลังงานในอาร์เรย์แยกต่างหาก ฉันจะดำเนินการต่อเพื่อข้ามสหสัมพันธ์และพิสูจน์ว่าพวกเขาคล้ายกันได้อย่างไร มีวิธีที่ดีกว่าที่จะทำหรือไม่ แนวคิดพื้นฐานใด ๆ จะเป็นประโยชน์สำหรับฉันในการเรียนรู้และนำไปใช้

8
บล็อกการประมวลสัญญาณและภาพที่ดีมีค่าอะไรบ้างที่ควรติดตาม
มีเว็บไซต์หรือบล็อกที่ดีที่ฉันสามารถอัพเดทตัวเองในข่าวล่าสุดและบทความเกี่ยวกับการวิจัยการประมวลผลภาพและสัญญาณหรือฉันควรตรวจสอบผู้ให้บริการ "คลาสสิค" เช่นธุรกรรม IEEE, Elsevier และอื่น ๆ ?

2
ทำไมต้องคำนวณ PSD เป็นจำนวนมาก?
วิธีการของ Welch เป็นอัลกอริธึมไปสู่การคำนวณความหนาแน่นสเปกตรัมพลังงาน (PSD) ของไทม์สตัวอย่างที่สม่ำเสมอ ฉันสังเกตเห็นว่ามีวิธีการมากมายสำหรับการคำนวณ PSD ตัวอย่างเช่นใน Matlab ฉันเห็น: PSD ใช้เมธอด Burg PSD ใช้วิธีความแปรปรวนร่วม PSD ใช้ periodogram PSD ใช้วิธีการแปรปรวนร่วมที่แก้ไขแล้ว PSD โดยใช้วิธีการหลายจุด (MTM) PSD ใช้วิธีของ Welch PSD ใช้วิธี Yule-Walker AR Spectrogram โดยใช้การแปลงฟูริเยร์ในระยะเวลาอันสั้น การประมาณสเปกตรัม อะไรคือข้อดีของวิธีการต่างๆเหล่านี้? เป็นคำถามที่ปฏิบัติได้เมื่อใดฉันจะต้องการใช้วิธีอื่นนอกเหนือจากวิธีของ Welch

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.