คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

5
การตรวจจับ "แม่น้ำ" ในข้อความ
ในการแลกเปลี่ยนเท็กซ์ TeX เราได้พูดคุยกันถึงวิธีการตรวจจับ "แม่น้ำ" ในย่อหน้าในคำถามนี้ ในบริบทนี้แม่น้ำเป็นแถบพื้นที่สีขาวซึ่งเป็นผลมาจากการจัดแนวระหว่างคำในช่องว่างโดยไม่ตั้งใจ ตั้งแต่นี้จะค่อนข้างกวนใจกับผู้อ่านแม่น้ำที่ไม่ดีจะถือเป็นอาการของการพิมพ์ที่ไม่ดี ตัวอย่างของข้อความที่มีแม่น้ำคือแม่น้ำสายนี้ที่มีแม่น้ำสองสายไหลตามแนวทแยงมุม มีความสนใจในการตรวจจับแม่น้ำเหล่านี้โดยอัตโนมัติเพื่อให้สามารถหลีกเลี่ยงได้ (อาจเกิดจากการแก้ไขข้อความด้วยตนเอง) Raphink กำลังก้าวหน้าในระดับ TeX (ซึ่งรู้ตำแหน่งของ glyph และกล่อง bounding เท่านั้น) แต่ฉันรู้สึกมั่นใจว่าวิธีที่ดีที่สุดในการตรวจจับแม่น้ำคือการประมวลผลภาพบางส่วน (เนื่องจากรูปร่าง glyph มีความสำคัญมากและไม่สามารถใช้ได้กับ TeX) . ฉันได้ลองหลายวิธีในการดึงแม่น้ำออกจากภาพด้านบน แต่ความคิดง่ายๆของฉันในการใช้การเบลอของรูปวงรีในปริมาณเล็กน้อยดูเหมือนจะไม่ดีพอ ฉันยังลองเรดอนด้วยการกรองแบบ Hough ที่มีการแปลง แต่ฉันก็ไม่ได้อยู่กับสิ่งเหล่านั้น แม่น้ำนั้นมองเห็นได้ในวงจรตรวจจับคุณสมบัติของดวงตามนุษย์ / เรตินา / สมองและอย่างใดฉันก็คิดว่ามันน่าจะแปลได้ว่าเป็นการดำเนินการกรองบางอย่าง แต่ฉันไม่สามารถทำงานได้ ความคิดใด ๆ โดยเฉพาะฉันกำลังมองหาการดำเนินการบางอย่างที่จะตรวจจับแม่น้ำสองสายในภาพด้านบน แต่ไม่มีการตรวจจับเชิงบวกที่ผิดพลาดอื่น ๆ จำนวนมากเกินไป แก้ไข: endolith ถามว่าทำไมฉันกำลังทำตามวิธีการประมวลผลภาพเนื่องจากใน TeX เราสามารถเข้าถึงตำแหน่ง glyph, spacings และอื่น …

6
โดเมนความถี่แสดงถึงอะไรในกรณีของภาพ
ฉันเพิ่งเรียนรู้เกี่ยวกับโดเมนความถี่ในภาพ ฉันสามารถเข้าใจคลื่นความถี่ในกรณีของคลื่น มันหมายถึงความถี่ที่มีอยู่ในคลื่น ถ้าเราวาดคลื่นความถี่ของcos(2πft)cos⁡(2πft)\cos(2\pi f t)เราได้รับสัญญาณที่แรงกระตุ้น−f−f-fและ+f+f+f F และเราสามารถใช้ตัวกรองที่สอดคล้องกันเพื่อดึงข้อมูลเฉพาะ แต่คลื่นความถี่หมายถึงอะไรในกรณีของภาพ? เมื่อเราใช้ FFT ของภาพใน OpenCV เราจะได้ภาพแปลก ๆ ภาพนี้แสดงถึงอะไร? และแอปพลิเคชันของมันคืออะไร? ฉันอ่านหนังสือบางเล่ม แต่พวกเขาให้สมการทางคณิตศาสตร์มากมายแทนที่จะเป็นนัยยะทางกายภาพ ดังนั้นทุกคนสามารถให้คำอธิบายง่ายๆเกี่ยวกับโดเมนความถี่ในภาพด้วยแอปพลิเคชันอย่างง่ายในการประมวลผลภาพได้หรือไม่?

4
อะไรคือทางเลือกฟรีของ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้?
เท่าที่ฉันเข้าใจทั้ง SURF และ SIFT นั้นได้รับการคุ้มครองสิทธิบัตร มีวิธีการอื่นใดที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้อย่างอิสระหรือไม่? สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตรวจสอบสิทธิบัตร: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html

9
เหตุใดเราจึงใช้พื้นที่สี HSV บ่อยครั้งในการมองเห็นและการประมวลผลภาพ
ฉันเห็นพื้นที่สี HSV ใช้ทั่วสถานที่: สำหรับการติดตามการตรวจจับของมนุษย์ ฯลฯ ... ฉันสงสัยว่าทำไม มันเกี่ยวกับพื้นที่สีนี้ที่ทำให้ดีกว่าการใช้ RGB?

8
บล็อกการประมวลสัญญาณและภาพที่ดีมีค่าอะไรบ้างที่ควรติดตาม
มีเว็บไซต์หรือบล็อกที่ดีที่ฉันสามารถอัพเดทตัวเองในข่าวล่าสุดและบทความเกี่ยวกับการวิจัยการประมวลผลภาพและสัญญาณหรือฉันควรตรวจสอบผู้ให้บริการ "คลาสสิค" เช่นธุรกรรม IEEE, Elsevier และอื่น ๆ ?

10
การเรียนรู้อย่างลึกซึ้งนั้นเป็นการฆ่าการประมวลผลภาพ / การมองเห็นคอมพิวเตอร์หรือไม่?
ฉันรอคอยที่จะลงทะเบียนในปริญญาโทในการประมวลผลสัญญาณและภาพหรือบางทีคอมพิวเตอร์วิสัยทัศน์ (ฉันยังไม่ได้ตัดสินใจ) และคำถามนี้เกิดขึ้น ความกังวลของฉันคือเนื่องจากการเรียนรู้ลึกไม่ต้องการการแยกคุณลักษณะและแทบจะไม่มีการประมวลผลล่วงหน้าอินพุตมันฆ่าการประมวลผลภาพ (หรือการประมวลผลสัญญาณโดยทั่วไป) หรือไม่? ฉันไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้อย่างลึกซึ้ง แต่ดูเหมือนว่าจะทำงานได้ดีมากในการจดจำและจัดประเภทงานถ่ายภาพโดยตรงแทนที่จะเป็นเวกเตอร์คุณลักษณะเช่นเทคนิคอื่น ๆ มีกรณีใดบ้างที่วิธีการแยกคุณสมบัติแบบดั้งเดิม + การจำแนกประเภทจะดีกว่าใช้เทคนิคการประมวลผลภาพหรือสิ่งนี้กำลังจะตายเพราะการเรียนรู้อย่างลึกซึ้ง?

4
Analogous Library to OpenCV สำหรับการประมวลผล / วิเคราะห์เสียง
ฉันเข้าใจ OpenCV เป็นห้องสมุด de พฤตินัยสำหรับการเขียนโปรแกรมการประมวลผลภาพใน C / C ++; ฉันสงสัยว่ามีไลบรารี C หรือ C ++ เช่นนั้นสำหรับการประมวลผลเสียงหรือไม่ โดยทั่วไปฉันต้องการกรองคลื่นที่ไม่ต้องการจากไมโครโฟนและวิเคราะห์ด้วยอัลกอริทึมการเรียนรู้ของเครื่อง แต่ในที่สุดฉันก็อาจต้องการ: การจับเสียงหลายแพลตฟอร์มและการเล่นเสียง DSP - ฟิลเตอร์เสียง ตรวจจับเสียง การวิเคราะห์คุณสมบัติของวรรณยุกต์ การสังเคราะห์เสียง การรับรู้ที่ได้รับการรับรู้คลังและรูปแบบบางอย่าง การสังเคราะห์เสียงพูด / ดนตรี คำแนะนำใด ๆ ที่จะได้รับการชื่นชม.

6
วิธีที่ดีที่สุดในการแบ่งกลุ่มเส้นเลือดในใบไม้?
ฉันได้ทำการวิจัยจำนวนมากและค้นพบวิธีการเช่นการปรับเปลี่ยนตามธรรมชาติ, การทำสันปันน้ำเป็นต้นซึ่งสามารถใช้ในการตรวจจับหลอดเลือดดำในใบ อย่างไรก็ตามการกำหนดเกณฑ์ไม่ดีเพราะมันมีเสียงรบกวนมาก ภาพทั้งหมดของฉันเป็นภาพสีเทาใคร ๆ ก็สามารถแนะนำวิธีการที่จะนำมาใช้ในขณะที่พิจารณาปัญหานี้ในความต้องการความช่วยเหลือเร่งด่วน แก้ไข: ภาพต้นฉบับของฉัน หลังจากการนวดแป้ง ตามคำแนะนำของคำตอบฉันได้ลองการตรวจจับขอบต่อไปนี้ แสนรู้ เสียงรบกวนมากเกินไปและสิ่งรบกวนที่ไม่พึงประสงค์ โชเบล โรเบิร์ต แก้ไข: พยายามอีกหนึ่งการดำเนินการฉันได้รับผลลัพธ์ต่อไปนี้ดีกว่าสิ่งที่ฉันพยายามด้วยแสนรู้และปรับตัวคุณรู้สึกอย่างไร

5
การจดจำรูปแบบจุด
การมีขนาดของชุดคะแนนที่แตกต่างกันสองมิติ (2D เพื่อความง่าย) จะกระจายไปภายในสี่เหลี่ยมขนาดต่างกันสองคำถามคือ: 1- วิธีการหาการเกิดขึ้นของเล็ก ๆ ผ่านใหญ่ได้อย่างไร 2- ความคิดใด ๆ เกี่ยวกับวิธีการจัดอันดับเหตุการณ์ที่แสดงในรูปต่อไปนี้? ต่อไปนี้เป็นการสาธิตคำถามอย่างง่ายและวิธีแก้ปัญหาที่ต้องการ: อัปเดต 1: รูปต่อไปนี้แสดงมุมมองที่สมจริงยิ่งขึ้นเกี่ยวกับปัญหาที่กำลังตรวจสอบ เกี่ยวกับความคิดเห็นคุณสมบัติต่อไปนี้ใช้: ตำแหน่งที่แน่นอนของจุดที่มีอยู่ ขนาดที่แน่นอนของจุดที่มีอยู่ ขนาดสามารถเป็นศูนย์ (~ 1) = เพียงจุดเดียว จุดทั้งหมดเป็นสีดำบนพื้นหลังสีขาว ไม่มีเอฟเฟกต์สีเทา / การลดรอยหยัก นี่คือการใช้งานวิธีการที่นำเสนอโดยendolithมีการเปลี่ยนแปลงเล็กน้อย (ฉันหมุนเป้าหมายแทนแหล่งที่มาเนื่องจากมีขนาดเล็กและหมุนเร็วขึ้น) ฉันยอมรับคำตอบของ endolith เพราะฉันคิดถึงเรื่องนั้นมาก่อน เกี่ยวกับ RANSAC ฉันไม่เคยมีประสบการณ์มาก่อน นอกจากนี้การใช้งานของ RANSAC ต้องการรหัสจำนวนมาก

3
Google ใช้อัลกอริทึมสำหรับไซต์ "ค้นหาภาพ" อย่างไร
อะไรคือสิ่งที่คุณคาดเดาได้ดีว่า Google Image Search ทำงานอย่างไร ฉันสามารถอัปโหลดภาพถ่ายและสามารถค้นหาภาพที่คล้ายกันได้ อัลกอริทึมใดที่ใช้ระบุรูปภาพที่คล้ายกัน

1
จะทำให้ภาพของฉลากบนขวดอาหารแบนได้อย่างไร?
ฉันต้องการถ่ายภาพฉลากบนขวดอาหารและสามารถเปลี่ยนมันได้ดังนั้นฉลากจะแบนโดยด้านขวาและซ้ายจะถูกปรับขนาดให้อยู่กับศูนย์กลางของภาพ โดยหลักการแล้วฉันต้องการใช้ความแตกต่างระหว่างฉลากและพื้นหลังเพื่อค้นหาขอบและใช้การแก้ไข มิฉะนั้นฉันสามารถขอให้ผู้ใช้ระบุมุมและด้านข้างของภาพได้ ฉันกำลังมองหาเทคนิคทั่วไปและอัลกอริทึมเพื่อถ่ายภาพที่เอียงเป็นทรงกลม (รูปทรงกระบอกในกรณีของฉัน) และสามารถทำให้ภาพเรียบ ขณะนี้ภาพของฉลากที่ล้อมรอบขวดหรือขวดจะมีคุณสมบัติและข้อความที่หดตัวเมื่อลดขนาดไปทางซ้ายหรือขวาของภาพ เส้นที่แสดงถึงขอบของฉลากจะขนานกันตรงกลางของภาพและจะเอียงไปทางกันทางด้านขวาและด้านซ้ายสุดของฉลาก หลังจากจัดการกับภาพแล้วฉันอยากจะเหลือสี่เหลี่ยมที่เกือบสมบูรณ์แบบซึ่งข้อความและฟีเจอร์ต่าง ๆ มีขนาดเท่ากันราวกับว่าฉันถ่ายภาพฉลากเมื่อไม่ได้อยู่ในขวดหรือขวด นอกจากนี้ฉันต้องการถ้าเทคนิคสามารถตรวจจับขอบของฉลากโดยอัตโนมัติเพื่อใช้การแก้ไขที่เหมาะสม ไม่เช่นนั้นฉันจะต้องขอให้ผู้ใช้ระบุขอบเขตของป้ายกำกับ ฉันได้ Googled แล้วและพบบทความเช่นนี้: เอกสารโค้งงอเรียบแต่ฉันกำลังมองหาบางสิ่งที่เรียบง่ายกว่าเล็กน้อย

6
คุณสมบัติใดที่ทำให้เวฟเล็ตบางตัว“ ดีขึ้น” กว่าแบบอื่นในการบีบอัดภาพ
ฉันพยายามสอนตัวเองเกี่ยวกับการบีบอัดภาพโดยใช้วิธีการแปลงเวฟเล็ต คำถามของฉันคืออะไรเกี่ยวกับเวฟเล็ตบางตัวที่ทำให้พวกมันเป็นที่นิยมเมื่อทำการบีบอัดภาพ? ง่ายต่อการคำนวณหรือไม่ พวกเขาผลิตภาพที่นุ่มนวลขึ้นหรือไม่? ฯลฯ ... ตัวอย่าง: JPEG 2000ใช้เวฟเล็ตCohen-Daubechies-Feauveau 9/7 ... ทำไมจึงเป็นเช่นนี้

3
อะไรคืออัลกอริธึมที่พบได้บ่อยที่สุดสำหรับการปรับเปลี่ยนสัญญาณ
มีการพูดคุยเกี่ยวกับการปรับเกณฑ์ตามเกณฑ์ได้ในคำถามสองสามข้อก่อนหน้านี้: Thresholding แบบปรับตัวสำหรับการแบ่งส่วนตับโดยใช้ Matlab อัลกอริทึมที่ดีที่สุดสำหรับการทำสำเนารูปภาพเอกสารในตัวอย่างนี้คืออะไร? แน่นอนว่ามีอัลกอริธึมมากมายสำหรับการปรับเปลี่ยนแบบ ฉันต้องการที่จะรู้ว่าคนที่คุณพบว่ามีประสิทธิภาพและมีประโยชน์มากที่สุด อัลกอริทึม Adaptive ใดที่คุณใช้มากที่สุดและแอปพลิเคชันใด คุณมาเลือกอัลกอริทึมนี้อย่างไร

7
การค้นหาช่องสี่เหลี่ยมในรูปภาพ
ฉันต้องการค้นหาสี่เหลี่ยมในรูปภาพโดยใช้ OpenCV (ไม่มีปัญหาใน MATLAB หรืออื่น ๆ โดยทั่วไปสิ่งที่ฉันคาดหวังคือความคิดบางอย่าง) พิจารณาภาพทดสอบด้านล่าง: ฉันต้องการค้นหาสี่เหลี่ยมสีเหล่านั้นในภาพด้านบนอย่างถูกต้อง (ไม่ใช่แถบยาวสีขาว) สิ่งที่ฉันได้ทำ: ฉันใช้วิธีการทั่วไป (ซึ่งมาพร้อมกับตัวอย่าง OpenCV) คือค้นหารูปทรงในระนาบสีทั้งหมดประมาณค่าและตรวจสอบจำนวนองค์ประกอบ = 4 มันทำงานเพื่อขยายบางส่วนที่ตรวจพบไม่กี่สี่เหลี่ยมโดยเฉพาะอย่างยิ่งที่มืด ขั้นตอนต่อไปที่ผมทำก็คือการทำนาย คือข้อตกลงนี้ได้รับการแก้ไข ดังนั้นหากได้รับบางอย่างฉันสามารถทำนายสิ่งที่เหลืออยู่ได้ มันยังทำงานเพื่อขยายเพิ่มเติม แต่ความแม่นยำนั้นแย่มาก แต่ฉันรู้สึกว่าการทำนายไม่ใช่วิธีที่ดีที่นี่และมันก็ไม่ได้ให้คำตอบที่ถูกต้องเสมอไปตามขั้นตอนแรก สิ่งที่ฉันต้องการ : 1) มีวิธีอื่นใดที่ดีกว่าในการตรวจสอบกำลังสองเหล่านี้อย่างแม่นยำมากขึ้น หรือหลายวิธี? จุดหนึ่งที่สำคัญก็คือว่าเวลาไม่ได้เป็นปัญหาที่นี่ อัลกอริทึมอาจช้ามันไม่สำคัญ แต่ความแม่นยำเป็นเกณฑ์สำคัญ บางครั้งภาพอาจเบลอมากขึ้น และหนึ่งในปัญหาสำคัญที่ฉันเผชิญคือสี่เหลี่ยมบางอันมีสีเกือบเหมือนกันกับพื้นหลัง (ตรวจสอบคอลัมน์ 3 คอลัมน์แรกและสี่เหลี่ยมที่สอง) กำลังมองหาแนวคิดขอบคุณล่วงหน้า อัปเดต: ด้านล่างเป็นผลลัพธ์ที่แม่นยำที่สุดที่ฉันได้รับ: แน่นอนภาพผลลัพธ์จะถูกปรับขนาดเล็กน้อย อัปเดต 2: ฉันได้รับคำตอบที่ดีกว่านี้ในคำตอบของฉันด้านล่าง: https://dsp.stackexchange.com/a/7526/818

2
ความแตกต่างระหว่าง Hough และ Radon เปลี่ยนไปอย่างไร
ฉันคุ้นเคยกับการแปลงเรดอนจากการเรียนรู้เกี่ยวกับการสแกน CT แต่ไม่ใช่การแปลง Hough Wikipedia พูดว่า บางครั้งเครื่องบิน (r, θ) บางครั้งเรียกว่า Hough space สำหรับชุดของเส้นตรงในสองมิติ การเป็นตัวแทนนี้ทำให้การแปลง Hough ในเชิงแนวคิดใกล้เคียงกับการแปลงเรดอนสองมิติ (พวกเขาสามารถมองเห็นวิธีต่าง ๆ ในการดูการเปลี่ยนแปลงแบบเดียวกัน [5]) ผลลัพธ์ของพวกเขาดูเหมือนกันสำหรับฉัน: Wolfram Alpha: Radon Wolfram Alpha: Hough ดังนั้นฉันไม่เข้าใจว่าความแตกต่างคืออะไร พวกเขาเป็นเพียงสิ่งเดียวกันที่เห็นในรูปแบบที่แตกต่างกัน? ประโยชน์ของมุมมองที่ต่างกันคืออะไร ทำไมพวกเขาถึงไม่รวมเข้ากับ "การแปลงร่างของ Hough-Radon"?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.