คำถามติดแท็ก computer-vision

วิสัยทัศน์ของคอมพิวเตอร์รวมถึงวิธีการประมวลผลวิเคราะห์ภาพและข้อมูลมิติสูงเพื่อสร้างความเข้าใจในระดับสูงและการจดจำฉากหรือภาพ

4
อะไรคือทางเลือกฟรีของ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้?
เท่าที่ฉันเข้าใจทั้ง SURF และ SIFT นั้นได้รับการคุ้มครองสิทธิบัตร มีวิธีการอื่นใดที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้อย่างอิสระหรือไม่? สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตรวจสอบสิทธิบัตร: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html

9
เหตุใดเราจึงใช้พื้นที่สี HSV บ่อยครั้งในการมองเห็นและการประมวลผลภาพ
ฉันเห็นพื้นที่สี HSV ใช้ทั่วสถานที่: สำหรับการติดตามการตรวจจับของมนุษย์ ฯลฯ ... ฉันสงสัยว่าทำไม มันเกี่ยวกับพื้นที่สีนี้ที่ทำให้ดีกว่าการใช้ RGB?

10
การเรียนรู้อย่างลึกซึ้งนั้นเป็นการฆ่าการประมวลผลภาพ / การมองเห็นคอมพิวเตอร์หรือไม่?
ฉันรอคอยที่จะลงทะเบียนในปริญญาโทในการประมวลผลสัญญาณและภาพหรือบางทีคอมพิวเตอร์วิสัยทัศน์ (ฉันยังไม่ได้ตัดสินใจ) และคำถามนี้เกิดขึ้น ความกังวลของฉันคือเนื่องจากการเรียนรู้ลึกไม่ต้องการการแยกคุณลักษณะและแทบจะไม่มีการประมวลผลล่วงหน้าอินพุตมันฆ่าการประมวลผลภาพ (หรือการประมวลผลสัญญาณโดยทั่วไป) หรือไม่? ฉันไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้อย่างลึกซึ้ง แต่ดูเหมือนว่าจะทำงานได้ดีมากในการจดจำและจัดประเภทงานถ่ายภาพโดยตรงแทนที่จะเป็นเวกเตอร์คุณลักษณะเช่นเทคนิคอื่น ๆ มีกรณีใดบ้างที่วิธีการแยกคุณสมบัติแบบดั้งเดิม + การจำแนกประเภทจะดีกว่าใช้เทคนิคการประมวลผลภาพหรือสิ่งนี้กำลังจะตายเพราะการเรียนรู้อย่างลึกซึ้ง?

6
วิธีที่ดีที่สุดในการแบ่งกลุ่มเส้นเลือดในใบไม้?
ฉันได้ทำการวิจัยจำนวนมากและค้นพบวิธีการเช่นการปรับเปลี่ยนตามธรรมชาติ, การทำสันปันน้ำเป็นต้นซึ่งสามารถใช้ในการตรวจจับหลอดเลือดดำในใบ อย่างไรก็ตามการกำหนดเกณฑ์ไม่ดีเพราะมันมีเสียงรบกวนมาก ภาพทั้งหมดของฉันเป็นภาพสีเทาใคร ๆ ก็สามารถแนะนำวิธีการที่จะนำมาใช้ในขณะที่พิจารณาปัญหานี้ในความต้องการความช่วยเหลือเร่งด่วน แก้ไข: ภาพต้นฉบับของฉัน หลังจากการนวดแป้ง ตามคำแนะนำของคำตอบฉันได้ลองการตรวจจับขอบต่อไปนี้ แสนรู้ เสียงรบกวนมากเกินไปและสิ่งรบกวนที่ไม่พึงประสงค์ โชเบล โรเบิร์ต แก้ไข: พยายามอีกหนึ่งการดำเนินการฉันได้รับผลลัพธ์ต่อไปนี้ดีกว่าสิ่งที่ฉันพยายามด้วยแสนรู้และปรับตัวคุณรู้สึกอย่างไร

5
การจดจำรูปแบบจุด
การมีขนาดของชุดคะแนนที่แตกต่างกันสองมิติ (2D เพื่อความง่าย) จะกระจายไปภายในสี่เหลี่ยมขนาดต่างกันสองคำถามคือ: 1- วิธีการหาการเกิดขึ้นของเล็ก ๆ ผ่านใหญ่ได้อย่างไร 2- ความคิดใด ๆ เกี่ยวกับวิธีการจัดอันดับเหตุการณ์ที่แสดงในรูปต่อไปนี้? ต่อไปนี้เป็นการสาธิตคำถามอย่างง่ายและวิธีแก้ปัญหาที่ต้องการ: อัปเดต 1: รูปต่อไปนี้แสดงมุมมองที่สมจริงยิ่งขึ้นเกี่ยวกับปัญหาที่กำลังตรวจสอบ เกี่ยวกับความคิดเห็นคุณสมบัติต่อไปนี้ใช้: ตำแหน่งที่แน่นอนของจุดที่มีอยู่ ขนาดที่แน่นอนของจุดที่มีอยู่ ขนาดสามารถเป็นศูนย์ (~ 1) = เพียงจุดเดียว จุดทั้งหมดเป็นสีดำบนพื้นหลังสีขาว ไม่มีเอฟเฟกต์สีเทา / การลดรอยหยัก นี่คือการใช้งานวิธีการที่นำเสนอโดยendolithมีการเปลี่ยนแปลงเล็กน้อย (ฉันหมุนเป้าหมายแทนแหล่งที่มาเนื่องจากมีขนาดเล็กและหมุนเร็วขึ้น) ฉันยอมรับคำตอบของ endolith เพราะฉันคิดถึงเรื่องนั้นมาก่อน เกี่ยวกับ RANSAC ฉันไม่เคยมีประสบการณ์มาก่อน นอกจากนี้การใช้งานของ RANSAC ต้องการรหัสจำนวนมาก

3
Google ใช้อัลกอริทึมสำหรับไซต์ "ค้นหาภาพ" อย่างไร
อะไรคือสิ่งที่คุณคาดเดาได้ดีว่า Google Image Search ทำงานอย่างไร ฉันสามารถอัปโหลดภาพถ่ายและสามารถค้นหาภาพที่คล้ายกันได้ อัลกอริทึมใดที่ใช้ระบุรูปภาพที่คล้ายกัน

1
จะทำให้ภาพของฉลากบนขวดอาหารแบนได้อย่างไร?
ฉันต้องการถ่ายภาพฉลากบนขวดอาหารและสามารถเปลี่ยนมันได้ดังนั้นฉลากจะแบนโดยด้านขวาและซ้ายจะถูกปรับขนาดให้อยู่กับศูนย์กลางของภาพ โดยหลักการแล้วฉันต้องการใช้ความแตกต่างระหว่างฉลากและพื้นหลังเพื่อค้นหาขอบและใช้การแก้ไข มิฉะนั้นฉันสามารถขอให้ผู้ใช้ระบุมุมและด้านข้างของภาพได้ ฉันกำลังมองหาเทคนิคทั่วไปและอัลกอริทึมเพื่อถ่ายภาพที่เอียงเป็นทรงกลม (รูปทรงกระบอกในกรณีของฉัน) และสามารถทำให้ภาพเรียบ ขณะนี้ภาพของฉลากที่ล้อมรอบขวดหรือขวดจะมีคุณสมบัติและข้อความที่หดตัวเมื่อลดขนาดไปทางซ้ายหรือขวาของภาพ เส้นที่แสดงถึงขอบของฉลากจะขนานกันตรงกลางของภาพและจะเอียงไปทางกันทางด้านขวาและด้านซ้ายสุดของฉลาก หลังจากจัดการกับภาพแล้วฉันอยากจะเหลือสี่เหลี่ยมที่เกือบสมบูรณ์แบบซึ่งข้อความและฟีเจอร์ต่าง ๆ มีขนาดเท่ากันราวกับว่าฉันถ่ายภาพฉลากเมื่อไม่ได้อยู่ในขวดหรือขวด นอกจากนี้ฉันต้องการถ้าเทคนิคสามารถตรวจจับขอบของฉลากโดยอัตโนมัติเพื่อใช้การแก้ไขที่เหมาะสม ไม่เช่นนั้นฉันจะต้องขอให้ผู้ใช้ระบุขอบเขตของป้ายกำกับ ฉันได้ Googled แล้วและพบบทความเช่นนี้: เอกสารโค้งงอเรียบแต่ฉันกำลังมองหาบางสิ่งที่เรียบง่ายกว่าเล็กน้อย

7
การค้นหาช่องสี่เหลี่ยมในรูปภาพ
ฉันต้องการค้นหาสี่เหลี่ยมในรูปภาพโดยใช้ OpenCV (ไม่มีปัญหาใน MATLAB หรืออื่น ๆ โดยทั่วไปสิ่งที่ฉันคาดหวังคือความคิดบางอย่าง) พิจารณาภาพทดสอบด้านล่าง: ฉันต้องการค้นหาสี่เหลี่ยมสีเหล่านั้นในภาพด้านบนอย่างถูกต้อง (ไม่ใช่แถบยาวสีขาว) สิ่งที่ฉันได้ทำ: ฉันใช้วิธีการทั่วไป (ซึ่งมาพร้อมกับตัวอย่าง OpenCV) คือค้นหารูปทรงในระนาบสีทั้งหมดประมาณค่าและตรวจสอบจำนวนองค์ประกอบ = 4 มันทำงานเพื่อขยายบางส่วนที่ตรวจพบไม่กี่สี่เหลี่ยมโดยเฉพาะอย่างยิ่งที่มืด ขั้นตอนต่อไปที่ผมทำก็คือการทำนาย คือข้อตกลงนี้ได้รับการแก้ไข ดังนั้นหากได้รับบางอย่างฉันสามารถทำนายสิ่งที่เหลืออยู่ได้ มันยังทำงานเพื่อขยายเพิ่มเติม แต่ความแม่นยำนั้นแย่มาก แต่ฉันรู้สึกว่าการทำนายไม่ใช่วิธีที่ดีที่นี่และมันก็ไม่ได้ให้คำตอบที่ถูกต้องเสมอไปตามขั้นตอนแรก สิ่งที่ฉันต้องการ : 1) มีวิธีอื่นใดที่ดีกว่าในการตรวจสอบกำลังสองเหล่านี้อย่างแม่นยำมากขึ้น หรือหลายวิธี? จุดหนึ่งที่สำคัญก็คือว่าเวลาไม่ได้เป็นปัญหาที่นี่ อัลกอริทึมอาจช้ามันไม่สำคัญ แต่ความแม่นยำเป็นเกณฑ์สำคัญ บางครั้งภาพอาจเบลอมากขึ้น และหนึ่งในปัญหาสำคัญที่ฉันเผชิญคือสี่เหลี่ยมบางอันมีสีเกือบเหมือนกันกับพื้นหลัง (ตรวจสอบคอลัมน์ 3 คอลัมน์แรกและสี่เหลี่ยมที่สอง) กำลังมองหาแนวคิดขอบคุณล่วงหน้า อัปเดต: ด้านล่างเป็นผลลัพธ์ที่แม่นยำที่สุดที่ฉันได้รับ: แน่นอนภาพผลลัพธ์จะถูกปรับขนาดเล็กน้อย อัปเดต 2: ฉันได้รับคำตอบที่ดีกว่านี้ในคำตอบของฉันด้านล่าง: https://dsp.stackexchange.com/a/7526/818

2
ความแตกต่างระหว่าง Hough และ Radon เปลี่ยนไปอย่างไร
ฉันคุ้นเคยกับการแปลงเรดอนจากการเรียนรู้เกี่ยวกับการสแกน CT แต่ไม่ใช่การแปลง Hough Wikipedia พูดว่า บางครั้งเครื่องบิน (r, θ) บางครั้งเรียกว่า Hough space สำหรับชุดของเส้นตรงในสองมิติ การเป็นตัวแทนนี้ทำให้การแปลง Hough ในเชิงแนวคิดใกล้เคียงกับการแปลงเรดอนสองมิติ (พวกเขาสามารถมองเห็นวิธีต่าง ๆ ในการดูการเปลี่ยนแปลงแบบเดียวกัน [5]) ผลลัพธ์ของพวกเขาดูเหมือนกันสำหรับฉัน: Wolfram Alpha: Radon Wolfram Alpha: Hough ดังนั้นฉันไม่เข้าใจว่าความแตกต่างคืออะไร พวกเขาเป็นเพียงสิ่งเดียวกันที่เห็นในรูปแบบที่แตกต่างกัน? ประโยชน์ของมุมมองที่ต่างกันคืออะไร ทำไมพวกเขาถึงไม่รวมเข้ากับ "การแปลงร่างของ Hough-Radon"?

5
การตรวจจับเส้นทางในรูปป่า
มีใครรู้บ้างเกี่ยวกับการวิจัย / เอกสาร / ซอฟต์แวร์เพื่อระบุเส้นทาง (เป็นเส้นโค้งหรือจากจุดหนึ่งไปยังอีกจุดหนึ่ง) ในภาพของฉากป่า (จากมุมมองของกล้องที่ยืนอยู่ตรงทาง) ฉันพยายามค้นหาอัลกอริทึมที่สามารถถ่ายภาพได้เช่น: และผลิตหน้ากากระบุว่า "เส้นทาง" น่าจะเป็นเช่น: อย่างที่คุณเห็นภาพต้นฉบับนั้นเบลอเล็กน้อยซึ่งมีจุดประสงค์ แหล่งที่มาของภาพไม่สามารถรับประกันการโฟกัสที่สมบูรณ์แบบได้ดังนั้นฉันต้องสามารถจัดการกับสัญญาณรบกวนและความเบลอในระดับที่สมเหตุสมผล ความคิดแรกของฉันคือการใช้ Gaussian เบลอและแบ่งภาพออกเป็นบล็อกเปรียบเทียบบล็อกที่อยู่ติดกันเพื่อค้นหาความแตกต่างของสีที่คมชัด อย่างไรก็ตามฉันรู้ได้อย่างรวดเร็วว่าเงาและการเปลี่ยนแปลงอื่น ๆ ของแสงนั้นง่ายมาก ฉันกำลังคิดเกี่ยวกับการแยกคุณสมบัติของ SURF แต่ฉันเพิ่งประสบความสำเร็จกับ SURF / SIFT เมื่อภาพมีความชัดเจนสมบูรณ์แบบและด้วยแสงที่สม่ำเสมอ ฉันได้ลองปรับขนาดรูปภาพและมาส์กให้มีขนาดเล็กลงมาก (เช่น 100x75) แปลงเป็นเวกเตอร์ 1xN และใช้พวกมันเพื่อฝึกอบรมโครงข่ายประสาทฐาน FANN (ที่ภาพเป็นอินพุทและหน้ากากเป็นที่ต้องการ เอาท์พุท) แม้จะมีขนาดเล็กเช่นนี้ แต่มีเลเยอร์ที่ซ่อนอยู่ 1 ชั้นและขนาดของอินพุตเวกเตอร์ 75% แต่ก็ใช้เวลาฝึกอบรม 6 ชั่วโมงและยังไม่สามารถคาดเดามาสก์ใด ๆ ในชุดทดสอบได้ ใครสามารถแนะนำวิธีการหรือเอกสารอื่น ๆ ในเรื่องนี้ได้บ้าง

5
ภาษาที่ดีสำหรับการมองเห็นคอมพิวเตอร์?
ฉันกำลังพยายามใช้ระบบการดึงข้อมูลรูปภาพตามเนื้อหา แต่ก่อนหน้านั้นฉันต้องการรับภาพรวมของภาษาการเขียนโปรแกรมบางอย่างที่เหมาะสมสำหรับงานนี้ (มี libs ที่ดีและเช่นนั้น) ไม่มีใครรู้ภาษาและ libs ที่ดีสำหรับงานประเภทนั้นบ้าง? งูหลามหรือจาวาล่ะ ดีที่สุด

3
วิธีค้นหาสนามเทนนิสในภาพถ่ายทางอากาศ
ฉันสนใจที่จะค้นหาสนามเทนนิสทั้งหมด (และคุณสมบัติอื่น ๆ ที่คล้ายคลึงกันอย่างดีเช่นสนามบาสเก็ตบอล) ในเขตของฉันและฉันมีภาพถ่ายทางอากาศที่มีความละเอียดดี (แต่แตกต่างกัน) แต่ฉันไม่แน่ใจว่าจะหาวิธีที่ดีที่สุดได้อย่างไร . นี่คือสองตัวอย่างของภาพ: ฉันได้ดูวิธีการต่าง ๆ และฉันคิดว่าการจับคู่แม่แบบจะไม่ทำงานเนื่องจากจะช้ามากเนื่องจากอาจมีขนาดและการหมุนตามอำเภอใจและสีก็อาจแตกต่างกันไป การแปลงเสียงของHoughฟังดูแวววาว แต่เมื่อฉันได้รับทุกเส้นฉันไม่แน่ใจว่าจะหาบรรทัดที่เป็นรูปสี่เหลี่ยมผืนผ้าที่มีอัตราส่วนที่เหมาะสม (ประมาณ 36x29 ฟุต) หรือดีกว่าหรือยังสำหรับบรรทัดที่มีเครื่องหมายอื่น ๆ สำหรับพื้นหลังฉันตั้งใจจะเพิ่มสนามเทนนิสทั้งหมดในเคาน์ตีของฉันใน OpenStreetMap

4
ค้นหาปากใบในรูปพืชกล้องจุลทรรศน์
นี่คือคำถามสำหรับผู้เชี่ยวชาญด้านการประมวลผลภาพ ฉันกำลังทำงานกับปัญหาการมองเห็นคอมพิวเตอร์ที่ยากลำบาก งานคือการนับปากใบ (ทำเครื่องหมายด้านล่าง) ในภาพกล้องจุลทรรศน์ DIC ภาพเหล่านี้มีความทนทานต่อเทคนิคการประมวลผลภาพผิวเผินมากที่สุดเช่นการดำเนินงานทางสัณฐานวิทยาและการตรวจจับขอบ นอกจากนี้ยังแตกต่างจากงานนับเซลล์อื่น ๆ ฉันใช้ OpenCV แผนของฉันคือการตรวจสอบคุณสมบัติที่มีประโยชน์สำหรับการเลือกปฏิบัติปากใบ ตัวแยกประเภทของพื้นผิว DCT (การแปลงโคไซน์ไม่ต่อเนื่อง / การวิเคราะห์โดเมนความถี่) LBP (รูปแบบไบนารีโลคัล) HOG (ฮิสโตแกรมของการไล่ระดับสีเชิง) เครื่องตรวจจับคุณสมบัติที่ทนทาน (ฉันไม่เชื่อ) มุมแฮร์ริส SIFT, SURF, STAR, เป็นต้น ตัวเรียงลำดับ Haar cascade / คุณสมบัติของ Viola-Jones และอาจออกแบบตัวอธิบายคุณลักษณะใหม่ ตอนนี้ฉันไม่ได้เลือกตัวจําแนก ฉันพลาดอะไรไป คุณจะแก้ปัญหานี้อย่างไร การแก้ปัญหาการตรวจจับวัตถุที่คล้ายกันจะมีประโยชน์มาก ภาพตัวอย่างที่นี่ หลังจากตัวกรอง bandpass: การตรวจจับขอบ Canny ไม่ได้เป็นสัญญา บางพื้นที่ภาพไม่ได้โฟกัส:

8
เทคนิค Computer Stereo Vision เหมาะสมสำหรับการวัดขนาดย่อยหรือไม่?
ฉันมีโครงการที่ฉันต้องการถ่ายภาพวัตถุและสามารถรับความสูงของคุณลักษณะต่าง ๆ ในภาพนี้เพื่อความแม่นยำในระดับต่ำกว่ามิลลิเมตร (แน่นอนว่าความแม่นยำยังคงถูกกำหนด แต่ตอนนี้พูดว่า 100 มิลลิเมตรของมิลลิเมตร) . ก่อนหน้านี้ฉันได้รับคำแนะนำแล้วว่าเทคนิคการยิงเลเซอร์โดยตรงจะไม่เหมาะสม เวลาเดินทางจะน้อยเกินไปและต้องใช้ความแม่นยำมากเกินไปในการคำนวณที่แม่นยำ การสั่นสะเทือนเล็กน้อย (เช่นคนที่เดินใกล้อุปกรณ์) จะรบกวนผลลัพธ์ ฉันสังเกตเห็นอุปกรณ์เลเซอร์ที่ขายในราคาประมาณ $ 1,000 ที่สามารถบรรลุความแม่นยำ แต่ได้รับผลกระทบจากปัญหาการสั่นสะเทือน (ซึ่งเป็นเรื่องปกติ ฉันต้องการที่จะได้ผลลัพธ์ที่คุ้มค่ากว่าและถือเป็นวิสัยทัศน์สเตอริโอเป็นทางเลือก การเป็นสามเณรในสาขานี้ฉันไม่แน่ใจว่าสามารถบรรลุความแม่นยำที่ต้องการได้หรือไม่ ความแม่นยำที่ต้องการ (อย่างน้อยที่สุด) เป็นไปได้ในทางทฤษฎีหรือไม่? มีกระดาษหรือทรัพยากรที่แนะนำที่จะช่วยอธิบายหัวข้อนี้เพิ่มเติมหรือไม่ หมายเหตุเพิ่มเติม วัตถุที่มีปัญหาจะอยู่ในช่วงตั้งแต่ประมาณ 1/2 "สแควร์ถึงประมาณ 2 1/2" สแควร์ที่บางครั้งความหนาต่ำมาก (1/16 "?) ส่วนใหญ่ของพื้นผิวควรจะแบน แต่การทดสอบหนึ่งจะ คือการยืนยันการยืนยันคุณสมบัติจะค่อนข้างหยาบ (ช่วงการเปลี่ยนภาพที่คมชัด) 17 ส.ค. เวลา 11:00 น หนึ่งในสิ่งที่น่าสนใจ "ยาก" จะมีขนาดประมาณ 20 มม. สูง 1.25 …

3
ฉันจะสร้างโครงสร้าง 3 มิติใหม่จากชุดภาพได้อย่างไร?
ฉันมีชุดของรูปทรง (ชุดของส่วนของเส้น) จัดกลุ่มด้วยวิธีดังต่อไปนี้: Si={I0,Iπ4,I2π4,…,I7π4}Si={I0,Iπ4,I2π4,…,I7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} ที่ไหน SiSiS_iแสดงถึงลำดับของภาพถ่ายของวัตถุรูปธรรมหนึ่งชิ้น IjIjI^jแสดงถึงภาพโดยมีมุมมอง (หมายถึงมุมมองด้านหน้า) jthjthj^{th}j=0j=0j=0 นี่คือตัวอย่างของ (มุมมองด้านหลัง): IπIπI^\pi ฉันจะสร้างโครงสร้าง 3 มิติของวัตถุด้วยกำหนดได้อย่างไรSiSiS_i ใครบางคนสามารถชี้ให้ฉันไปที่เอกสารบางส่วนหรือแม้กระทั่งให้ฉันคำหลักบางอย่าง ฉันรู้ว่ามีบทความจำนวนมากที่ทำงานกับกลุ่มเมฆของจุดและอื่น ๆ แต่สิ่งเหล่านั้นไม่ทำงานในขณะที่ฉันทำงานกับสาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.