คำถามติดแท็ก computer-vision

วิสัยทัศน์ของคอมพิวเตอร์รวมถึงวิธีการประมวลผลวิเคราะห์ภาพและข้อมูลมิติสูงเพื่อสร้างความเข้าใจในระดับสูงและการจดจำฉากหรือภาพ

1
การทำความเข้าใจทฤษฎีอวกาศสเกล
ในทฤษฎีสเกล - สเกลพื้นที่สเกล - สเปซแทนสัญญาณ , (ในกรณีของภาพ ) จะได้รับเป็น: โดยที่เป็นเคอร์เนล gaussian ที่มีพารามิเตอร์และเป็น convolution โดยการเปลี่ยนพารามิเตอร์เราได้รับภาพที่ราบเรียบมากขึ้นหรือน้อยลง เนื่องจากการเป็นตัวแทน coarser ผลลัพธ์ (พารามิเตอร์ ) จะไม่มีวัตถุขนาดเล็กหรือเสียงรบกวนf(x),x=(x1,...,xd)f(x),x=(x1,...,xd)f(x), x = (x_1, ..., x_d)d=2d=2d = 2L(x,y;t)=g(x,y;t)∗f(x,y)L(x,y;t)=g(x,y;t)∗f(x,y)L(x, y; t) = g(x, y; t) * f(x, y)g(x,y;t)g(x,y;t)g(x, y; t)ttt∗∗*tttttt ประเด็นหลักคือการหาวิธีการตรวจจับคุณสมบัติแบบไม่แปรปรวนใช่ไหม? ดังนั้นสำหรับบางภาพที่มีการลดขนาดคัดลอกคุณสมบัติเช่นจุดสำคัญจะถูกตรวจพบอย่างถูกต้องแม้ว่าขนาดจะแตกต่างกันโดยไม่ต้องค้นหาจุดรบกวนอื่น ๆ ในกระดาษพวกเขากำลังใช้อนุพันธ์ normalized \ อะไรคือความหมายของการใช้ normalized อนุพันธ์มันจะช่วยในการวัดขนาดแบบ invariancy ได้อย่างไร?γγ\gammaδξ,γ−norm=tγ/2δxδξ,γ−norm=tγ/2δx\delta_{\xi, \gamma-norm} …

2
อัลกอริทึมสำหรับการตรวจจับปลายนิ้วหรือเล็บ
คุณสามารถให้คำแนะนำกับฉันเกี่ยวกับสิ่งที่อาจเป็นอัลกอริธึมที่ดีที่สุดที่จะใช้สำหรับการตรวจจับปลายนิ้ว / เล็บในภาพ สิ่งแรกที่ข้ามใจของฉันคือViola - โจนส์ หลังจากทบทวนใหม่ฉันสรุปว่าอาจเป็นไปได้ที่จะใช้เพียงการแปลงฮิวจ์หลังจากใช้การตรวจจับขอบ แต่ฉันต้องการคำแนะนำเพิ่มเติม นอกจากนี้เนื่องจากนี่จะเป็นโครงการของนักเรียนที่มีจุดประสงค์ในการเรียนรู้ฉันไม่ได้รับอนุญาตให้ใช้ OpenCV หรือกรอบงานที่คล้ายกัน ด้านล่างเป็นภาพทั่วไปที่จะดำเนินการ (โปรดทราบว่าไม่ใช่มุมมองจากบนลงล่าง) ไม่จำเป็นต้องใช้การตรวจจับนิ้วหัวแม่มือ ภาพทั่วไป http://www.deviantpics.com/images/BwgPX.jpg

1
ขจัดเสียงรบกวนจากการถ่ายภาพรังสีทันตกรรม
ฉันกำลังทำงานในโครงการของการใช้รูปแบบการใช้งานรูปร่าง เพื่อหาฟันในภาพรังสีของฟัน สำหรับผู้ที่คุ้นเคยกับเทคนิคฉันกำลังพยายามที่จะสุ่มตัวอย่างตามเวกเตอร์ปกติสำหรับแต่ละจุดสังเกต กระดาษแนะนำให้ใช้อนุพันธ์ของพิกเซลตัวอย่าง: "เพื่อลดผลกระทบของการเปลี่ยนแปลงความเข้มทั่วโลกเราจะสุ่มตัวอย่างอนุพันธ์ตามโปรไฟล์แทนที่จะเป็นค่าระดับสีเทาแน่นอน" ดังนั้นปัญหาของฉันคือวิธีกรองภาพรังสีด้วยวิธีที่ดีที่สุดในการเตรียมพวกเขาสำหรับการใช้ผู้ประกอบการอนุพันธ์ ขณะนี้ฉันกำลังใช้การผสมผสานของตัวกรองมัธยฐานเพื่อลบสิ่งที่ฉันคิดว่าส่วนใหญ่เป็นเสียงควอนตัม (mottle) มันตามมาด้วยตัวกรองทวิภาคี จากนั้นฉันก็ใช้โอเปอเรเตอร์ Scharrเพื่อคำนวณการไล่ระดับสีจริงซึ่งควรจะสุ่มตัวอย่าง ผลลัพธ์จะแสดงด้านล่าง: ภาพแรกแสดงข้อมูลต้นฉบับ ในภาพที่สองและสามข้อมูลที่ถูกกรองจะถูกนำเสนอก่อนเป็นขนาดของสเปกตรัมหลังจาก FFT และจากนั้นเป็นข้อมูลภาพที่ถูกกรอง ภาพที่สี่แสดงผลลัพธ์ของการใช้ตัวดำเนินการ Scharr กับภาพที่สาม คำถามของฉันคือ: มีวิธีการที่รู้จักกันดีในการลดเสียงรบกวนในภาพรังสีด้วยวิธีทันตกรรมที่จะแตกต่างจากวิธีการของฉันหรือไม่? อะไรทำให้เกิดลักษณะ "ควัน" ของขอบและพื้นที่ "แบน" (ไม่ใช่ขอบ)? มันเป็นสัญญาณรบกวนที่เหลืออยู่ในภาพที่ถูกกรองหรือมันมีอยู่ในตัวดำเนินการไล่ระดับสี ถ้าเป็นเสียงตัวกรองใดที่เหมาะสมที่สุดที่จะใช้ ค่ามัธยฐานตัวกรองดีในการลบ blobs ที่มีเสียงดังขนาดเล็ก แต่เคอร์เนลขนาดใหญ่ทำให้ขอบเบลอมากเกินไป ดังนั้นตัวกรองทวิภาคีจะใช้ในการกรอง blobs ขนาดใหญ่ขึ้นและทำให้สีเท่ากันทั่วบริเวณโดยไม่ทำอันตรายต่อขอบ แต่ไม่สามารถกรองโครงสร้างควันนี้ได้ มีตัวเลือกที่ดีกว่าตัวดำเนินการ Scharr เพื่อสร้างการไล่ระดับสีในกรณีนี้หรือไม่? โบนัส: สิ่งนี้จะได้รับการพิจารณาว่าเป็นอินพุตที่ดีสำหรับ Active Shape Model หรือไม่? ฉันยังไม่ทราบว่ามันแข็งแกร่งแค่ไหน

2
ทำความเข้าใจเกี่ยวกับกระบวนการคำนวณคุณสมบัติของ SURF
ดังนั้นฉันกำลังอ่านกระดาษบนSURF (Bay, Ess, Tuytelaars, Van Gool: คุณสมบัติที่แข็งแกร่งขึ้นอย่างรวดเร็ว (SURF) )และฉันไม่สามารถเข้าใจย่อหน้านี้ด้านล่าง: เนื่องจากการใช้ตัวกรองกล่องและรูปภาพที่เป็นส่วนประกอบเราไม่จำเป็นต้องใช้ตัวกรองซ้ำกับผลลัพธ์ของเลเยอร์ที่กรองก่อนหน้านี้ แต่สามารถใช้ตัวกรองกล่องขนาดใดก็ได้ที่ความเร็วเดียวกันกับภาพต้นฉบับโดยตรงและ แม้ในแบบคู่ขนาน (แม้ว่าจะไม่ได้ใช้ประโยชน์ที่นี่) ดังนั้นการวิเคราะห์ขนาดพื้นที่โดยการปรับขนาดตัวกรองมากกว่าการลดขนาดภาพซ้ำรูปที่ 4 This is figure 4 in question. ป.ล. : บทความนี้มีคำอธิบายเกี่ยวกับภาพรวม แต่เนื้อหาทั้งหมดของบทความจะขึ้นอยู่กับย่อหน้าเฉพาะด้านบน หากใครอ่านบทความนี้คุณช่วยพูดสั้น ๆ ว่าเกิดอะไรขึ้นที่นี่ คำอธิบายทางคณิตศาสตร์ทั้งหมดนั้นค่อนข้างซับซ้อนที่จะเข้าใจก่อนดีดังนั้นฉันต้องการความช่วยเหลือ ขอบคุณ แก้ไขสองประเด็น: 1 แต่ละคู่จะแบ่งออกเป็นระดับมาตราส่วนคงที่ เนื่องจากลักษณะที่ไม่ต่อเนื่องของภาพที่เป็นส่วนประกอบความแตกต่างของสเกลขั้นต่ำระหว่าง 2 สเกลที่ตามมานั้นขึ้นอยู่กับความยาวแท้จริงของ lobes บวกหรือลบของอนุพันธ์อันดับสองบางส่วนในทิศทางของการสืบทอด (x หรือ y) ซึ่งตั้งค่าเป็น สามของความยาวขนาดตัวกรอง สำหรับตัวกรอง 9x9 ความยาวแท้จริงคือ 3 สำหรับสองระดับต่อเนื่องเราจะต้องเพิ่มขนาดนี้อย่างน้อย 2 พิกเซล …

2
The Parameter Devil - วิธีการตั้งค่าเมื่อไม่มีการตรวจสอบความถูกต้องกับความจริงของพื้นดิน [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน6 ปีที่ผ่านมา คำถาม: ฉันต้องการพูดคุยเกี่ยวกับวิธีที่ผู้คนตั้งค่าพารามิเตอร์อัลกอริทึมเมื่อไม่มีการตรวจสอบความถูกต้องกับความจริงของพื้นดิน (อาจเป็นเพราะความจริงไม่สามารถรับได้หรือเป็นเรื่องยาก / น่าเบื่อมากที่จะได้รับ) ฉันได้อ่านเอกสารจำนวนมากและใช้อัลกอริธึมพื้นฐานซึ่งในนั้นมีชุดของพารามิเตอร์ที่ได้รับการตั้งค่าว่า "สังเกตุ" - และบ่อยครั้งที่ฉันพบว่าสิ่งเหล่านี้เป็นสิ่งที่ส่งผลกระทบต่อ ทฤษฏีที่เป็นรากฐานของวิธีการนั้นสง่างามล่อลวงและเสียง ฉันจะขอบคุณถ้าคุณสามารถแบ่งปันความคิดของคุณ และไม่มีคำตอบที่ถูกหรือผิดสำหรับคำถามนี้ ฉันแค่อยากรู้ว่าคนอื่น ๆ เกี่ยวข้องกับเรื่องนี้อย่างไร ประวัติความเป็นมา / ที่มาของคำถาม: ฉันเป็นนักวิทยาศาสตร์คอมพิวเตอร์ที่ทำงานในด้านการวิเคราะห์ภาพการมองเห็นคอมพิวเตอร์และการเรียนรู้ของเครื่องและคำถามนี้อยู่ในใจของฉันมาระยะหนึ่งแล้วเมื่อฉันต้องเผชิญกับภาวะที่กลืนไม่เข้าคายไม่ออกครั้งนี้และอีกครั้งเมื่อใดก็ตามที่ฉันออกแบบอัลกอริทึมใหม่ พบว่าตัวเองใช้เวลามากในการปรับพารามิเตอร์ นอกจากนี้ฉันคิดว่าคำถามของฉันที่นี่เป็นเรื่องทั่วไปมากขึ้นในพื้นที่ใด ๆ ที่มีอัลกอริทึมการคำนวณเกี่ยวข้องกันอย่างหนักและฉันต้องการเชิญความคิดของผู้คนจากทุกพื้นที่ที่เกี่ยวข้อง ฉันต้องการให้คุณเป็นตัวอย่างที่เป็นรูปธรรมเพียงเพื่อช่วยให้คุณคิดว่า: --- ใช้กรณีของการตรวจจับคุณสมบัติ (สมมติว่า blobs แบบวงกลมหรือจุดสำคัญ) คุณรันตัวกรองบางตัว (ต้องการพารามิเตอร์) ในระดับที่แตกต่างกัน (พารามิเตอร์มาตราส่วน) และอาจเป็นขีด จำกัด การตอบสนอง (พารามิเตอร์ขีด จำกัด ) มันเป็นไปไม่ได้ที่จะได้รับความจริงที่จะตรวจสอบและปรับพารามิเตอร์ของคุณโดยอัตโนมัติในสถานการณ์ดังกล่าว --- ใช้กรอบการคำนวณใด ๆ …

1
การนับ vechicles ในภาพ
ฉันพยายามใช้อัลกอริทึมสำหรับการนับจำนวนรถยนต์เป็นภาพเรียบร้อยแล้ว ฉันได้ลองใช้วิธีการสำหรับการนับยานพาหนะในการแสดงตนของยานพาหนะหลายภาพในภาพการจราจร มันประเมินพื้นหลังจากชุดของภาพต่าง ๆ ฉันได้ดูเทคนิคอื่น ๆ เพื่อจุดประสงค์นี้และสิ่งเหล่านี้ในทางเดียวหรืออื่น ๆ ใช้การประเมินพื้นหลังทั้งจากชุดภาพหรือต้องการวิดีโอ ฉันมีภาพอินพุตภาพจราจรที่พื้นหลัง (อาจเป็นถนนในเอกสารส่วนใหญ่) แทบจะมองไม่เห็น ยิ่งไปกว่านั้นภาพนั้นมาจากพื้นที่ที่แตกต่างกันดังนั้นจึงไม่มีพื้นหลังเหมือนกัน ฉันควรดำเนินการอย่างไรในกรณีนั้น ฉันคิดว่าถ้าอย่างใดฉันสามารถตรงกับโครงสร้างของยานพาหนะ (รถยนต์) แล้วพวกเขาอาจจะสามารถจับคู่ แต่ฉันไม่รู้ว่าสิ่งนี้เป็นไปได้หรือไม่และเป็นวิธีการดำเนินการต่อเนื่องจากภาพมียานพาหนะที่ถูกบดบังหลายคันเช่นกัน คำแนะนำใด ๆ หรือแม้กระทั่งงานวิจัยก็ยินดีต้อนรับ ภาพตัวอย่างมีดังนี้:

2
ช่วงเวลาภาพดิจิตอลเป็นภาษาอังกฤษธรรมดา
ฉันกำลังศึกษา OpenCV และในการมองเห็นคอมพิวเตอร์และการประมวลผลภาพผู้คนพูดถึง blobs, contours, พื้นที่ที่เชื่อมต่อกันและบางครั้งฉันก็ได้ยินวลี "ช่วงเวลาภาพ" ฉันรู้บทความเกี่ยวกับ Wikipedia เกี่ยวกับเรื่องนี้แต่ฉันคิดว่ามันเป็นเทคนิคเกินไป ฉันไม่ต้องการเจาะลึกลงไปในพื้นหลังของคณิตศาสตร์ แต่ฉันอยากรู้ว่าฉันกำลังพูดถึงอะไร ใครช่วยอธิบายให้ฉันรู้ว่าช่วงเวลาภาพเป็นภาษาอังกฤษธรรมดา

2
วิธีการวัดปมปอดในภาพ CT Scan DICOM
ในคำถามนี้ฉันต้องการเน้นที่ค่าความเข้มของ CT Scan ก่อนอื่นให้ดูภาพด้านล่าง: ภาพด้านบนเป็นภาพต้นฉบับในขณะที่ภาพด้านล่างเป็นรุ่นที่ จำกัด ในการวัดปริมาณของรูปร่างใด ๆ ในทางทฤษฎีมันเป็นไปได้ที่จะนับจำนวน voxels ในภาพ อย่างไรก็ตามชั้นนอกสุดของวัตถุ (เช่นก้อนกลม) แสดงความเข้มที่เข้มกว่าในขณะที่ voxels ทั้งหมดภายในวัตถุนั้นมีความเข้มสูงมาก ถ้าฉันนับ voxels ในเวอร์ชันที่ จำกัด ฉันมีแนวโน้มสูงที่จะได้รับปริมาณผลลัพธ์ที่ใหญ่กว่าปริมาตรที่แท้จริงสำหรับโหนปอด ฉันยังเห็นว่ามีตัวแปรเช่น window center (ระดับ) และความกว้างของหน้าต่างซึ่งสามารถใช้เพื่อปรับข้อมูลความเข้มของภาพ DICOM ความเข้มต่างกันสามารถเปลี่ยนแปลงปริมาณผลลัพธ์ ดังนั้นนี่คือคำถาม: ถ้าฉันจะวัดปมปอดใด ๆ ที่ฉันควรทำเพื่อให้บรรลุความแม่นยำที่ดีที่สุดที่เป็นไปได้? เมื่อใดที่เราควรมองข้าม voxels ที่มีความเข้มต่ำกว่า หรือฉันต้องทำสิ่งนี้ด้วยวิธีอื่น?

2
iPhone iOS UII วิธีการตรวจจับ“ ตัวชี้เลเซอร์” จุดบนฟีดกล้อง?
ฉันได้ของเล่นหุ่นยนต์ที่ติดตามแล้วและฉันควบคุมมันด้วย iPhone หุ่นยนต์ส่งสัญญาณภาพกล้องถ่ายทอดสดตามขนาดเฟรมที่รู้จักและฉันแสดงผลบน UIImage ฉันได้เพิ่มตัวชี้เลเซอร์ไปยังหุ่นยนต์และแก้ไขมันควบคู่ไปกับแกนของหุ่นยนต์ ฉันพยายามตรวจจับจุดเลเซอร์ชี้บนภาพและพยายามคำนวณความใกล้เคียงของวัตถุ หากจุดเลเซอร์อยู่ไกลจากศูนย์กลางฉันรู้ว่าหุ่นยนต์ติดอยู่กับผนังและต้องการสำรอง ฉันจะตรวจจับจุดสีขาวสว่างแดงบนหน้าจอได้อย่างไร วิธีแก้ปัญหาอย่างหนึ่งก็คือการสุ่มตัวอย่างสีของพิกเซลภายในรัศมีของศูนย์กลางและตรวจจับสีสว่างหยด ใครสามารถแนะนำอัลกอริทึมสำหรับกิจกรรมนี้ได้บ้าง อีกวิธีหนึ่งก็คือการติดตามตำแหน่งเฉลี่ยของจุดในช่วงสองสามเฟรมสุดท้ายซึ่งจะเป็นการลดรัศมีการคาดเดา หากไม่มีจุดภายในขอบเขตที่กำหนดไว้ล่วงหน้าภูมิภาคการค้นหาอาจถูกขยาย ในที่สุดฉันต้องการที่จะสอนหุ่นยนต์ให้ตรวจจับพรมรอบ ๆ มัน Carpet สะท้อนตัวชี้เลเซอร์ในทางใดทางหนึ่งและฉันต้องการเข้าใจจำนวนเฟรมรอบ ๆ หุ่นยนต์ที่มีคุณสมบัติคล้ายกัน หากฉันรู้ว่าตัวชี้เลเซอร์อยู่ที่หน้าจอฉันสามารถคลิปสี่เหลี่ยมเล็ก ๆ จากภาพนั้นและเปรียบเทียบกับอีกอันหนึ่งได้ มีวิธีที่มีประสิทธิภาพในการเปรียบเทียบภาพขนาดเล็กหลาย ๆ ภาพกับอีกภาพหนึ่งเพื่อทำความเข้าใจหรือไม่ว่าภาพเงาของพวกเขาตรงกันหรือไม่? ฉันสังเกตเห็นว่าเลเซอร์ถูกสะท้อนออกจากพื้นผิวมันวาวและทิศทางของการสะท้อนนี้อาจบอกฉันบางอย่างเกี่ยวกับการวางแนวของพื้นผิวในอวกาศตามกฎหมายของการหักเห ขอบคุณ!

2
วิธีประมาณค่าอ็อกเทฟและขนาดสำหรับคุณลักษณะด้านภาพที่วางไว้ที่มุมของแฮร์ริส
ขณะนี้ฉันกำลังทำงานกับและเปรียบเทียบประสิทธิภาพของตัวตรวจจับคุณลักษณะหลายตัวที่ OpenCV ใช้เป็นพื้นฐานสำหรับการจับคู่คุณลักษณะทางภาพ ฉันใช้คำอธิบายSIFT ผมได้ประสบความสำเร็จการจับคู่ที่น่าพอใจ (หลังจากปฏิเสธการแข่งขันที่ไม่ดี) เมื่อตรวจสอบMSERและหมา (ร่อน)คุณสมบัติ ขณะนี้ฉันกำลังทดสอบโค้ดของฉันกับGFTT (ฟีเจอร์ที่ดีในการติดตาม - มุมแฮร์ริส)เพื่อรับการเปรียบเทียบและเนื่องจากในขั้นตอนสุดท้ายชุดของฟีเจอร์ GFTT จะพร้อมใช้งานจากกระบวนการติดตามคุณลักษณะที่มองเห็น ฉันใช้cv::FeatureDetector::detect(...)ซึ่งให้ฉันด้วยstd::vector<cv::KeyPoint>ที่เต็มไปด้วยการตรวจพบคุณลักษณะ / keypoints / ภูมิภาคที่น่าสนใจ โครงสร้างcv::KeyPointประกอบด้วยข้อมูลพื้นฐานเกี่ยวกับตำแหน่งของสถานที่รวมถึงข้อมูลเกี่ยวกับsizeและoctaveที่ตรวจพบจุดสำคัญ ผลลัพธ์แรกของฉันกับGFTTนั้นแย่มากจนกระทั่งฉันเปรียบเทียบค่าทั่วไปsizeและoctaveพารามิเตอร์ในคุณสมบัติที่แตกต่างกัน: MSERตั้งค่าขนาด (ระหว่าง 10 ถึง 40px) และทำให้อ็อกเทฟเป็น 0 DoG (SIFT)ตั้งค่าทั้งขนาดและอัตราส่วนคู่ ( ขนาด /อัตราส่วนคู่ระหว่าง 20 และ 40) GFTTพารามิเตอร์อยู่เสมอ : size = 3 , octave = 0 ฉันเข้าใจว่าเป็นเพราะวัตถุประสงค์หลักของฟีเจอร์ GFTTไม่ได้ถูกใช้ในการจับคู่ แต่ใช้เพื่อการติดตามเท่านั้น สิ่งนี้อธิบายคุณภาพของผลลัพธ์การจับคู่ต่ำเนื่องจากตัวอธิบายที่ดึงออกมาจากคุณสมบัติเล็ก ๆ …

2
มีอัลกอริธึมการมองเห็นของคอมพิวเตอร์ที่กำหนดเป้าหมายเป็นภาพความลึกโดยเฉพาะหรือไม่?
ฉันได้ดูอัลกอริธึมการตรวจจับเครื่องหมายเพื่อใช้กับแอพพลิเคชั่นพื้นฐานของ kinect และงานส่วนใหญ่ที่ฉันสามารถค้นหาได้นั้นมุ่งเน้นไปที่การตรวจจับคุณสมบัติในภาพ 'ปกติ' อย่างชัดเจน อย่างไรก็ตามฮาร์ดแวร์ kinect ให้ (โดยปกติเมื่อคุณปรับแล้ว) ค่าความลึก 11 บิตต่อพิกเซล ภาพความลึกนี้ยังมีสิ่งประดิษฐ์ที่มองเห็นได้หลายอย่างจากเงาที่ล้อมรอบขอบวัตถุ (ดูตัวอย่างขอบสีดำที่แข็งแกร่งในวิดีโอนี้http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ) ในขณะที่บางเทคนิคการมองเห็นเครื่องจักรแบบดั้งเดิม (เช่นการตรวจจับขอบ) ทำงานได้ดีกับสิ่งนี้ แต่คนอื่นทำไม่ได้และดูเหมือนว่ามีข้อมูลเพียงเล็กน้อยเกี่ยวกับการพูดคุยเรื่องนี้ ตัวอย่างง่ายๆการใช้ค่าความลึกทำให้ไม่สามารถตรวจจับทิศทางของบล็อกมาร์กเกอร์ได้เมื่อคุณพบมัน มีใครเคยเห็นการอภิปราย / เอกสาร / อื่น ๆ ที่ครอบคลุมการประมวลผลภาพเชิงลึกสำหรับการตรวจจับคุณสมบัติหรือไม่? ทุกคนสามารถแนะนำอัลกอริทึมที่ดีสำหรับการตรวจจับเครื่องหมาย "ความลึก" (บล็อกแบบพับได้อย่างมีประสิทธิภาพแทนที่จะเป็นตัวทำเครื่องหมาย b / w ที่พิมพ์) สิ่งที่ฉันได้ทำมาแล้วคือการทดลองใช้ adencoc โดยใช้ opencv เพื่อประมวลผลภาพ แต่นั่นไม่ได้อยู่ใกล้ที่เสถียรหรือเร็วพอ หากคุณเชื่อมโยงกับผลิตภัณฑ์วิชันซิสเต็มเชิงพาณิชย์โดยไม่ต้องทดลองใช้งานโปรดพูดถึงคำตอบของคุณว่าทำไมคุณถึงคิดว่ามันเหมาะสม

1
อะไรคือความเชื่อมโยงระหว่าง homography ที่คำนวณจาก 2 ภาพและ homography ที่คำนวณเหนือรูปภาพเดียวกันคว่ำ?
ด้วยOpenCVฉันคำนวณการถ่ายภาพระหว่างพูดภาพสองภาพนี้: และ ไม่ต้องกังวลกับสีขาวแปลก ๆ ทางด้านขวามันเป็นเพราะตัวยึดสมาร์ทโฟนที่ฉันใช้ homography ที่กำหนดโดยfindHomography ()ฟังก์ชั่น (ใช้คะแนนที่ตรวจพบกับตัวตรวจจับคุณลักษณะอย่างรวดเร็วและตัวจับคำอธิบาย HammingLUT ) คือ: A = [ 1.412817430564191, 0.0684947165270289, -517.7751355800591; -0.002927297251810, 1.210310757993256, 39.56631316477566; 0.000290600259844, -9.348301989015293e-05, 1] ตอนนี้ฉันใช้กระบวนการเดียวกันเพื่อคำนวณ homography ระหว่างภาพเดียวกันที่หมุนไป 180 องศา (กลับหัว) โดยใช้imagemagick (ตามความเป็นจริงฉันสนใจที่จะทราบความสัมพันธ์ของการหมุน 90 หรือ 270 องศา ... ) ที่นี่พวกเขาคือ: และ ด้วยภาพเหล่านี้การทำตัวพิมพ์จะกลายเป็น: B = [ 0.7148688519736168, 0.01978048500375845, 325.8330631554814; -0.1706219498833541, 0.8666521745094313, 64.72944905752504; …

1
คุณสมบัติ / อัลกอริธึมที่ดีสำหรับการจดจำรูปแบบรถยนต์ในภาพ
ฉันมีคำถามเกี่ยวกับการจดจำวัตถุโดยเฉพาะการจำแบบจำลองรถยนต์! ฉันอยู่ที่จุดเริ่มต้นของการทำงานเกี่ยวกับการระบุรถยนต์รุ่นเดียวกันในภาพต่าง ในตอนนี้ฉันคิดว่าหนึ่งในอัลกอริธึมที่ดีที่สุดสำหรับการรับรู้วัตถุ 3 มิติคือ SIFT แต่หลังจากเล่นไปเรื่อย ๆ ด้วยการสาธิตฉันรู้สึกแปลกใจว่าอัลกอริทึมนี้มีปัญหาบางอย่างกับวัตถุโลหะมันวาวเช่นรถยนต์โดยเฉพาะอย่างยิ่ง ไม่มีใครรู้ว่างานบางอย่างในพื้นที่นี้โดยทั่วไปอัลกอริทึมที่เหมาะสมบางอย่างสำหรับงานในการค้นหารถรุ่นเดียวกันในภาพที่แตกต่างกันอย่างไร ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ!

1
การวัดระยะทางสัมพัทธ์อย่างแม่นยำระหว่างชุด fiducials (แอปพลิเคชั่นเติมความเป็นจริง)
สมมติว่าฉันมีเครื่องหมาย 5 ชุด ฉันกำลังพยายามที่จะหาระยะทางระหว่างญาติแต่ละเครื่องหมายโดยใช้กรอบการเติมความเป็นจริงเช่นARToolkit ในกล้องของฉันให้อาหารเจ้า 20 เฟรมแรกแสดงให้ฉันเห็นถึง 2 เครื่องหมายแรกเท่านั้นดังนั้นฉันสามารถคำนวณการเปลี่ยนแปลงระหว่างเครื่องหมาย 2 อันได้ 20 เฟรมที่สองแสดงให้ฉันเห็นว่าเครื่องหมายที่ 2 และ 3 เท่านั้นเป็นต้น 20 เฟรมสุดท้ายแสดงให้ฉันเห็นว่าเครื่องหมายที่ 5 และที่ 1 ฉันต้องการสร้างแผนที่ 3 มิติของตำแหน่งเครื่องหมายของเครื่องหมายทั้ง 5 ตัว คำถามของฉันคือการรู้ว่าระยะทางไม่ถูกต้องเนื่องจากฟีดวิดีโอคุณภาพต่ำฉันจะลดความคลาดเคลื่อนที่ได้รับจากข้อมูลทั้งหมดที่ฉันรวบรวมได้อย่างไร วิธีการที่ไร้เดียงสาของฉันคือการใช้เครื่องหมายแรกเป็นจุดฐานจาก 20 เฟรมแรกใช้ค่าเฉลี่ยของการแปลงและวางเครื่องหมาย 2 และอื่น ๆ สำหรับอันดับ 3 และ 4 สำหรับเครื่องหมายที่ 5 วางไว้ระหว่าง 4 และ 1 โดยวางไว้กลางค่าเฉลี่ยของการแปลงระหว่างวันที่ 5 และ 1 และ 4 …

2
การตรวจจับพื้นผิว
ส่วนหนึ่งของพื้นที่ขนาดใหญ่ของสีเทา (ตั้งแต่สีขาวเป็นสีดำ) จากภาพเป็นอย่างไร (ถ้าคุณรู้สิ่งนี้ใน opencv คุณอาจตอบโดยพูดว่าคุณจะทำอะไรใน opencv) ตัวอย่างเช่นให้ภาพนี้: คุณเห็นว่านี่เป็นพื้นที่สีเทาขนาดใหญ่และเห็นได้อย่างชัดเจนจากส่วนที่เหลือ คุณจะแบ่งส่วนนี้ได้อย่างไรหากพื้นที่นี้มีเฉดสีเทาและต้องทำงานแบบเรียลไทม์ ขอบคุณล่วงหน้า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.