ตรวจจับวัตถุที่ทำจากแก้ว


10

ฉันถูกส่งมาที่นี่จากคำถามนี้ใน stackoverflowโปรดยกโทษให้ฉันหากคำถามนั้นเจาะจงเกินไปและไม่ใช่ในลักษณะที่นี่ :)

ภารกิจคือการหาแก้วที่มีของเหลวเฉพาะในนั้น ให้ฉันแสดงภาพแล้วอธิบายสิ่งที่ฉันพยายามบรรลุและวิธีที่ฉันพยายามบรรลุจนถึงในคำอธิบายด้านล่างภาพ

รูปภาพ : (ดูเหมือนว่าฉันต้องการอย่างน้อย 10 ชื่อเสียงในการโพสต์รูปภาพและลิงก์ดังนั้นลิงก์จะต้องทำ :( มิฉะนั้นคุณสามารถดูคำถามล้นสแต็คได้)

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

คำอธิบายโดยละเอียด : ฉันพยายามใช้อัลกอริทึมที่จะตรวจจับแก้วที่มีรูปร่างเฉพาะใน opencv (แก้วอาจถูกเปลี่ยนโดยมุมถ่าย / ระยะทางของกล้องที่แตกต่างกัน) นอกจากนี้ยังจะมีแว่นตาอื่น ๆ ของรูปร่างอื่น ๆ แก้วที่ฉันกำลังค้นหาจะเต็มไปด้วยของเหลวสีบางอย่างที่จะแยกความแตกต่างจากแก้วที่มีสีอื่น

ถึงตอนนี้ฉันได้ลองใช้ตัวแยกฟีเจอร์ SIFT เพื่อพยายามค้นหาฟีเจอร์บางอย่างในกระจกแล้วจับคู่พวกมันกับรูปอื่น ๆ ที่มีกระจกอยู่

วิธีการนี้ใช้งานได้เฉพาะในสภาพที่เฉพาะเจาะจงซึ่งฉันจะมีกระจกในตำแหน่งที่เฉพาะเจาะจงมากและพื้นหลังจะคล้ายกับภาพการเรียนรู้ ปัญหาก็คือว่าแก้วเป็นวัตถุ 3 มิติและฉันไม่รู้วิธีแยกฟีเจอร์จากสิ่งนั้น (อาจมีภาพถ่ายหลายภาพจากมุมที่แตกต่างกันที่เชื่อมโยงอย่างใด?)

ตอนนี้ฉันไม่รู้ว่าฉันจะใช้วิธีการอื่นได้อย่างไร ฉันได้พบเบาะแสบางอย่างเกี่ยวกับเรื่องนี้ (ที่นี่/programming/10168686/algorithm-improvement-for-coca-cola-cola-can-shape-recognition#answer-10219338 ) แต่ดูเหมือนว่าลิงก์จะใช้งานไม่ได้

ปัญหาอีกประการหนึ่งก็คือการตรวจสอบ "ระดับความว่างเปล่า" ที่แตกต่างกันในแก้วนั้น แต่ฉันก็ไม่สามารถที่จะค้นหาตัวกระจกได้อย่างถูกต้อง

คำแนะนำของคุณเกี่ยวกับวิธีการในงานนี้คืออะไร? จะเป็นการดีกว่าถ้าใช้วิธีอื่นเพื่อค้นหาคุณลักษณะวัตถุ 3 มิติในพื้นที่ หรือจะเป็นการดีกว่าถ้าใช้วิธีอื่นทั้งหมด? ฉันเคยได้ยินเกี่ยวกับอัลกอริทึม "เรียนรู้" วัตถุจากชุดภาพถ่ายหลายภาพ แต่ฉันไม่เคยเห็นสิ่งนี้มาก่อนในทางปฏิบัติ

คำแนะนำใด ๆ ที่จะได้รับการชื่นชมจริงๆ


ทางออกสุดท้ายใดที่มีตัวอย่างซอร์สโค้ดเต็มรูปแบบใน C #?
Kiquenet

ว้าวนั่นเป็นคำขอที่ค่อนข้างเฉพาะ ปัญหายังไม่มีวิธีแก้ปัญหาและฉันจะไม่ใช้เวลามากขึ้นในการแก้ปัญหา ฉันเชื่อว่าการตัดสินจากบทความที่กล่าวถึงในที่นี้ว่าเหตุใดทางวิทยาศาสตร์จะไม่มีทางแก้ปัญหาได้เร็ว ๆ นี้เนื่องจากอัลกอริทึมที่แนะนำมีอัตราความแม่นยำต่ำมาก ยังไงก็ตามเนื่องจากโครงการนี้มีไว้สำหรับงานของฉันฉันจึงลงเอยโต้แย้งเกี่ยวกับการประนีประนอมกับลูกค้าเนื่องจากงานนั้นไม่เป็นจริงที่จะเสร็จสมบูรณ์ในทุกวันนี้ ใช้เครื่องตรวจจับคุณสมบัติคล้ายฮาฮาปกติสำหรับ "สิ่งที่ดูเหมือนถ้วย" จากนั้นเลือกเฉดสีเหลืองเพื่อตรวจจับเบียร์ ไม่ใช่งานดั้งเดิม
user1916182

คำตอบ:


2

เอกสารอ้างอิงในลิงค์ของคุณน่าจะเป็นเอกสารนี้

สิ่งที่น่าสนใจเป็นพิเศษคือตารางที่ 1 (รวมอยู่ด้านล่าง) อัตราความแม่นยำไม่ค่อยดีนักแม้ว่าจะดีกว่าวิธีอื่น ๆ

ป้อนคำอธิบายรูปภาพที่นี่


0

บางทีบทความนี้สามารถช่วยคุณได้: http://ai.stanford.edu/~ang/papers/iros09-ScalableLearningObjectDetectionGPU.pdf

แม้ว่าพวกเขาจะใช้ระบบสเตอริโอแบบแอคทีฟนอกเหนือไปจากภาพ 2D เพื่อให้ได้ภาพเชิงลึก แต่สิ่งที่น่าสนใจก็คือพวกเขาใช้คุณสมบัติตามแพทช์สร้างพจนานุกรมของวัตถุที่มีชิ้นส่วนขนาดเล็กจำนวนมาก บางทีคุณสามารถเพิ่มคุณสมบัตินี้เพื่อปรับปรุงอัตราการตรวจจับของคุณ


ฉันไม่คิดว่างานนี้สามารถใช้ได้ดีในแพรคซิสป่า หุ่นยนต์ที่อธิบายไว้ในกระดาษต้องใช้เซ็นเซอร์ความลึกเพื่อตรวจสอบข้อมูลเชิงลึก ... ไม่ค่อยมีประโยชน์ในการพกพา kinect ไปรอบ ๆ เมื่อทำการถ่ายภาพแบบสุ่มบนโทรศัพท์มือถือหรืออะไรบางอย่าง ... แต่ใช่แล้ว
user1916182

-1

มีการทำงานมากในเรื่องนี้เมื่อมันมาถึงซอฟต์แวร์จดจำใบหน้า ตัวอย่างเช่นหากคุณสังเกตเห็นบน Facebook เมื่อติดแท็กรูปภาพตำแหน่งของใบหน้าจะถูกบรรจุไว้และแนะนำให้คุณ

ฉันได้เห็นวรรณกรรมจำนวนมากเกี่ยวกับการจดจำใบหน้าในภาพโดยใช้เครือข่ายประสาทและการค้นหาโดย Google อย่างรวดเร็วจะทำให้ข้อมูลจำนวนมากในเรื่องนั้นอย่างไม่ต้องสงสัย เครือข่ายเหล่านี้ใช้พิกเซลของภาพเป็นอินพุต ในกรณีของคุณการเปลี่ยนแปลงความทึบ / แสงสะท้อนจากกระจกอาจเป็นคุณสมบัติการระบุที่ดีที่เครือข่ายจะเรียนรู้

ปัญหาหนึ่งอาจเป็นจำนวนภาพถ่ายที่คุณต้องใช้เป็นข้อมูลการฝึกอบรมและการประมวลผลล่วงหน้า (เช่นการระบุใบหน้าด้วยตัวคุณเอง) ถ้ามันเป็นไปไม่ได้ที่จะทำเช่นนี้เพื่อให้มีภาพพอที่จะฝึกฝนเครือข่ายของคุณได้ดีพอคุณจะต้องหาทางลัดในขั้นตอนการเรียนรู้ บทความนี้เกี่ยวข้องกับสิ่งที่คุณต้องการทำ: http://www.ll.mit.edu/publications/journal/pdf/vol04_no2/4.2.5.neuralnetwork.pdf

โชคดีที่นี่เป็นเขตข้อมูลที่ใช้งานอยู่มากและรหัสจำนวนมากที่จำเป็นสำหรับปัญหาประเภทนี้มีอยู่ทั่วไปทางออนไลน์

เมื่อคุณสามารถระบุแว่นตาในภาพคุณสามารถทำการวิเคราะห์เพิ่มเติมจากที่นั่น


นี่ไม่เกี่ยวข้องอย่างสมบูรณ์
user1916182

คุณควรพูดอย่างนั้น อย่างไรก็ตามนี่คือลิงค์ไปยังอัลกอริทึมการตรวจจับที่ใช้โดย Facebook ตามเครือข่ายประสาท โชคดีgithub.com/facebookresearch/Detectron
rwolst
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.