มีอัลกอริธึมการมองเห็นของคอมพิวเตอร์ที่กำหนดเป้าหมายเป็นภาพความลึกโดยเฉพาะหรือไม่?


9

ฉันได้ดูอัลกอริธึมการตรวจจับเครื่องหมายเพื่อใช้กับแอพพลิเคชั่นพื้นฐานของ kinect และงานส่วนใหญ่ที่ฉันสามารถค้นหาได้นั้นมุ่งเน้นไปที่การตรวจจับคุณสมบัติในภาพ 'ปกติ' อย่างชัดเจน

อย่างไรก็ตามฮาร์ดแวร์ kinect ให้ (โดยปกติเมื่อคุณปรับแล้ว) ค่าความลึก 11 บิตต่อพิกเซล

ภาพความลึกนี้ยังมีสิ่งประดิษฐ์ที่มองเห็นได้หลายอย่างจากเงาที่ล้อมรอบขอบวัตถุ (ดูตัวอย่างขอบสีดำที่แข็งแกร่งในวิดีโอนี้http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related )

ในขณะที่บางเทคนิคการมองเห็นเครื่องจักรแบบดั้งเดิม (เช่นการตรวจจับขอบ) ทำงานได้ดีกับสิ่งนี้ แต่คนอื่นทำไม่ได้และดูเหมือนว่ามีข้อมูลเพียงเล็กน้อยเกี่ยวกับการพูดคุยเรื่องนี้

ตัวอย่างง่ายๆการใช้ค่าความลึกทำให้ไม่สามารถตรวจจับทิศทางของบล็อกมาร์กเกอร์ได้เมื่อคุณพบมัน

มีใครเคยเห็นการอภิปราย / เอกสาร / อื่น ๆ ที่ครอบคลุมการประมวลผลภาพเชิงลึกสำหรับการตรวจจับคุณสมบัติหรือไม่?

ทุกคนสามารถแนะนำอัลกอริทึมที่ดีสำหรับการตรวจจับเครื่องหมาย "ความลึก" (บล็อกแบบพับได้อย่างมีประสิทธิภาพแทนที่จะเป็นตัวทำเครื่องหมาย b / w ที่พิมพ์)

สิ่งที่ฉันได้ทำมาแล้วคือการทดลองใช้ adencoc โดยใช้ opencv เพื่อประมวลผลภาพ แต่นั่นไม่ได้อยู่ใกล้ที่เสถียรหรือเร็วพอ

หากคุณเชื่อมโยงกับผลิตภัณฑ์วิชันซิสเต็มเชิงพาณิชย์โดยไม่ต้องทดลองใช้งานโปรดพูดถึงคำตอบของคุณว่าทำไมคุณถึงคิดว่ามันเหมาะสม


มีเอกสารและโปรแกรมมากมายสำหรับเรื่องนี้ ขออภัยไม่สามารถตอบรายละเอียดเพิ่มเติมในแบนด์วิดท์ต่ำ ดูแอพ RGBDemo ซึ่งจะมีตัวจำแนกวัตถุ นอกจากนี้ PointCloud Library (PCL), ROS, OpenCV สำหรับซอฟต์แวร์และ Google Scholar สำหรับเอกสาร คุณพูดถึง OpenCV ไม่เป็นที่พอใจสำหรับคุณ แต่ PCL และ RGBDemo อาจจะเป็น

ฉันไม่ได้กำลังมองหาการใช้งานการสาธิตที่แสดง kinect หรือการสาธิตพีซีบางอย่างที่แสดงวิธีสร้างโมเดล 3 มิติจาก kinect หรือชุดประมวลผลภาพ (เช่น. opencv) ฉันกำลังมองหาอัลกอริทึมสำหรับการจดจำคุณสมบัติตามภาพเชิงลึก

RGBDemo ใช้อัลกอริทึมเหล่านั้น อ่านรหัสหรือการอ้างอิงสำหรับรหัส

คำตอบ:


8

ตัวบ่งชี้คุณสมบัติ 2.5D / 3D ที่ฉันโปรดปรานสำหรับการลงทะเบียนและการรับรู้คือภาพหมุน (กระดาษต้นฉบับ + รายละเอียดเพิ่มเติมในวิทยานิพนธ์ปริญญาเอกและซอฟต์แวร์จาก CMU)

ความก้าวหน้าล่าสุดอื่น ๆ (ค้นหาออนไลน์ได้ทั้งหมดสำหรับอัลกอริธึมที่เหมาะสม) รวมถึง: 3D-Sift, ฮิสโตแกรมฟีเจอร์พอยต์ฟีเจอร์, คุณสมบัติรัศมีแนวปกติ (NARF), ตัวบอกเคอร์เนลเชิงลึก วิธีการที่เก่ากว่านั้นใช้คุณสมบัติของพื้นผิวเช่นความโค้งและขอบเพื่อระบุแพทช์พื้นที่

ไหนดีที่สุด ขึ้นอยู่กับสิ่งที่คุณต้องการค้นหามุมมองความไม่แปรเปลี่ยนความยุ่งเหยิงเพิ่มเติม ฯลฯ


7

คุณได้คำสำคัญทั้งหมดถูกต้องแล้วฉันประหลาดใจที่คุณไม่พบบทความที่เกี่ยวข้องในขณะที่ค้นหาเนื้อหา

โชคดีที่ฉันสามารถเข้าถึงห้องสมุดดิจิทัลของ IEEE Xplore ฉันไม่จำเป็นต้องมีอัลกอริทึมเฉพาะเหล่านี้มาก่อน แต่มันก็ดูน่าสนใจมากดังนั้นนี่คือผลลัพธ์บางส่วนจากการค้นหาอย่างรวดเร็วที่ฉันคิดว่าอาจมีความเกี่ยวข้อง (อย่าตัดสินพวกเขาตามชื่อของพวกเขา

น่าเสียดายที่ฉันไม่คิดว่าคุณสามารถเข้าถึงเอกสารเหล่านี้ได้ฟรีอย่างน้อยก็ไม่ต้องผ่านห้องสมุด IEEE Xplore หากคุณไม่มีสิทธิ์เข้าถึงคุณสามารถใช้ Google scholarและมีฐานข้อมูลกระดาษฟรีอยู่ที่นั่น (ฉันใช้ฐานข้อมูล Mendeleyกลับมาเมื่อฉันยังไม่ได้เข้าถึง IEEE) นอกจากนี้บางส่วนของ Googling ของบทคัดย่อหรือส่วนที่สุ่มของกระดาษบางครั้งก็ให้ผลลัพธ์บางอย่าง (คุณอาจสะดุดข้ามบทความที่ตีพิมพ์เกือบจะเสร็จแล้ว)

คำค้นหาที่ผมใช้ในการหาเอกสารที่กล่าวถึงคือ: 3D ภาพ , ภาพลึก , Kinect คุณอาจต้องการประมวลผลเมื่อค้นหาข้อความค้นหาสองข้อแรก

หวังว่านี่จะช่วยได้บ้าง! ฉันรู้สึกเสียใจฉันไม่สามารถเข้าไปในหัวข้อมากกว่าฟังดูน่าสนใจจริงๆ


และอีกอย่าง: scholar.google.com/scholar_url?hl=th&q=http://…

@ankoff จากนามธรรมฉันเพิ่งเห็นงานที่เน้นการติดตามและดูเหมือนว่ามันจะมุ่งเน้นการใช้ข้อมูลโดยตรงกับการตรวจจับคุณสมบัติไม่มาก แต่ฉันเพิ่งอ่านบทคัดย่อดังนั้นไม่แน่ใจ

Google ชื่อกระดาษนั้นเพียงพอที่จะค้นหา PDF สำหรับเอกสารเหล่านั้นได้หลายฉบับ แหล่งข้อมูลที่ดีอีกแหล่งคือ CiteSeer: citeseerx.ist.psu.edu/indexขอขอบคุณสำหรับรายการเอกสาร!
Rethunk
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.