คำถามติดแท็ก object-recognition

5
คำอธิบายคุณลักษณะการปรับขนาดและการหมุน
คุณสามารถแสดงคำอธิบายคุณลักษณะของมาตราส่วนและตัวชี้การหมุนแบบคงที่เพื่อใช้ในการตรวจจับคุณสมบัติหรือไม่ แอปพลิเคชั่นนี้ใช้สำหรับตรวจจับรถยนต์และมนุษย์ในวิดีโอที่ถ่ายโดย UAV โดยใช้ตัวจําแนกหลายคลาส จนถึงตอนนี้ฉันได้ดู SIFT และ MSER (ซึ่งเลียนแบบค่าคงที่) ฉันยังดูที่ LESH, LESH ขึ้นอยู่กับแบบจำลองพลังงานในท้องที่ แต่คำนวณด้วยวิธีที่ไม่แปรเปลี่ยนแบบหมุนได้ฉันพยายามคิดหาวิธีที่จะใช้ประโยชน์จากพลังงานในท้องถิ่นเพื่อสร้างค่าคงที่แบบหมุนได้ คำอธิบายคุณลักษณะฉันอ่านที่นี่มีทางเลือกฟรีอะไรบ้างสำหรับ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้ ว่า "ถ้าคุณกำหนดทิศทางไปยังจุดสนใจและหมุนแผ่นภาพตามนั้นคุณจะได้ค่าความแปรปรวนแบบหมุนได้ฟรี" แต่ไม่รู้ว่าสิ่งนี้จะช่วยบรรเทาได้อย่างไรหรือฉันจะนำสิ่งนี้ไปใช้กับปัญหาของฉันได้อย่างไร ชื่นชมขอบคุณ

2
อัลกอริทึมการนับคนเดินเท้า
ขณะนี้ฉันกำลังพัฒนาโครงการเคาน์เตอร์คนเดินเท้า (ใช้ OpenCV + QT บน Linux) ความคิดของฉันเกี่ยวกับวิธีการคือ: เฟรมจับภาพ ทำการลบพื้นหลัง เสียงที่ชัดเจน (กร่อนขยาย) ค้นหา blobs (cvBlobslib) - วัตถุเบื้องหน้า สำหรับแต่ละหยดตั้งค่า ROI และค้นหาคนเดินเท้า (LBP ด้วย detectMultiScale) ใน blobs เหล่านี้ (เพื่อประสิทธิภาพที่ดีขึ้น) สำหรับคนเดินถนนที่พบแต่ละคนทำการค้นหาร่างกายส่วนบนที่ซ้อนกัน (ไม่แน่ใจ) (ความน่าเชื่อถือที่ดีขึ้น) หากพบคนเดินถนนเดียวกันบนเฟรมต่อเนื่อง (อาจมี 3-4 เฟรม) - เพิ่มพื้นที่นั้นไปที่เพลาลูกเบี้ยวและแทร็ก - ทำเครื่องหมายว่าเป็นคนเดินเท้า ยกเว้นพื้นที่การติดตามเพลาลูกเบี้ยวจากการตรวจจับหยดน้ำสำหรับเฟรมถัดไป หากคนเดินเท้าข้ามหมายเลขที่เพิ่มขึ้นบรรทัด ฉันต้องการตรวจสอบว่าฉันอยู่ในเส้นทางที่ถูกต้องหรือไม่ คุณมีข้อเสนอแนะเกี่ยวกับวิธีปรับปรุงวิธีการของฉันหรือไม่? หากใครบางคนทำงานในสิ่งที่คล้ายกันฉันจะขอบคุณเคล็ดลับที่มีประโยชน์ทรัพยากร (และการวิจารณ์) เกี่ยวกับปัญหานี้

2
ใช้ตัวกรอง Gabor กับภาพอินพุต
ฉันพยายามใช้ตัวกรอง Gabor ที่มีสเกลเฉพาะ (ตามค่าของแลมบ์ดาและซิกมาดังนั้นจึงเป็น ( 7x7 ) และสำหรับการหมุน 4 ทิศทาง (0, ,และ ) ไปยังอิมเมจสเกลสีเทาอินพุตπ4π4\frac{\pi}{4}π2π2\frac{\pi}{2}3π43π4\frac{3\pi}{4} ในรหัสของฉันประสบความสำเร็จในสามขั้นตอน: สร้างตัวกรอง Gabor อ่านภาพ RGB จากนั้นแปลงเป็นระดับสีเทาและสุดท้ายเป็นสองเท่า ใช้ gabor ที่สร้างขึ้นกับภาพอินพุต ( ที่นี่ฉันไม่แน่ใจว่ารหัสของฉันเป็นจริงหรือไม่นั่นเป็นเหตุผลที่ฉันต้องการความเห็นของคุณ ) 1) -------------- สร้างตัวกรอง Gabor (ขนาด = 7x7 และ 4 การหมุน) %define the five parameters theta=....; %either 0 or pi/4 or pi/2 or 3pi/4 lambda=3.5; …

3
ตรวจจับวัตถุที่ทำจากแก้ว
ฉันถูกส่งมาที่นี่จากคำถามนี้ใน stackoverflowโปรดยกโทษให้ฉันหากคำถามนั้นเจาะจงเกินไปและไม่ใช่ในลักษณะที่นี่ :) ภารกิจคือการหาแก้วที่มีของเหลวเฉพาะในนั้น ให้ฉันแสดงภาพแล้วอธิบายสิ่งที่ฉันพยายามบรรลุและวิธีที่ฉันพยายามบรรลุจนถึงในคำอธิบายด้านล่างภาพ รูปภาพ : (ดูเหมือนว่าฉันต้องการอย่างน้อย 10 ชื่อเสียงในการโพสต์รูปภาพและลิงก์ดังนั้นลิงก์จะต้องทำ :( มิฉะนั้นคุณสามารถดูคำถามล้นสแต็คได้) คำอธิบายโดยละเอียด : ฉันพยายามใช้อัลกอริทึมที่จะตรวจจับแก้วที่มีรูปร่างเฉพาะใน opencv (แก้วอาจถูกเปลี่ยนโดยมุมถ่าย / ระยะทางของกล้องที่แตกต่างกัน) นอกจากนี้ยังจะมีแว่นตาอื่น ๆ ของรูปร่างอื่น ๆ แก้วที่ฉันกำลังค้นหาจะเต็มไปด้วยของเหลวสีบางอย่างที่จะแยกความแตกต่างจากแก้วที่มีสีอื่น ถึงตอนนี้ฉันได้ลองใช้ตัวแยกฟีเจอร์ SIFT เพื่อพยายามค้นหาฟีเจอร์บางอย่างในกระจกแล้วจับคู่พวกมันกับรูปอื่น ๆ ที่มีกระจกอยู่ วิธีการนี้ใช้งานได้เฉพาะในสภาพที่เฉพาะเจาะจงซึ่งฉันจะมีกระจกในตำแหน่งที่เฉพาะเจาะจงมากและพื้นหลังจะคล้ายกับภาพการเรียนรู้ ปัญหาก็คือว่าแก้วเป็นวัตถุ 3 มิติและฉันไม่รู้วิธีแยกฟีเจอร์จากสิ่งนั้น (อาจมีภาพถ่ายหลายภาพจากมุมที่แตกต่างกันที่เชื่อมโยงอย่างใด?) ตอนนี้ฉันไม่รู้ว่าฉันจะใช้วิธีการอื่นได้อย่างไร ฉันได้พบเบาะแสบางอย่างเกี่ยวกับเรื่องนี้ (ที่นี่/programming/10168686/algorithm-improvement-for-coca-cola-cola-can-shape-recognition#answer-10219338 ) แต่ดูเหมือนว่าลิงก์จะใช้งานไม่ได้ ปัญหาอีกประการหนึ่งก็คือการตรวจสอบ "ระดับความว่างเปล่า" ที่แตกต่างกันในแก้วนั้น แต่ฉันก็ไม่สามารถที่จะค้นหาตัวกระจกได้อย่างถูกต้อง คำแนะนำของคุณเกี่ยวกับวิธีการในงานนี้คืออะไร? จะเป็นการดีกว่าถ้าใช้วิธีอื่นเพื่อค้นหาคุณลักษณะวัตถุ 3 มิติในพื้นที่ หรือจะเป็นการดีกว่าถ้าใช้วิธีอื่นทั้งหมด? ฉันเคยได้ยินเกี่ยวกับอัลกอริทึม "เรียนรู้" …

1
ขจัดเสียงรบกวนจากการถ่ายภาพรังสีทันตกรรม
ฉันกำลังทำงานในโครงการของการใช้รูปแบบการใช้งานรูปร่าง เพื่อหาฟันในภาพรังสีของฟัน สำหรับผู้ที่คุ้นเคยกับเทคนิคฉันกำลังพยายามที่จะสุ่มตัวอย่างตามเวกเตอร์ปกติสำหรับแต่ละจุดสังเกต กระดาษแนะนำให้ใช้อนุพันธ์ของพิกเซลตัวอย่าง: "เพื่อลดผลกระทบของการเปลี่ยนแปลงความเข้มทั่วโลกเราจะสุ่มตัวอย่างอนุพันธ์ตามโปรไฟล์แทนที่จะเป็นค่าระดับสีเทาแน่นอน" ดังนั้นปัญหาของฉันคือวิธีกรองภาพรังสีด้วยวิธีที่ดีที่สุดในการเตรียมพวกเขาสำหรับการใช้ผู้ประกอบการอนุพันธ์ ขณะนี้ฉันกำลังใช้การผสมผสานของตัวกรองมัธยฐานเพื่อลบสิ่งที่ฉันคิดว่าส่วนใหญ่เป็นเสียงควอนตัม (mottle) มันตามมาด้วยตัวกรองทวิภาคี จากนั้นฉันก็ใช้โอเปอเรเตอร์ Scharrเพื่อคำนวณการไล่ระดับสีจริงซึ่งควรจะสุ่มตัวอย่าง ผลลัพธ์จะแสดงด้านล่าง: ภาพแรกแสดงข้อมูลต้นฉบับ ในภาพที่สองและสามข้อมูลที่ถูกกรองจะถูกนำเสนอก่อนเป็นขนาดของสเปกตรัมหลังจาก FFT และจากนั้นเป็นข้อมูลภาพที่ถูกกรอง ภาพที่สี่แสดงผลลัพธ์ของการใช้ตัวดำเนินการ Scharr กับภาพที่สาม คำถามของฉันคือ: มีวิธีการที่รู้จักกันดีในการลดเสียงรบกวนในภาพรังสีด้วยวิธีทันตกรรมที่จะแตกต่างจากวิธีการของฉันหรือไม่? อะไรทำให้เกิดลักษณะ "ควัน" ของขอบและพื้นที่ "แบน" (ไม่ใช่ขอบ)? มันเป็นสัญญาณรบกวนที่เหลืออยู่ในภาพที่ถูกกรองหรือมันมีอยู่ในตัวดำเนินการไล่ระดับสี ถ้าเป็นเสียงตัวกรองใดที่เหมาะสมที่สุดที่จะใช้ ค่ามัธยฐานตัวกรองดีในการลบ blobs ที่มีเสียงดังขนาดเล็ก แต่เคอร์เนลขนาดใหญ่ทำให้ขอบเบลอมากเกินไป ดังนั้นตัวกรองทวิภาคีจะใช้ในการกรอง blobs ขนาดใหญ่ขึ้นและทำให้สีเท่ากันทั่วบริเวณโดยไม่ทำอันตรายต่อขอบ แต่ไม่สามารถกรองโครงสร้างควันนี้ได้ มีตัวเลือกที่ดีกว่าตัวดำเนินการ Scharr เพื่อสร้างการไล่ระดับสีในกรณีนี้หรือไม่? โบนัส: สิ่งนี้จะได้รับการพิจารณาว่าเป็นอินพุตที่ดีสำหรับ Active Shape Model หรือไม่? ฉันยังไม่ทราบว่ามันแข็งแกร่งแค่ไหน

1
การแบ่งส่วนและติดตามยานพาหนะ
ฉันทำงานเกี่ยวกับโปรเจคมาระยะหนึ่งเพื่อตรวจจับและติดตามยานพาหนะในวิดีโอที่ถ่ายจาก UAV ในขณะนี้ฉันใช้ SVM ที่ได้รับการฝึกอบรมเกี่ยวกับการนำเสนอคุณสมบัติถุงของคุณลักษณะท้องถิ่นที่ดึงมาจากยานพาหนะและภาพพื้นหลัง จากนั้นฉันใช้วิธีตรวจจับหน้าต่างแบบเลื่อนเพื่อลองและ จำกัด ยานพาหนะในรูปภาพซึ่งฉันต้องการติดตาม ปัญหาคือวิธีการนี้ช้าและตัวตรวจจับของฉันไม่น่าเชื่อถือเท่าที่ฉันต้องการดังนั้นฉันจึงได้รับผลบวกที่ผิดพลาดเล็กน้อย ดังนั้นฉันจึงพิจารณาที่จะพยายามแบ่งส่วนรถยนต์จากพื้นหลังเพื่อค้นหาตำแหน่งโดยประมาณเพื่อลดพื้นที่การค้นหาก่อนที่จะใช้ตัวจําแนกของฉัน แต่ฉันไม่แน่ใจว่าจะไปเกี่ยวกับเรื่องนี้อย่างไรและหวังว่าจะมีคนช่วย นอกจากนี้ฉันได้อ่านเกี่ยวกับการแบ่งส่วนการเคลื่อนไหวด้วยเลเยอร์โดยใช้ออปติคัลโฟลว์เพื่อแบ่งเฟรมตามโมเดลโฟลว์ไม่มีใครมีประสบการณ์ใด ๆ กับวิธีการนี้ถ้าเป็นเช่นนั้นคุณสามารถให้อินพุตบางส่วนได้หรือไม่ ปัญหาของฉัน UPDATE : ฉันโพสต์คำถามนี้ไว้ใน stack overflow ด้วยและมีคำตอบที่ยอดเยี่ยมฉันได้ใช้ความคิดนี้ไปแล้วและมันก็ทำงานได้ดีมากและตอนนี้ฉันก็กำลังตรวจสอบการใช้ optical flow นอกเหนือจากเทคนิคนี้ ด้านล่างเป็นสองเฟรมจากวิดีโอตัวอย่าง กรอบ 0: กรอบ 5:

1
คุณสมบัติ / อัลกอริธึมที่ดีสำหรับการจดจำรูปแบบรถยนต์ในภาพ
ฉันมีคำถามเกี่ยวกับการจดจำวัตถุโดยเฉพาะการจำแบบจำลองรถยนต์! ฉันอยู่ที่จุดเริ่มต้นของการทำงานเกี่ยวกับการระบุรถยนต์รุ่นเดียวกันในภาพต่าง ในตอนนี้ฉันคิดว่าหนึ่งในอัลกอริธึมที่ดีที่สุดสำหรับการรับรู้วัตถุ 3 มิติคือ SIFT แต่หลังจากเล่นไปเรื่อย ๆ ด้วยการสาธิตฉันรู้สึกแปลกใจว่าอัลกอริทึมนี้มีปัญหาบางอย่างกับวัตถุโลหะมันวาวเช่นรถยนต์โดยเฉพาะอย่างยิ่ง ไม่มีใครรู้ว่างานบางอย่างในพื้นที่นี้โดยทั่วไปอัลกอริทึมที่เหมาะสมบางอย่างสำหรับงานในการค้นหารถรุ่นเดียวกันในภาพที่แตกต่างกันอย่างไร ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.