คำถามติดแท็ก opencv

OpenCV (Open Source Computer Vision) เป็นไลบรารีข้ามแพลตฟอร์มของฟังก์ชันการเขียนโปรแกรมสำหรับการมองเห็นคอมพิวเตอร์แบบเรียลไทม์

7
การค้นหาช่องสี่เหลี่ยมในรูปภาพ
ฉันต้องการค้นหาสี่เหลี่ยมในรูปภาพโดยใช้ OpenCV (ไม่มีปัญหาใน MATLAB หรืออื่น ๆ โดยทั่วไปสิ่งที่ฉันคาดหวังคือความคิดบางอย่าง) พิจารณาภาพทดสอบด้านล่าง: ฉันต้องการค้นหาสี่เหลี่ยมสีเหล่านั้นในภาพด้านบนอย่างถูกต้อง (ไม่ใช่แถบยาวสีขาว) สิ่งที่ฉันได้ทำ: ฉันใช้วิธีการทั่วไป (ซึ่งมาพร้อมกับตัวอย่าง OpenCV) คือค้นหารูปทรงในระนาบสีทั้งหมดประมาณค่าและตรวจสอบจำนวนองค์ประกอบ = 4 มันทำงานเพื่อขยายบางส่วนที่ตรวจพบไม่กี่สี่เหลี่ยมโดยเฉพาะอย่างยิ่งที่มืด ขั้นตอนต่อไปที่ผมทำก็คือการทำนาย คือข้อตกลงนี้ได้รับการแก้ไข ดังนั้นหากได้รับบางอย่างฉันสามารถทำนายสิ่งที่เหลืออยู่ได้ มันยังทำงานเพื่อขยายเพิ่มเติม แต่ความแม่นยำนั้นแย่มาก แต่ฉันรู้สึกว่าการทำนายไม่ใช่วิธีที่ดีที่นี่และมันก็ไม่ได้ให้คำตอบที่ถูกต้องเสมอไปตามขั้นตอนแรก สิ่งที่ฉันต้องการ : 1) มีวิธีอื่นใดที่ดีกว่าในการตรวจสอบกำลังสองเหล่านี้อย่างแม่นยำมากขึ้น หรือหลายวิธี? จุดหนึ่งที่สำคัญก็คือว่าเวลาไม่ได้เป็นปัญหาที่นี่ อัลกอริทึมอาจช้ามันไม่สำคัญ แต่ความแม่นยำเป็นเกณฑ์สำคัญ บางครั้งภาพอาจเบลอมากขึ้น และหนึ่งในปัญหาสำคัญที่ฉันเผชิญคือสี่เหลี่ยมบางอันมีสีเกือบเหมือนกันกับพื้นหลัง (ตรวจสอบคอลัมน์ 3 คอลัมน์แรกและสี่เหลี่ยมที่สอง) กำลังมองหาแนวคิดขอบคุณล่วงหน้า อัปเดต: ด้านล่างเป็นผลลัพธ์ที่แม่นยำที่สุดที่ฉันได้รับ: แน่นอนภาพผลลัพธ์จะถูกปรับขนาดเล็กน้อย อัปเดต 2: ฉันได้รับคำตอบที่ดีกว่านี้ในคำตอบของฉันด้านล่าง: https://dsp.stackexchange.com/a/7526/818

1
คณิตศาสตร์ของการตรวจจับมุมของแฮร์ริส
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เนื่องจากสามารถตอบได้ในการประมวลผลสัญญาณ Stack Exchange อพยพ 7 ปีที่ผ่านมา นี่คือนิพจน์ทางคณิตศาสตร์สำหรับการตรวจจับมุมของแฮร์ริส: แต่ฉันมีข้อสงสัยดังต่อไปนี้: ความสำคัญทางกายภาพของและคืออะไร? อ้างอิงหลายคนบอกว่ามันเป็นเรื่องสำคัญโดยที่หน้าต่างขยับ หน้าต่างเลื่อนไปเท่าไหร่ หนึ่งพิกเซลหรือสองพิกเซลuuuvvvwww ผลรวมของตำแหน่งพิกเซลครอบคลุมโดยหน้าต่างหรือไม่ สมมติว่า ,คือความเข้มของพิกเซลเดียวที่หรือผลรวมของความเข้มภายในหน้าต่างด้วยจุดศูนย์กลางที่ ?w(x,y)=1w(x,y)=1w(x,y) = 1I(x,y)I(x,y)I(x,y)(x,y)(x,y)(x,y)(x,y)(x,y)(x,y) ตามที่วิกิพวกเขาบอกว่าภาพเป็น 2 มิติแสดงโดยฉันแล้วขอให้พิจารณาการปะภาพเหนือพื้นที่จากนั้นใช้สัญกรณ์(x,y)(x,y)(x,y)I(x,y)I(x,y)I(x,y) ฉันพบว่ามันสับสนที่จะเข้าใจคำอธิบายทางคณิตศาสตร์ ใครมีความคิด?

2
เหตุใดเราจึงใช้ตัวบอกคำสำคัญ
ฉันเพิ่งศึกษาเกี่ยวกับ SURF และฉันจะลงมือปฏิบัติ แต่ฉันก็ยังไม่เข้าใจว่าทำไมเราจึงใช้ตัวอธิบาย ฉันเข้าใจว่าประเด็นสำคัญคืออะไรและจุดประสงค์ของพวกเขา แต่เมื่อเราแยกจุดสำคัญออกไปกว่าเหตุใดเราจึงจำเป็นต้องใช้ตัวอธิบาย? ความสำคัญและบทบาทของพวกเขาในการรับรู้คืออะไร?

2
วิธีการจำการเรียงตัวหกเหลี่ยมในเกมกระดาน?
ฉันต้องการทราบขอบเขตของการเรียงต่อหกเหลี่ยมในภาพถ่ายเหมือนในภาพด้านล่าง: สำหรับฉันแล้วดูเหมือนว่าวิธีการมาตรฐานที่กริดสแควร์คือการตรวจจับมุม (เช่นแสนอร่อย) ก่อนแล้วจึงแยกเส้นที่ยาวที่สุดผ่านการแปลง Houghหรือสิ่งที่คล้ายกัน นี่ไม่ใช่วิธีที่ดีที่สุดในการปูกระเบื้องด้วยเลขฐานสิบหกเนื่องจากความยาวของเส้นด้านนอกสั้นกว่าและเป็นการยากที่จะแยกพวกมันออกจากเส้นอื่น มีอัลกอริธึมที่จะแก้ไขปัญหานี้หรือไม่? มันเป็นเรื่องดีที่จะมีทางออกใน opencv แต่ฉันก็สนใจในความคิดทั่วไป อัปเดต: ด้วย python และ opencv ฉันสามารถรับผลลัพธ์นี้ได้: นี่คือรหัสของฉัน: import cv2 import numpy as np imgOrig = "test1"; img = cv2.imread(imgOrig+".jpg"); lap = cv2.Laplacian(img, cv2.IPL_DEPTH_32F, ksize = 3) imgray = cv2.cvtColor(lap,cv2.COLOR_BGR2GRAY) ret,thresh = cv2.threshold(imgray,127,255,0) contours, hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_NONE) size = img.shape m …

4
การตรวจจับคนจากด้านบน
ฉันกำลังพยายามหาวิธีตรวจจับคนที่ใช้กล้องเพียงแค่ 3 เมตรเหนือพื้นดิน นี่คือเฟรมที่กล้องคืนมา: อัปเดต: การทดสอบวิดีโอ -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi ในการทำเช่นนั้นก่อนอื่นฉันต้องเข้าใจว่าฉันต้องทำการแบ่งส่วนหลังแบบพื้นหน้า นั่นคือส่วนที่ง่าย ด้วยหน้ากากเบื้องหน้าฉันสามารถทำงานง่ายๆเช่น Hough transform เพื่อค้นหาแวดวง แต่วิธีนี้ตรวจจับได้เพียง 60% ของหัวรวมถึงผลบวกที่ผิดพลาดมากมาย ฉันสามารถใช้เทคนิคง่ายๆอื่น ๆ เช่นการแบ่งส่วนสี แต่ฉันพบว่าคนหัวแตกต่างกันมากเห็นจากด้านบนเพราะทรงผมสีผมจำนวนของพวกเขา ... ตัวเลือกอื่นที่ฉันคิดไว้คือความเป็นไปได้ในการใช้ HOG Descriptors หรือคุณลักษณะที่คล้ายกับ Haar แต่ฉันต้องการฐานข้อมูลที่กว้างขวางของผู้คนที่เห็นจากด้านบนเพื่อฝึกฝนโมเดล ฉันไม่พบอะไรแบบนั้น ฉันคิดว่านี่จะเป็นปัญหาที่เกิดขึ้นอีกมาก แต่ฉันไม่สามารถพบได้มากในวรรณคดีหรืออินเทอร์เน็ต ความช่วยเหลือในการแก้ไขงานนี้จะได้รับการชื่นชม :-) ปรับปรุง: สำหรับข้อมูลเพิ่มเติมเป้าหมายคือการใช้วิธีการทั่วไปบางอย่างเพื่อให้การติดตามการเดินเท้า ต้นแบบตัวแรกจะถูกทดสอบใน Mall

4
ฉันจะรับการปรับเทียบกล้องที่แม่นยำที่สุดได้อย่างไร
ก่อนอื่นฉันหวังว่านี่เป็นบอร์ดการแลกเปลี่ยนที่ถูกต้อง ฉันขอโทษถ้ามันไม่ได้ ฉันกำลังทำงานกับสิ่งที่ต้องการให้ฉันปรับเทียบกล้อง ฉันใช้รหัสสำเร็จในการทำสิ่งนี้ใน OpenCV (C ++) ฉันกำลังใช้ฟังก์ชั่นกระดานหมากรุก inbuilt และกระดานหมากรุกที่ฉันพิมพ์ออกมาแล้ว มีบทเรียนมากมายบนอินเทอร์เน็ตที่ระบุมุมมองกระดานหมากรุกมากกว่าหนึ่งมุมมองและแยกมุมออกจากแต่ละเฟรม มีชุดมุมมองที่เหมาะสมที่สุดสำหรับฟังก์ชั่นเพื่อรับการปรับเทียบกล้องที่แม่นยำที่สุดหรือไม่? ส่งผลต่อความแม่นยำของการสอบเทียบคืออะไร ตัวอย่างเช่นถ้าฉันให้ภาพในมุมมองเดียวกัน 5 ภาพโดยไม่ย้ายอะไรเลยมันจะให้ผลลัพธ์ที่ตรงเมื่อฉันพยายามยกเลิกการซ่อนเว็บแคมของฟีด FYI สำหรับทุกคนที่เยี่ยมชม:ฉันเพิ่งค้นพบว่าคุณจะได้รับการสอบเทียบกล้องที่ดีกว่าโดยใช้ตารางวงกลมที่ไม่สมมาตรและฟังก์ชั่น OpenCV ที่เกี่ยวข้อง

6
ปัญหาการแบ่งส่วนภาพของวัสดุที่แตกต่าง
สวัสดีชุมชน CV / รูปแบบการรับรู้ ฉันมีปัญหาร้ายแรงเกี่ยวกับการแบ่งส่วนของรูปภาพ สถานการณ์เป็นบรรยากาศภายในเตาหลอมซึ่งทำให้หัวฉันเสียสติ และฉันต้องการตรวจจับวัตถุรูปทรงของวัสดุที่แตกต่างกัน (แก้ว, เซรามิก, อัล, ไออาร์ .. ) ในช่วงเวลาสั้น ๆ (<10 วินาที) และไม่ใช่แค่กรณีพิเศษอย่างเดียว ฉันยังต้องการเส้นชั้นความสูงในแถวพิกเซลต่อเนื่องเพื่อรับรหัส ดังนั้นจำเป็นต้องใช้รหัสลูกโซ่หรือที่เรียกว่าการติดตามเส้นขอบ / รูปร่างดังนั้นรูเปิดจึงไม่ดี ในพื้นหลังไม่ใช่เสียงเชิงเส้นประมาณฝุ่นอนุภาคหรืออย่างอื่นที่ปรากฏขึ้นเป็นครั้งคราว ยินดีต้อนรับข้อเสนอแนะ Matlab หรือ OpenCV เพื่อให้ชัดเจนยิ่งขึ้นฉันได้โพสต์ภาพเป้าหมายและวัตถุโปร่งใสครึ่งหนึ่งซึ่งต้องตรวจจับด้วย นอกจากนี้ยังมีตัวอย่างเพิ่มเติมที่ต้องระวัง อย่างที่คุณเห็นในภาพ # 1 มีอนุภาคอยู่ทางด้านขวาของภาพและใกล้กับรูปร่างชั้นนอกของดาวซึ่งเป็นวัตถุ ความคมชัดโดยรวมยังไม่ดีมาก วัตถุนั้นตั้งอยู่บนชั้นใต้ดินซึ่งไม่เกี่ยวข้องกับการตรวจจับเส้นชั้นความสูง รูปภาพ # 2 แสดงวัตถุแบบกึ่งโปร่งใสซึ่งเป็นไปได้เช่นกัน ฉันต้องการค้นหารูปร่าง / ขอบเขตของวัตถุนั้นเช่นบนหน้าจอถัดไป (เส้นสีแดง) สี่เหลี่ยมสองรูป (สีเหลือง) กำลังทำเครื่องหมายจุดเริ่มต้น (ซ้าย) และจุดสิ้นสุด (ขวา) เส้นสีฟ้านั้นไม่น่าสนใจ …

3
OpenCV / C ++ เชื่อมต่อรูปทรงใกล้เคียงตามระยะทางระหว่างพวกเขา
ฉันต้องเชื่อมต่อรูปทรงใกล้เคียงในภาพตามระยะห่างระหว่างพวกเขาซึ่งระบุว่าจะต้องเชื่อมต่อรูปทรงหรือไม่ ตอนนี้มีคำถามเกี่ยวกับปัญหาเดียวกันนี้แล้วที่นี่/programming/8973017/opencv-c-obj-c-connect-nearby-contoursแต่ที่นี่เขารวมรูปทรงทั้งหมดเป็นหนึ่งเดียว ฉันไม่ต้องการ ฉันไม่คิดว่ามีฟังก์ชั่นบางอย่างใน opencv สำหรับเรื่องนี้ แต่คุณสามารถแนะนำอัลกอริทึมสำหรับสิ่งนั้นได้ แอปพลิเคชันของฉันเป็นดังนี้: ฉันกำลังตรวจจับมือดังนั้นฉันจึงใช้อัลกอริธึมการตรวจจับผิวหนังเพื่อตรวจสอบพวกเขา แต่เนื่องจากผิวของฉันไม่ขาวและอาจเป็นเพราะสภาพแสงบางครั้งเส้นแบ่งที่ข้อศอก ดังนั้นฉันจึงต้องการให้รูปทรงใกล้เคียงเชื่อมต่อกัน แต่ไม่ใช่ทั้งหมด (เพราะทั้งสองมือของฉันจะอยู่ในรูปทรง) (ด้วยมือฉันหมายถึงจากไหล่ถึงต้นปาล์ม) ยิ่งกว่านั้นฉันคิดว่าการใช้การตรวจจับขอบบางอย่างฉันจะทำให้มือของฉันมีขอบเขตและตรวจสอบว่ามีการตรวจพบว่าแพทช์นี้ภายในขอบเขตนี้เป็นผิวหนังจากนั้นพื้นที่ทั้งหมดภายในขอบเขตนี้จะถูกตรวจพบเป็นผิวหนัง แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ส่วนหนึ่ง ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม. ขอบคุณล่วงหน้า ภาพตัวอย่าง: ในภาพนี้ฉันต้องการเชื่อมต่อจุดเชื่อมต่อ (การเชื่อมต่อ 8 จุด) ซึ่งน้อยกว่าความยาว 40 พิกเซลเพื่อบอกว่าฉันจะได้มือซ้ายของฉันเป็นรูปร่างเดียว เป้าหมายของฉันคือการได้รับรูปร่างของมือ (ฉันไม่สนใจเกี่ยวกับภูมิภาคอื่น ๆ )

3
จะคำนวณกล้องถ่ายรูปอย่างไรจาก Homography matrix
ว่าฉันใช้กล้องสอบเทียบเพียงหนึ่ง จากกล้องนี้ผมได้รับภาพ A และ B ฉันรู้ homography ระหว่าง A และ B ที่คำนวณผ่านOpenCV 's findHomography () ฉันรู้ว่าโพสท่า (เมทริกซ์การหมุน R และเวกเตอร์การแปล t) ของภาพ A และฉันต้องการรูปของบีเมื่อฉันได้รับมันฉันคิดว่าฉันจะสามารถคำนวณทุก ๆ ท่าของภาพต่อไปนี้ได้ คุณรู้หรือไม่ว่าการนำโพรเซสซิงของ B มาใช้? ฉันพบบทความหลายบทความบนเว็บ แต่ไม่พบวิธีแก้ปัญหาที่ใช้งานได้ง่าย ...

4
การแบ่งส่วนและการรับรู้ชื่อหนังสือและผู้แต่งจากภาพชั้นหนังสือ
ฉันพยายามเพื่อจุดประสงค์การเรียนรู้ของฉันเองเพื่อพัฒนาการใช้อัลกอริทึมที่จะเขียนรายการหนังสือโดยกำหนดภาพของชั้นวางหนังสือดังนี้ ขั้นตอนแรกคือการแบ่งภาพออกเป็นแต่ละเล่ม อัลกอริทึมของฉันในMathematicaคือ: img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"] ทำการตรวจจับขอบพื้นฐาน & ลบข้อความและพยายามรักษาความยาวบรรทัด edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5] จากนั้นลบเส้นแนวนอนที่ไม่พึงประสงค์ lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]] แม้ว่าผลลัพธ์จะน้อยกว่ามาก: คำถามของฉันคือ: ฉันจะปรับปรุงสิ่งนี้เพื่อให้ได้ผลลัพธ์ที่ดีขึ้นได้อย่างไร มีวิธีที่ฉลาดกว่านี้หรือไม่? ฉันควรประมวลผลรูปภาพเพิ่มเติมเพื่อเพิ่มความแม่นยำในระยะ OCR (ในภายหลัง) อย่างไร จะใช้ข้อมูลสีเพื่อปรับปรุงการแบ่งส่วนได้อย่างไร

2
การคำนวณ homography ตามบรรทัดที่ตรวจพบ
ฉันรู้ว่าคุณสามารถคำนวณ homographies จากภาพไปยังระนาบกล้องโดยใช้จุดการติดต่อระหว่าง "โมเดลที่สมบูรณ์แบบ" และจุดภาพ ฉันทำเพื่อสนามฟุตบอล / และใช้การตรวจจับขอบเพื่อค้นหาเส้นสีขาวในสนาม แต่กล้องไม่ได้ครอบคลุมทุกสนามดังนั้นฉันไม่สามารถมองเห็นมุมทั้งหมดได้และฉันมีเพียงมุมเท่านั้นที่เป็นที่รู้จัก 100% ในโมเดล (ไม่มีจุดที่แตกต่างอื่น ๆ ) ดังนั้นปัญหาก็คือถ้าหากเส้นตัดกับอีกเส้นหนึ่งและทำมุมฉันก็รู้จุดภาพของเส้นไม่ใช่พิกัด "เพอร์เฟ็ค / โลกแห่งความเป็นจริง" ที่สอดคล้องกันในโมเดล มีวิธีใดบ้างที่ฉันสามารถใช้บรรทัดที่ตรวจพบเพื่อคำนวณ homography หรือแม้แต่แค่ชุดของ homographies ที่มีผู้สมัครแม้ว่าเส้นที่ตรวจพบจะไม่ตัดกันและสร้างมุม? ภาพตัวอย่างการแสดงระดับเสียงมุมมองของเราและจุดที่ระดับเสียงซึ่งฉันสามารถทราบพิกัดโลก / โมเดลที่สอดคล้องกัน (วงกลมสีเขียว) และตัวอย่างของ 2 บรรทัดที่อาจไร้ประโยชน์อย่างสมบูรณ์ตั้งแต่ในมุมมองของเรา ฉันไม่มีเงื่อนงำตรงจุดที่พวกเขาเริ่มหรือหยุดในโลกแห่งความจริง / แบบจำลองของสนาม: เส้นสีแดงเป็นตัวอย่างของเส้นที่ฉันต้องการใช้ แต่ฉันไม่ทราบพิกัดของโลกแห่งความจริงและมันก็ยากที่จะประเมินเพราะมันขึ้นอยู่กับรูปแบบของกล้อง

4
การจับคู่เทมเพลตมาตราส่วนและการหมุน
ฉันกำลังมองหาวิธีการจับคู่แม่แบบที่คงที่และการหมุน ฉันได้ลองแล้วบางส่วน แต่พวกเขาก็ไม่ได้ผลดีนักสำหรับตัวอย่างของฉัน การตรวจจับคุณสมบัติ SIFT และ SURF ล้มเหลวโดยสิ้นเชิง ฉันยังพยายามใช้ฟังก์ชั่นการจับคู่เทมเพลต Log-Polar แต่ฉันไม่เคยทำเสร็จ (ไม่รู้วิธีการ) ในบทความเหล่านี้ (ที่แรกคือในเยอรมัน) http://cvpr.uni-muenster.de/teaching/ss08/seminarSS08/downloads/Wentker-Vortrag.pdf http://www.jprr.org/index.php/jprr/article/viewFile/355/148 ฉันอ่านเกี่ยวกับวิธีการนั้น การแมปพิกัดขั้วโลกทำงานได้ แต่ฉันไม่รู้ว่ามันถูกต้องหรือไม่ ภาพมีลักษณะเช่นนี้ source_log_polar.png http://www.shareimages.com/images/pics/0/0/3/62394-pZSfl5WenZysnpyVnKg-source_log_polar.png และหลังจากจับคู่ภาพทั้งสองนี้ด้วยฟังก์ชั่นการจับคู่เทมเพลตของ OpenCV ฉันก็ได้ผลลัพธ์นั้น ตอนนี้ฉันไม่ทำต่อไป แม่แบบของฉันเป็นสัญลักษณ์ง่าย ๆ ในการสร้างพิมพ์เขียวและพิมพ์เขียวเอง สัญลักษณ์อาจมีขนาดและทิศทางแตกต่างกัน เช่นพิมพ์เขียวอย่างง่ายของฉัน: และแม่แบบของฉัน ในตัวอย่างนี้มีเพียงหนึ่งเทมเพลต แต่ในพิมพ์เขียวมันควรจะค้นหาสิ่งที่เกิดขึ้นทั้งหมดแม้กระทั่งสิ่งที่มีขนาดและ / หรือทิศทาง ไม่มีใครมีวิธีการที่ฉันสามารถแก้ปัญหานี้ได้หรือไม่? แก้ไข: นอกเหนือจากแนวทางของ Andrey อัลกอริทึมการจับระยะทางสำหรับโปรไฟล์เรเดียล (ใช้ EmguCV) private float[] getRadialProfile( Image<Gray, byte> image, Point …

2
อัลกอริทึมการนับคนเดินเท้า
ขณะนี้ฉันกำลังพัฒนาโครงการเคาน์เตอร์คนเดินเท้า (ใช้ OpenCV + QT บน Linux) ความคิดของฉันเกี่ยวกับวิธีการคือ: เฟรมจับภาพ ทำการลบพื้นหลัง เสียงที่ชัดเจน (กร่อนขยาย) ค้นหา blobs (cvBlobslib) - วัตถุเบื้องหน้า สำหรับแต่ละหยดตั้งค่า ROI และค้นหาคนเดินเท้า (LBP ด้วย detectMultiScale) ใน blobs เหล่านี้ (เพื่อประสิทธิภาพที่ดีขึ้น) สำหรับคนเดินถนนที่พบแต่ละคนทำการค้นหาร่างกายส่วนบนที่ซ้อนกัน (ไม่แน่ใจ) (ความน่าเชื่อถือที่ดีขึ้น) หากพบคนเดินถนนเดียวกันบนเฟรมต่อเนื่อง (อาจมี 3-4 เฟรม) - เพิ่มพื้นที่นั้นไปที่เพลาลูกเบี้ยวและแทร็ก - ทำเครื่องหมายว่าเป็นคนเดินเท้า ยกเว้นพื้นที่การติดตามเพลาลูกเบี้ยวจากการตรวจจับหยดน้ำสำหรับเฟรมถัดไป หากคนเดินเท้าข้ามหมายเลขที่เพิ่มขึ้นบรรทัด ฉันต้องการตรวจสอบว่าฉันอยู่ในเส้นทางที่ถูกต้องหรือไม่ คุณมีข้อเสนอแนะเกี่ยวกับวิธีปรับปรุงวิธีการของฉันหรือไม่? หากใครบางคนทำงานในสิ่งที่คล้ายกันฉันจะขอบคุณเคล็ดลับที่มีประโยชน์ทรัพยากร (และการวิจารณ์) เกี่ยวกับปัญหานี้

1
กู้คืนส่วนโค้งจากการรวบรวมคะแนนที่มีเสียงดัง
พื้นหลัง: ฉันพยายามสร้างระบบที่ติดตามฟองอากาศจำนวนหนึ่งในวิดีโอ ฉันกำลังใช้การตรวจจับฟองในกรณีภาพเดียวโดยใช้การแปลงแบบ Hough เนื่องจากการบดเคี้ยวเบลอและปัจจัยอื่น ๆ การตรวจจับนี้จะไม่แม่นยำ 100% ฉันกำลังปรับขั้นตอนการตรวจจับสำหรับการเรียกคืนสูงอาจมีค่าใช้จ่ายของความแม่นยำ เมื่อดำเนินการเสร็จแล้วและนำไปใช้กับลำดับของเฟรมจากวิดีโอฉันจะมีจำนวนการตรวจจับที่สามารถกำหนดลักษณะเป็นจุดในพื้นที่ 4D - ตำแหน่ง x, ตำแหน่ง y, ตำแหน่งรัศมีและดัชนีเฟรม มีขั้นตอนที่สามารถกู้โค้งจากคลาวด์ 4D point นี้ได้หรือไม่?

2
ความแตกต่างระหว่างความแตกต่างของ Gaussian, Laplace of Gaussian และเวฟเวฟ Hat Mexican คืออะไร
มีสามเทคนิคที่ใช้ใน CV ที่ดูเหมือนกันมาก แต่มีความแตกต่างเล็กน้อยคือ: Laplacian แห่งเกาส์เซียน:∇2[ g( x , y, t ) ∗ f( x , y) ]∇2[g(x,y,t)∗f(x,y)]\nabla^2\left[g(x,y,t)\ast f(x,y)\right] ความแตกต่างของ Gaussians:[ g1( x , y, t ) ∗ f( x , y) ] - [ g2( x , y, t ) ∗ f( x , y) ][g1(x,y,t)∗f(x,y)]−[g2(x,y,t)∗f(x,y)] \left[g_1(x,y,t)\ast f(x,y)\right] - …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.