คำถามติดแท็ก image-recognition

9
อัลกอริทึมเพื่อเปรียบเทียบภาพสองภาพ
ไฟล์รูปภาพที่แตกต่างกันสองไฟล์ (ในรูปแบบที่ฉันเลือก) ฉันต้องเขียนโปรแกรมเพื่อทำนายโอกาสหากไฟล์นั้นเป็นสำเนาที่ผิดกฎหมายของไฟล์อื่น ผู้เขียนสำเนาอาจทำสิ่งต่าง ๆ เช่นหมุนหมุนลบหรือเพิ่มรายละเอียดเล็กน้อย (รวมถึงการเปลี่ยนมิติของภาพ) คุณรู้จักอัลกอริทึมในการทำงานประเภทนี้หรือไม่?

23
ข้อผิดพลาด: (-215)! empty () ในฟังก์ชัน detectMultiScale
ฉันพยายามเรียนรู้ cv2 ใน python 2.7 แต่เมื่อฉันเรียกใช้โค้ดในส่วนเฉพาะของมัน: face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml') eye_cascade = cv2.CascadeClassifier('haarcascade_eye.xml') img = cv2.imread('2015-05-27-191152.jpg') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) faces = face_cascade.detectMultiScale(gray, 1.3, 5) for (x,y,w,h) in faces: img = cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2) มันส่งคืนสิ่งนี้: File "face_detection.py", line 11, in <module> faces = face_cascade.detectMultiScale(gray, 1.3, 5) cv2.error: /home/arthurckl/Desktop/opencv-3.0.0-rc1/modules/objdetect/src/cascadedetect.cpp:1595: error: (-215) !empty() in function …

4
จะปรับปรุงการจดจำตัวเลขของแบบจำลองที่ได้รับการฝึกฝนเกี่ยวกับ MNIST ได้อย่างไร?
ฉันทำงานเกี่ยวกับการรับรู้ด้วยตัวเลขหลายหลักด้วยมือJavaโดยใช้OpenCVห้องสมุดสำหรับการประมวลผลล่วงหน้าและการแบ่งส่วนและKerasรูปแบบการฝึกอบรมเกี่ยวกับ MNIST (ด้วยความแม่นยำ 0.98) สำหรับการรับรู้ การรับรู้ดูเหมือนจะทำงานได้ค่อนข้างดีนอกเหนือจากสิ่งหนึ่ง เครือข่ายค่อนข้างบ่อยครั้งที่จะจำสิ่งที่ไม่ได้ (หมายเลข "หนึ่ง") ฉันไม่สามารถทราบได้ว่าเกิดขึ้นเนื่องจากการดำเนินการแบ่งเซกเมนต์ล่วงหน้า / ไม่ถูกต้องหรือหากเครือข่ายที่ได้รับการฝึกอบรมเกี่ยวกับ MNIST มาตรฐานเพิ่งไม่เห็นหมายเลขหนึ่งซึ่งดูเหมือนว่ากรณีทดสอบของฉัน นี่คือสิ่งที่ตัวเลขที่เป็นปัญหามีลักษณะเหมือนหลังการประมวลผลล่วงหน้าและการแบ่งส่วน: กลายเป็นและจัดเป็น4 กลายเป็นและจัดเป็น7 กลายเป็นและจัดเป็น 4และอื่น ๆ ... นี่เป็นสิ่งที่สามารถแก้ไขได้โดยการปรับปรุงกระบวนการแบ่งส่วนหรือไม่ หรือโดยการเพิ่มชุดฝึกอบรม แก้ไข: การปรับปรุงชุดฝึกอบรม (การเพิ่มข้อมูล) จะช่วยได้อย่างแน่นอนซึ่งฉันได้ทำการทดสอบแล้วคำถามของการประมวลผลที่ถูกต้องยังคงอยู่ การประมวลผลล่วงหน้าของฉันประกอบด้วยการปรับขนาดการแปลงเป็นโทนสีเทาการแปลงแบบสองทางการหมุนและการขยาย นี่คือรหัส: Mat resized = new Mat(); Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC); Mat grayscale = new Mat(); Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY); Mat …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.