รูปภาพที่ไม่ใช่สี่เหลี่ยมสำหรับการจำแนกภาพ


9

ฉันมีชุดภาพกว้าง: 1760x128 ฉันได้อ่านทั้งแบบฝึกหัดและหนังสือแล้วและส่วนใหญ่ระบุว่าภาพอินพุตควรเป็นสี่เหลี่ยมจัตุรัสและหากไม่เป็นเช่นนั้นภาพเหล่านั้นจะถูกแปลงเป็นรูปสี่เหลี่ยมจัตุรัสเพื่อฝึกฝนในซีเอ็นเอ็น มีวิธีการฝึกอบรม cnn สำหรับภาพที่ไม่ใช่ตารางสี่เหลี่ยมหรือฉันควรมองหาตัวเลือกอื่นเป็นช่องว่างภายใน?

คำตอบ:


4

การแก้ไขปัญหามีหลายวิธีขึ้นอยู่กับตัวจําแนก การเลื่อน Windows เป็นวิธีที่ฉันคุ้นเคยมากที่สุดซึ่งใช้สำหรับวิธีโครงข่ายประสาทเทียม วิธีการนี้เกี่ยวข้องกับการถ่ายภาพย่อยขนาดเล็กและเลื่อนมันขึ้นและลงด้วยการซ้อนทับบางอย่าง ปัญหาบางอย่างรวมถึงการค้นหาพารามิเตอร์กะที่เหมาะสมและปัญหาหลายสเกล

การตรวจจับขั้นสุดท้ายมักจะถูกกำหนดโดยความมั่นใจของลักษณนามว่าแต่ละภาพย่อยอยู่ในชั้นเรียนนั้น: ตัวอย่างเช่นการลงคะแนนเสียงส่วนใหญ่ความน่าจะเป็นทั้งหมดหรือระยะทางรวมจากขอบเขตการตัดสินใจ ฉันได้แสดงรายการวัสดุด้านล่างแล้วสิ่งแรกคือสำหรับวิธีการจำแนกลักษณนาม HOG แต่แนวคิดเหมือนกัน

  1. การตรวจจับวัตถุเลื่อน Windows
  2. การตรวจจับหมวดหมู่วัตถุ: Windows บานเลื่อน
  3. OverFeat การรับรู้แบบบูรณาการการแปลและการตรวจสอบโดยใช้เครือข่าย Convolutional

2

นี่ไม่ควรทำให้เกิดปัญหาใด ๆ เลยถ้าคุณใช้ CNN ฉันสร้างซีเอ็นเอ็นเพื่อจดจำใบหน้าและเนื่องจากใบหน้ากว้างประมาณ 70% ตามปกติฉันใช้รูปภาพฝึกอบรมที่มีขนาด 80x100 พิกเซล (ความกว้างพิเศษเล็กน้อยในกรณีที่ศีรษะอยู่ในมุม) ตัวกรองของคุณยังควรเป็นสี่เหลี่ยม

การเปลี่ยนแปลงทั้งหมดนั้นจะเป็นตอนนี้คุณต้องติดตามความกว้างและความสูงสำหรับแผนที่การเปิดใช้งาน / การรวมกลุ่มของคุณแทนค่าเดียวที่บอกขนาดของคุณ ตัวอย่างเช่น -

ภาพอินพุตของ 80 x 100 ปรับใช้ตัวกรอง Convolution 5 x 5 ให้แผนที่ของการเปิดใช้งานที่ 76x96 ใช้การรวม 2 x 2 รวมถึงแผนที่ของการเปิดใช้งานแบบรวมที่ 38 x 48

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.