ฉันอ่านเอกสารจำนวนมากเกี่ยวกับการตรวจจับวัตถุการจดจำวัตถุการแบ่งกลุ่มวัตถุการแบ่งส่วนภาพและการแบ่งส่วนภาพความหมายและนี่คือข้อสรุปของฉันซึ่งอาจไม่เป็นความจริง:
การรับรู้วัตถุ: ในภาพที่กำหนดคุณจะต้องตรวจจับวัตถุทั้งหมด (คลาสของวัตถุที่ถูก จำกัด ขึ้นอยู่กับชุดข้อมูลของคุณ) ทำการแปลพวกมันด้วยกล่องที่มีขอบเขตและฉลากที่มีกล่องป้ายกำกับ ในภาพด้านล่างคุณจะเห็นผลลัพธ์ที่เรียบง่ายของการจดจำวัตถุล้ำสมัย
การตรวจจับวัตถุ: มันเหมือนกับการรับรู้วัตถุ แต่ในงานนี้คุณมีการจำแนกวัตถุเพียงสองระดับซึ่งหมายถึงกล่องขอบวัตถุและกล่องขอบวัตถุที่ไม่ใช่ ตัวอย่างเช่นการตรวจจับรถยนต์: คุณต้องตรวจจับรถยนต์ทุกคันในภาพที่กำหนดพร้อมกล่องที่มีขอบเขต
การแบ่งส่วนวัตถุ: เช่นเดียวกับการรับรู้วัตถุคุณจะรับรู้วัตถุทั้งหมดในภาพ แต่เอาท์พุทของคุณควรแสดงวัตถุนี้จำแนกพิกเซลของภาพ
การแบ่งส่วนภาพ: ในการแบ่งส่วนภาพคุณจะแบ่งส่วนภูมิภาคของภาพ ผลลัพธ์ของคุณจะไม่ติดป้ายกลุ่มและภูมิภาคของภาพที่สอดคล้องกันควรอยู่ในส่วนเดียวกัน การแยกพิกเซลพิเศษออกจากภาพเป็นตัวอย่างของงานนี้หรือการแบ่งส่วนหน้า - หลัง
การแบ่งส่วนแบบความหมาย: ในการแบ่งส่วนแบบความหมายคุณจะต้องติดป้ายแต่ละพิกเซลด้วยคลาสของวัตถุ (รถยนต์, บุคคล, สุนัข, ... ) และไม่ใช่วัตถุ (น้ำ, ท้องฟ้า, ถนน, ... ) คำอื่น ๆ ใน Semantic Segmentation คุณจะติดเลเบลแต่ละพื้นที่ของภาพ