จุดยึดอธิบาย
แองเคอ
ในขณะนั้นให้เพิกเฉยต่อคำศัพท์แฟนซีของ "ปิรามิดแห่งกล่องอ้างอิง" จุดยึดไม่ใช่อะไรนอกจากรูปสี่เหลี่ยมผืนผ้าขนาดคงที่เพื่อป้อนเข้าสู่เครือข่ายข้อเสนอภูมิภาค แองเคอร์ถูกกำหนดไว้ในแผนผังคุณสมบัติของ Convolutional ล่าสุดซึ่งหมายความว่ามีของพวกมัน แต่ตรงกับรูปภาพ สำหรับสมอแต่ละอัน RPN จะทำนายความน่าจะเป็นของการบรรจุวัตถุโดยทั่วไปและพิกัดการแก้ไขสี่ค่าเพื่อย้ายและปรับขนาดสมอให้อยู่ในตำแหน่งที่เหมาะสม แต่เรขาคณิตของแองเคอร์ต้องทำอะไรกับ RPN ได้อย่างไร (Hฉe a t u r e m a p* * * *Wฉe a t u r e m a p) ∗ ( k )
จุดยึดปรากฏขึ้นจริงในฟังก์ชันการสูญเสีย
เมื่อฝึกอบรม RPN อันดับแรกของคลาสฉลากจะถูกกำหนดให้กับแต่ละจุดยึด จุดยึดที่มีIntersection-over-Union ( IoU ) ทับซ้อนกันกับกล่องความจริงพื้นดินซึ่งสูงกว่าขีด จำกัด ที่กำหนดจะได้รับป้ายกำกับที่เป็นบวก (เช่นจุดยึดที่มี IoUs น้อยกว่าขีด จำกัด ที่กำหนด ป้ายเหล่านี้ถูกใช้เพื่อคำนวณฟังก์ชันการสูญเสียเพิ่มเติม:
พีคือผลลัพธ์การจัดประเภทหัวของ RPN ที่กำหนดความน่าจะเป็นของสมอที่มีวัตถุ สำหรับจุดยึดที่ติดป้ายว่าเป็นค่าลบจะไม่มีการสูญเสียใด ๆ เกิดขึ้นจากการถดถอย -ฉลากความจริงภาคพื้นดินเป็นศูนย์ กล่าวอีกนัยหนึ่งเครือข่ายไม่สนใจเกี่ยวกับพิกัดเอาท์พุทสำหรับจุดยึดเชิงลบและมีความสุขตราบใดที่มันจำแนกอย่างถูกต้อง ในกรณีของจุดยึดที่เป็นบวกจะพิจารณาการสูญเสียการถดถอย คือเอาท์พุทหัวถดถอยของ RPN เวกเตอร์ที่แสดงถึงพิกัด 4 พารามิเตอร์ของกล่องขอบเขตที่ทำนาย การกำหนดพารามิเตอร์ขึ้นอยู่กับเรขาคณิตของสมอและเป็นดังนี้:พี* * * *เสื้อ
โดยที่และ h แสดงถึงพิกัดกึ่งกลางของกล่องและความกว้างและความสูง ตัวแปรและสำหรับกล่องที่คาดการณ์กล่องยึดและกล่องภาคพื้นจริงตามลำดับ (เช่นเดียวกับ )x , y, w ,x ,xa,x* * * *Y, w , h
แจ้งให้ทราบถึงจุดยึดที่ไม่มีป้ายกำกับไม่ได้ถูกจัดประเภทหรือปรับเปลี่ยนใหม่และ RPM เพียงแค่โยนออกจากการคำนวณ เมื่องานของ RPN เสร็จสิ้นและมีการสร้างข้อเสนอส่วนที่เหลือจะคล้ายกับ Fast R-CNNs มาก