เหตุผลหนึ่งที่น่าสนใจสำหรับการใช้ข้ามเอนโทรปีมากกว่าค่าสัมประสิทธิ์ลูกเต๋าหรือตัวชี้วัด IoU ที่คล้ายกันคือการไล่ระดับสีนั้นดีกว่า
การไล่ระดับสีของการข้ามเอนโทรปี wrt logits เป็นบางสิ่งเช่นโดยที่คือเอาต์พุต softmax และคือเป้าหมาย ในขณะเดียวกันถ้าเราพยายามเขียนค่าสัมประสิทธิ์ลูกเต๋าในรูปแบบ differentiable:หรือผลการไล่ระดับสีของ wrtนั้นน่าเกลียดมาก :และ2} เป็นเรื่องง่ายที่จะจินตนาการถึงกรณีที่ทั้งและมีขนาดเล็กและการไล่ระดับสีทำให้เกิดมูลค่ามหาศาล โดยทั่วไปดูเหมือนว่าการฝึกอบรมจะไม่แน่นอนมากขึ้นp - tพีเสื้อ2 พีทีพี2+ t22 พีทีp + tพี2 ตัน2( p + t )22 t ( t2- หน้า2)(หน้า2+t2)2พีเสื้อ
เหตุผลหลักที่ผู้คนพยายามใช้สัมประสิทธิ์ลูกเต๋าหรือ IoU โดยตรงก็คือเป้าหมายที่แท้จริงคือการเพิ่มประสิทธิภาพของตัวชี้วัดเหล่านั้นและการข้ามเอนโทรปีเป็นเพียงพร็อกซีที่ง่ายต่อการเพิ่มการใช้แบ็คแพ็ค นอกจากนี้ค่าสัมประสิทธิ์ลูกเต๋าจะทำงานได้ดีขึ้นในปัญหาความไม่สมดุลของคลาสโดยการออกแบบ:
อย่างไรก็ตามความไม่สมดุลของคลาสมักจะได้รับการดูแลอย่างง่าย ๆ โดยการกำหนดตัวคูณการสูญเสียให้กับแต่ละชั้นเรียนเช่นเครือข่ายนั้นมีความสับสนอย่างมากที่จะเพิกเฉยต่อชั้นเรียนที่ปรากฏขึ้นไม่บ่อยนักดังนั้นจึงไม่มีความชัดเจนว่า
ฉันจะเริ่มต้นด้วยการสูญเสียข้ามเอนโทรปีซึ่งดูเหมือนว่าจะเป็นการสูญเสียมาตรฐานสำหรับเครือข่ายการแบ่งส่วนการฝึกอบรมเว้นแต่จะมีเหตุผลที่น่าสนใจจริงๆที่จะใช้สัมประสิทธิ์ Dice