เหตุใดจึงใช้คะแนน Normalized Gini แทน AUC เพื่อประเมินผล

การแข่งขันของ Kaggle การแข่งขันการทำนายความปลอดภัยอย่างปลอดภัยของ Porto Seguroใช้คะแนน Normalized Gini เป็นตัวชี้วัดการประเมินผลและสิ่งนี้ทำให้ฉันสงสัยเกี่ยวกับเหตุผลของการเลือกนี้ อะไรคือข้อดีของการใช้คะแนน gini ปกติแทนการวัดทั่วไปมากที่สุดเช่น AUC สำหรับการประเมิน?

— Xboard
แหล่งที่มา

เว็บไซต์ Kaggle เคยมีคำตอบนี้: "มีพื้นที่ที่สามารถทำได้สูงสุดสำหรับโมเดล" สมบูรณ์แบบ "เนื่องจากไม่มีตัวอย่างเชิงบวกทั้งหมดเกิดขึ้นทันทีเราใช้สัมประสิทธิ์ Gini ปกติโดยแบ่งค่าสัมประสิทธิ์ Gini ของแบบจำลองของคุณด้วยสัมประสิทธิ์ Gini ของโมเดลที่สมบูรณ์แบบ " แต่มันไม่สามารถใช้ได้อีกต่อไป webcache.googleusercontent.com/…

— Sextus Empiricus

ดังนั้น gini เป็นเพียง auc ในระดับที่แตกต่างกัน หรือ auc และ gini ถูกนำไปใช้กับเส้นโค้งที่แตกต่างกัน? นั่นไม่ชัดเจนสำหรับฉันในฐานะที่ไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้ของเครื่อง คำถามไม่ชัดเจนเกี่ยวกับเรื่องนี้

— Sextus Empiricus

ฉันเชื่อว่าคะแนน Gini เป็นเพียงการปรับโครงสร้างของ AUC: สำหรับเหตุผลที่ใช้สิ่งนี้แทน AUC ที่ใช้กันทั่วไปเหตุผลเดียวที่ฉันคิดได้ก็คือการคาดการณ์แบบสุ่มจะทำให้ Gini คะแนน 0 ซึ่งตรงข้ามกับ AUC ซึ่งจะเป็น 0.5

g i n i = 2 \times A U C - 1

$gini = 2 \times AUC -1$

— มิเกล
แหล่งที่มา

นอกจากนั้นการใช้สัมประสิทธิ์จินีตั้งค่าประสิทธิภาพของตัวจําแนกแบบสุ่มเป็นคะแนน 0 ... การปรับมาตรฐาน "ปรับปรุง" ปลายอีกด้านของสเกลและทําให้คะแนนของตัวจําแนกที่สมบูรณ์แบบเท่ากับ 1 AUC <1 การปรับปรุงนั้นสัมพันธ์กันโดยขึ้นอยู่กับว่าคุณคิดว่าสเกลที่ใช้งานง่ายขึ้นนั้นดีหรือไม่ แม้ว่าการตีความที่ง่ายกว่านี้คุณอาจโต้แย้งว่า (การทำให้เป็นมาตรฐาน) ปรับปรุงการวางนัยและการเปรียบเทียบชุดข้อมูลที่แตกต่างกัน

— Sextus Empiricus

เหตุใด AUC ที่สามารถบรรลุค่าสูงสุดได้ต่ำกว่า 1 จึงไม่เห็นว่า gini ตั้งค่าเป็น 1 อย่างไร

— rep_ho

ขึ้นอยู่กับชนิดของเส้นโค้งที่พวกเขาคำนวณค่าสัมประสิทธิ์จินี บางทีพวกเขาอาจใช้สิ่งที่แตกต่างจากเส้นโค้ง ROC (ซึ่งค่า AUC สูงสุดจะเท่ากับ 1) เมื่อพิจารณาจากคำศัพท์บนเว็บไซต์ kaggle ดูเหมือนว่าค่าสูงสุด AUC ไม่ใช่ 1:> "จากนั้นเราย้ายจากซ้ายไปขวาถามว่า" ในข้อมูล x% ซ้ายสุดคุณสะสมคำตอบสะสมเท่าไร? "

— Sextus Empiricus

ตัวอย่าง: bayesserver.com/docs/charts/lift-chart

— Sextus Empiricus