เหตุใดจึงใช้คะแนน Normalized Gini แทน AUC เพื่อประเมินผล


14

การแข่งขันของ Kaggle การแข่งขันการทำนายความปลอดภัยอย่างปลอดภัยของ Porto Seguroใช้คะแนน Normalized Gini เป็นตัวชี้วัดการประเมินผลและสิ่งนี้ทำให้ฉันสงสัยเกี่ยวกับเหตุผลของการเลือกนี้ อะไรคือข้อดีของการใช้คะแนน gini ปกติแทนการวัดทั่วไปมากที่สุดเช่น AUC สำหรับการประเมิน?


1
เว็บไซต์ Kaggle เคยมีคำตอบนี้: "มีพื้นที่ที่สามารถทำได้สูงสุดสำหรับโมเดล" สมบูรณ์แบบ "เนื่องจากไม่มีตัวอย่างเชิงบวกทั้งหมดเกิดขึ้นทันทีเราใช้สัมประสิทธิ์ Gini ปกติโดยแบ่งค่าสัมประสิทธิ์ Gini ของแบบจำลองของคุณด้วยสัมประสิทธิ์ Gini ของโมเดลที่สมบูรณ์แบบ " แต่มันไม่สามารถใช้ได้อีกต่อไป webcache.googleusercontent.com/…
Sextus Empiricus

1
ดังนั้น gini เป็นเพียง auc ในระดับที่แตกต่างกัน หรือ auc และ gini ถูกนำไปใช้กับเส้นโค้งที่แตกต่างกัน? นั่นไม่ชัดเจนสำหรับฉันในฐานะที่ไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้ของเครื่อง คำถามไม่ชัดเจนเกี่ยวกับเรื่องนี้
Sextus Empiricus

คำตอบ:


3

ฉันเชื่อว่าคะแนน Gini เป็นเพียงการปรับโครงสร้างของ AUC: สำหรับเหตุผลที่ใช้สิ่งนี้แทน AUC ที่ใช้กันทั่วไปเหตุผลเดียวที่ฉันคิดได้ก็คือการคาดการณ์แบบสุ่มจะทำให้ Gini คะแนน 0 ซึ่งตรงข้ามกับ AUC ซึ่งจะเป็น 0.5

gini=2×AUC1

6
นอกจากนั้นการใช้สัมประสิทธิ์จินีตั้งค่าประสิทธิภาพของตัวจําแนกแบบสุ่มเป็นคะแนน 0 ... การปรับมาตรฐาน "ปรับปรุง" ปลายอีกด้านของสเกลและทําให้คะแนนของตัวจําแนกที่สมบูรณ์แบบเท่ากับ 1 AUC <1 การปรับปรุงนั้นสัมพันธ์กันโดยขึ้นอยู่กับว่าคุณคิดว่าสเกลที่ใช้งานง่ายขึ้นนั้นดีหรือไม่ แม้ว่าการตีความที่ง่ายกว่านี้คุณอาจโต้แย้งว่า (การทำให้เป็นมาตรฐาน) ปรับปรุงการวางนัยและการเปรียบเทียบชุดข้อมูลที่แตกต่างกัน
Sextus Empiricus

เหตุใด AUC ที่สามารถบรรลุค่าสูงสุดได้ต่ำกว่า 1 จึงไม่เห็นว่า gini ตั้งค่าเป็น 1 อย่างไร
rep_ho

ขึ้นอยู่กับชนิดของเส้นโค้งที่พวกเขาคำนวณค่าสัมประสิทธิ์จินี บางทีพวกเขาอาจใช้สิ่งที่แตกต่างจากเส้นโค้ง ROC (ซึ่งค่า AUC สูงสุดจะเท่ากับ 1) เมื่อพิจารณาจากคำศัพท์บนเว็บไซต์ kaggle ดูเหมือนว่าค่าสูงสุด AUC ไม่ใช่ 1:> "จากนั้นเราย้ายจากซ้ายไปขวาถามว่า" ในข้อมูล x% ซ้ายสุดคุณสะสมคำตอบสะสมเท่าไร? "
Sextus Empiricus

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.