คำอธิบายที่ใช้งานง่ายของ logloss


10

ในการแข่งขันหลายต่อรองคะแนนอยู่บนพื้นฐานของ "logloss" เรื่องนี้เกี่ยวข้องกับข้อผิดพลาดการจัดหมวดหมู่

นี่คือคำตอบทางเทคนิคแต่ฉันกำลังมองหาคำตอบที่ใช้งานง่าย ฉันชอบคำตอบสำหรับคำถามนี้เกี่ยวกับระยะทาง Mahalanobis แต่ PCA ไม่ใช่ logloss

ฉันสามารถใช้ค่าที่ซอฟต์แวร์การจำแนกประเภทออกมา แต่ฉันไม่เข้าใจจริงๆ ทำไมเราใช้มันแทนที่จะเป็นอัตราบวก / ลบจริง / เท็จ? คุณช่วยฉันได้ไหมเพื่อที่ฉันจะสามารถอธิบายเรื่องนี้กับคุณยายหรือมือใหม่ในสนามได้?

ฉันชอบและเห็นด้วยกับคำพูด:

คุณไม่เข้าใจอะไรจริงๆเว้นแต่คุณจะสามารถอธิบายให้คุณยายของคุณได้
- อัลเบิร์ตไอน์สไตน์

ฉันพยายามตอบคำถามนี้ด้วยตัวเองก่อนโพสต์ที่นี่

ลิงก์ที่ฉันไม่พบว่าใช้งานง่ายหรือมีประโยชน์จริงๆ ได้แก่ :

เหล่านี้เป็นข้อมูลและถูกต้อง มีไว้สำหรับผู้ชมด้านเทคนิค พวกเขาไม่ได้วาดภาพอย่างง่ายหรือให้ตัวอย่างที่ง่ายและเข้าถึงได้ พวกเขาไม่ได้เขียนถึงคุณยายของฉัน


คุณไม่ได้ให้ลิงก์ไปยังคำตอบทางเทคนิคของคุณ
bdeonovic


@ EhsanM.Kermani - ฉันไม่พบสิ่งเหล่านั้นที่เข้าใจง่ายเหมือน Mahalanobis ที่ฉันอ้างถึง
EngrStudent

1
รายการบนเว็บไซต์ kaggleให้คำอธิบายที่กระชับสวย logloss
bdeonovic

พบลิงค์นี้: exegetic.biz/blog/2015/12/making-sense-logarithmic-loss อาจช่วยได้
Deolu

คำตอบ:


8

Logloss เป็นลอการิทึมของผลิตภัณฑ์ของความน่าจะเป็นทั้งหมด สมมติว่าอลิซคาดการณ์:

  • ด้วยความน่าจะเป็น 0.2 จอห์นจะฆ่าแจ็ค
  • ด้วยความน่าจะเป็น 0.001 แมรี่จะแต่งงานกับจอห์น
  • ด้วยความน่าจะเป็น 0.01 บิลเป็นฆาตกร

ปรากฎว่าแมรี่ไม่ได้แต่งงานกับจอห์นบิลไม่ใช่ฆาตกร แต่จอห์นฆ่าแจ็ค ผลิตภัณฑ์ของความน่าจะเป็นที่อ้างอิงกับ Alice คือ 0.2 * 0.999 * 0.99 = 0.197802

บ๊อบทำนาย:

  • ด้วยความน่าจะเป็น 0.5 จอห์นจะฆ่าแจ็ค
  • ด้วยความน่าจะเป็น 0.5 แมรี่จะแต่งงานกับจอห์น
  • ด้วยความน่าจะเป็น 0.5 บิลเป็นฆาตกร

ผลิตภัณฑ์นี้คือ 0.5 * 0.5 * 0.5 = 0.125

อลิซเป็นผู้ทำนายที่ดีกว่าบ๊อบ


เหตุใด "ผลิตภัณฑ์ของความน่าจะเป็นทั้งหมด" จึงใช้งานได้ สิ่งนี้ฟังดูเหมือนเป็นญาติของการเพิ่มความคาดหวังสูงสุด
EngrStudent

3
คุณต้องการหลักฐานที่เป็นทางการหรือไม่? มันอยู่ใน "คำตอบทางเทคนิค" ที่กล่าวถึงโดย topicstarter คุณต้องการเหตุผล "ยาย" ไม่เป็นทางการทำไม? คุณพูดว่า: สมมุติว่าคนนี้ทำนายถูกต้อง ความน่าจะเป็นที่ทุกสิ่งเกิดขึ้นเมื่อมันเกิดขึ้นจริง ๆ ? นี่คือผลคูณของความน่าจะเป็น
user31264

"ผลิตภัณฑ์ที่น่าจะเป็น" ไม่ใช่ "คุณยาย" บันทึกของผลิตภัณฑ์ที่น่าจะเป็นผลรวมของความน่าจะเป็นบันทึกซึ่งพวกเขาใช้ในการเพิ่มความคาดหวังและเรียกว่า "ความคาดหวัง" ฉันคิดว่ามันถูกเข้ารหัสด้วยใน KL divergence ... ฉันคิดว่าในการพูดคุยกับคุณยายคุณสามารถพูดว่า "" น่าจะเป็นไปได้มากที่สุด "= ความน่าจะเป็นโดยรวมสูงสุดของหลายเหตุการณ์มีสองได้รับ" สูงสุด ": 1) เพิ่มความน่าจะเป็นรวมกันหรือ 2) การเรียนรู้ชอบ "การไล่ระดับสีไล่ระดับ" หรือลดความเลวร้ายการสูญเสียบันทึกคือความน่าจะเป็นเชิงลบที่ปรับขนาดตามขนาดตัวอย่างและลดลง
EngrStudent

พวกเขาลิงค์ที่นี่ว่า "exp (-loss) คือความน่าจะเป็นโดยเฉลี่ยของการทำนายที่ถูกต้อง"
EngrStudent

ผมชอบเตะบิชอปที่นี่ เป็นสมการ 4.108 และเป็นฟังก์ชันข้อผิดพลาดข้ามเอนโทรปี
EngrStudent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.