สมมติว่าแบบจำลองของคุณทำนายว่า A มีโอกาส 40% และ B มีโอกาส 60% ในบางกรณีคุณอาจต้องการแปลงเป็นหมวดหมู่ที่ B จะเกิดขึ้น (เนื่องจากมีแนวโน้มมากกว่า A) เมื่อแปลงเป็นการจัดหมวดหมู่แล้วการทำนายทุกอย่างจะถูกหรือผิดและมีวิธีที่น่าสนใจมากมายในการนับคำตอบที่ถูกและผิด หนึ่งคือความถูกต้องตรง (เปอร์เซ็นต์ของคำตอบที่ถูกต้อง) อื่น ๆ รวมถึงความแม่นยำและการเรียกคืนหรือF-วัด เป็นคนอื่นได้กล่าวถึงคุณอาจต้องการที่จะมองไปที่เส้นโค้ง ROC นอกจากนี้บริบทของคุณอาจมีเมทริกซ์ค่าใช้จ่ายเฉพาะที่ให้รางวัลผลบวกที่แท้จริงแตกต่างจากเชิงลบที่แท้จริงและ / หรือลงโทษผลบวกปลอมต่างจากเชิงลบที่ผิด
อย่างไรก็ตามฉันไม่คิดว่านั่นคือสิ่งที่คุณกำลังมองหา หากคุณบอกว่า B มีโอกาสเกิดขึ้น 60% และฉันบอกว่ามีโอกาสเกิดขึ้น 99% เรามีการคาดการณ์ที่แตกต่างกันมากถึงแม้ว่าพวกเขาทั้งคู่จะถูกแมปไปยัง B ในระบบการจำแนกประเภทที่เรียบง่าย หากเกิดขึ้นแทนคุณเป็นคนผิดในขณะที่ฉันผิดมากดังนั้นฉันหวังว่าฉันจะได้รับโทษที่แข็งกว่าคุณ เมื่อแบบจำลองของคุณสร้างความน่าจะเป็นจริงกฎการให้คะแนนเป็นตัวชี้วัดประสิทธิภาพของการทำนายความน่าจะเป็นของคุณ โดยเฉพาะอย่างยิ่งคุณอาจต้องการกฎการให้คะแนนที่เหมาะสมซึ่งหมายความว่าคะแนนนั้นได้รับการปรับให้เหมาะสมสำหรับผลลัพธ์ที่ได้รับการสอบเทียบแล้ว
BS=1N∑t=1N(ft−ot)2
ftot
แน่นอนว่าประเภทของกฎการให้คะแนนที่คุณเลือกอาจขึ้นอยู่กับประเภทของเหตุการณ์ที่คุณพยายามทำนาย อย่างไรก็ตามสิ่งนี้ควรให้ความคิดแก่คุณในการค้นคว้าเพิ่มเติม
ฉันจะเพิ่มข้อแม้ที่ไม่คำนึงถึงสิ่งที่คุณทำเมื่อประเมินโมเดลของคุณด้วยวิธีนี้ฉันขอแนะนำให้คุณดูตัวชี้วัดของคุณจากข้อมูลตัวอย่างนอก (นั่นคือข้อมูลที่ไม่ได้ใช้ในการสร้างแบบจำลองของคุณ) ซึ่งสามารถทำได้ผ่านการตรวจสอบข้าม บางทีคุณสามารถสร้างแบบจำลองของคุณได้ง่ายขึ้นในชุดข้อมูลหนึ่งจากนั้นประเมินอีกชุดหนึ่ง (โปรดระวังอย่าให้การอนุมานจากการรั่วไหลของตัวอย่างที่ไม่อยู่ในตัวอย่างในการสร้างแบบจำลองในตัวอย่าง)