ความเป็นไปได้บางอย่างอยู่ในใจของฉัน
การดูอัตราการเข้าชมโดยรวมนั้นไม่ใช่ความคิดที่ดีนักเนื่องจากมันจะขึ้นอยู่กับองค์ประกอบของชุดทดสอบหากประสิทธิภาพของคลาสที่แตกต่างกัน อย่างน้อยที่สุดคุณควรระบุ (และปรับ) ความถี่สัมพัทธ์ของคลาสในข้อมูลการทดสอบของคุณเพื่อให้ได้ค่าที่มีความหมาย
ประการที่สองตามที่ @Shorack ได้กล่าวไปแล้วให้ระบุข้อผิดพลาดประเภทใดที่มีความสำคัญ บ่อยครั้งที่ตัวจําแนกต้องตรงตามเกณฑ์ประสิทธิภาพบางอย่างเพื่อให้มีประโยชน์ (และความแม่นยำโดยรวมนั้นไม่ค่อยมีการวัดที่เพียงพอ) มีมาตรการต่าง ๆ เช่นความไวความจำเพาะค่าความเชื่อมั่นในเชิงบวกและลบที่คำนึงถึงประเภทที่แตกต่างกันและการจำแนกประเภทที่แตกต่างกัน คุณสามารถพูดได้ว่ามาตรการเหล่านี้ตอบคำถามต่าง ๆ เกี่ยวกับตัวจําแนก:
- ความไว:ส่วนใดของกรณีที่เป็นของคลาส C จะถูกรับรู้เช่นนี้?
- ความจำเพาะ:ส่วนใดของกรณีที่ไม่ได้อยู่ในคลาส C จะได้รับการยอมรับเช่นนี้
- ค่าคาดคะเนในเชิงบวก:เมื่อตัวแยกประเภทคาดการณ์คลาส C ความน่าจะเป็นที่การทำนายนี้ถูกต้องคืออะไร
- ค่าการทำนายเชิงลบ:เนื่องจากลักษณนามคาดการณ์ว่ากรณีนี้ไม่ได้เป็นคลาส C ความน่าจะเป็นที่การทำนายนี้ถูกต้องคืออะไร?
คำถามเหล่านี้มักจะอนุญาตให้กำหนดข้อมูลจำเพาะที่ตัวจําแนกต้องต้องมีประโยชน์
ค่าการทำนายมักจะสำคัญกว่าจากมุมมองของการประยุกต์ใช้ตัวจําแนกในทางปฏิบัติ: พวกมันมีเงื่อนไขในการทำนายซึ่งเป็นสถานการณ์ที่คุณอยู่เมื่อใช้ classifer (ผู้ป่วยมักไม่สนใจที่จะรู้ว่า การทดสอบคือการรับรู้ถึงกรณีที่เป็นโรค แต่มีความเป็นไปได้ที่การวินิจฉัยดังกล่าวจะถูกต้อง) อย่างไรก็ตามในการคำนวณอย่างถูกต้องคุณจำเป็นต้องรู้ความถี่สัมพัทธ์ของคลาสที่แตกต่างกันในประชากรจึงใช้ตัวจําแนก (ดูเหมือนว่าคุณจะมีข้อมูลนี้ - ดังนั้นจึงไม่มีอะไรที่จะป้องกันไม่ให้คุณดู)
นอกจากนี้คุณยังสามารถดูข้อมูลที่ได้รับจากการทำนายผลบวกหรือลบได้ สิ่งนี้วัดจากอัตราส่วนความน่าจะเป็นบวกและลบ, LR⁺และLR⁻ พวกเขาบอกคุณสั้น ๆ ว่าการทำนายนั้นเปลี่ยนแปลงอัตราต่อรองของคำถาม (ดูคำตอบของฉันที่นี่สำหรับคำอธิบายรายละเอียดเพิ่มเติม)
สำหรับลักษณนามลวงตาของคุณสิ่งต่าง ๆ มีลักษณะดังนี้: ฉันจะใช้คลาส "0" เป็นคลาสที่มีปัญหาดังนั้น "บวก" หมายถึงคลาส "0" จาก 100 รายคาดว่าจะมี 100 รายการ (เป็นของคลาส 0) 97 ของพวกเขาทำจริง 3 ไม่ ความไวสำหรับคลาส 0 คือ 100% (ทั้ง 97 กรณีที่แท้จริงเป็นของคลาส 0 ได้รับการยอมรับ) ความจำเพาะคือ 0 (ไม่มีกรณีอื่นที่ไม่รู้จัก) ค่า predicitve เชิงบวก (สมมติว่าความถี่สัมพัทธ์เป็นตัวแทน 97: 3) คือ 97% ไม่สามารถคำนวณค่าการทำนายเชิงลบได้เนื่องจากไม่มีการทำนายเชิงลบเกิดขึ้น
LR+=ความไว1 - ความจำเพาะ= 1
LR-=1 - ความไวความจำเพาะ=00
ตอนนี้LR⁺และLR⁻เป็นปัจจัยที่คุณคูณอัตราต่อรองสำหรับกรณีที่เป็นของคลาสบวก ("0") การมีค่าLR⁺เท่ากับ 1หมายความว่าการคาดการณ์ในเชิงบวกไม่ได้ให้ข้อมูลใด ๆ กับคุณ: มันจะไม่เปลี่ยนอัตราต่อรอง ดังนั้นที่นี่คุณมีตัวชี้วัดที่ชัดเจนเป็นการแสดงออกถึงความจริงที่ว่าลักษณนามเล็กน้อยของคุณไม่ได้เพิ่มข้อมูลใด ๆ
ทิศทางของความคิดที่แตกต่างอย่างสิ้นเชิง: คุณพูดถึงว่าคุณต้องการประเมินตัวแยกประเภทที่แตกต่างกัน ฟังดูเหมือนการเปรียบเทียบหรือการเลือกลักษณนาม ข้อแม้ที่มีมาตรการที่ฉันพูดถึงข้างต้นคือพวกเขาอาจมีความไม่แน่นอนแบบสุ่มสูงมาก (หมายถึงคุณต้องการกรณีทดสอบจำนวนมาก ) หากคุณประเมินพวกเขาในฉลากระดับ "ยาก" หากการคาดการณ์ของคุณอย่างต่อเนื่องเป็นหลัก (ตัวชี้วัดเช่นความน่าจะเป็นหลัง) คุณสามารถใช้มาตรการที่เกี่ยวข้องที่ดูที่ชนิดเดียวกันของคำถาม แต่ไม่ได้ใช้เศษส่วนของกรณี แต่มาตรการอย่างต่อเนื่องดูที่นี่ สิ่งเหล่านี้จะเหมาะกว่าในการตรวจจับความแตกต่างเล็กน้อยในการทำนาย
(@FrankHarrell จะบอกคุณว่าคุณต้องการ "กฎการให้คะแนนที่เหมาะสม" ดังนั้นจึงเป็นคำค้นหาอีกคำหนึ่งที่ควรจดจำ)