ในการสร้างเส้นโค้ง ROC (= ตัวรับลักษณะการทำงานของเครื่องรับ):
สมมติว่าเรามีความน่าจะเป็นลักษณนามของไบนารีเช่นการถดถอยโลจิสติก ก่อนที่จะนำเสนอเส้นโค้ง ROC แนวคิดของเมทริกซ์ความสับสนจะต้องเข้าใจ เมื่อเราทำการทำนายแบบไบนารีอาจมีข้อผิดพลาดได้ 4 ประเภท:
- เราคาดการณ์ 0 ในขณะที่เราควรให้คลาสเป็นจริง 0: สิ่งนี้เรียกว่าTrue Negativeนั่นคือเราคาดการณ์อย่างถูกต้องว่าคลาสนั้นเป็นลบ (0) ตัวอย่างเช่นโปรแกรมป้องกันไวรัสไม่พบไฟล์ที่ไม่เป็นอันตรายเป็นไวรัส
- เราคาดการณ์ 0 ในขณะที่เราควรให้คลาสเป็นจริง 1: สิ่งนี้เรียกว่าการลบเท็จนั่นคือเราคาดการณ์อย่างไม่ถูกต้องว่าคลาสนั้นเป็นลบ (0) ตัวอย่างเช่นโปรแกรมป้องกันไวรัสไม่สามารถตรวจจับไวรัสได้
- เราคาดการณ์ 1 ในขณะที่เราควรให้คลาสเป็นจริง 0: สิ่งนี้เรียกว่า " Positive Positive " นั่นคือเราคาดการณ์อย่างผิด ๆ ว่าคลาสนั้นเป็นบวก (1) ตัวอย่างเช่นแอนติไวรัสถือว่าไฟล์ที่ไม่เป็นอันตรายนั้นเป็นไวรัส
- เราคาดการณ์ 1 ในขณะที่เราควรให้คลาสเป็นจริง 1: สิ่งนี้เรียกว่าTrue Positiveนั่นคือเราคาดการณ์อย่างถูกต้องว่าคลาสนั้นเป็นบวก (1) ตัวอย่างเช่นโปรแกรมป้องกันไวรัสตรวจพบไวรัสอย่างถูกต้อง
ในการรับเมทริกซ์ความสับสนเราจะทำการคาดการณ์ทั้งหมดโดยตัวแบบและนับจำนวนข้อผิดพลาดทั้งสี่ประเภทที่เกิดขึ้น:
ในตัวอย่างของเมทริกซ์ความสับสนนี้ในบรรดา 50 data data ที่ได้รับการจัดประเภทนั้น 45 จำแนกอย่างถูกต้องและ 5 ถูกจำแนกผิด
เนื่องจากเพื่อเปรียบเทียบแบบจำลองที่แตกต่างกันสองแบบมันมักจะสะดวกกว่าที่จะมีตัวชี้วัดเดียวมากกว่าตัวแบบหลายตัวเราจึงคำนวณตัวชี้วัดสองตัวจากเมทริกซ์ความสับสนซึ่งเราจะรวมกันเป็นหนึ่ง:
- TPTP+FN
- FPFP+TN
0.00;0.01,0.02,…,1.00
ในรูปนี้พื้นที่สีน้ำเงินตรงกับพื้นที่ภายใต้โค้งของลักษณะการดำเนินงานของเครื่องรับ (AUROC) เส้นประในแนวทแยงเรานำเสนอเส้นโค้ง ROC ของตัวทำนายแบบสุ่ม: มันมี AUROC 0.5 ตัวทำนายแบบสุ่มมักใช้เป็นพื้นฐานเพื่อดูว่าแบบจำลองนั้นมีประโยชน์หรือไม่
หากคุณต้องการได้รับประสบการณ์โดยตรง: