คุณจะสร้าง ROC curves สำหรับการตรวจสอบความถูกต้องแบบ cross-one-out ได้อย่างไร


10

เมื่อทำการตรวจสอบความถูกต้องไขว้ 5 เท่า (เช่น) เป็นเรื่องปกติที่จะคำนวณเส้นโค้ง ROC ที่แยกต่างหากสำหรับแต่ละ 5 เท่าและบ่อยครั้งที่เส้นโค้ง ROC เฉลี่ยกับ std dev แสดงเป็นความหนาของเส้นโค้ง

อย่างไรก็ตามสำหรับการข้ามการตรวจสอบความถูกต้องของ LOO ที่มีการทดสอบดาต้าพอยน์เพียงครั้งเดียวในแต่ละครั้งดูเหมือนจะไม่น่าสนใจที่จะคำนวณ ROC "โค้ง" สำหรับดาต้าพอยน์นี้

ฉันได้รับคะแนนข้อมูลการทดสอบทั้งหมดของฉัน (พร้อมกับค่า p ที่คำนวณแยกต่างหาก) และรวมพวกมันไว้ในชุดใหญ่ชุดหนึ่งเพื่อคำนวณเส้นโค้ง ROC เดียว แต่นี่เป็นสิ่งที่ควรทำเพื่อสถิติเชิงสถิติหรือไม่

วิธีที่ถูกต้องในการใช้การวิเคราะห์ ROC คือเมื่อจำนวนจุดข้อมูลในแต่ละเท่าเป็นหนึ่ง (เช่นในกรณีของการตรวจสอบข้าม LOO)


ทำไม? คุณต้องการทำอะไรกับสิ่งมีชีวิตเช่นนี้?

ฉันต้องวิเคราะห์ประสิทธิภาพการทำนายโดยรวมในช่วง p-value threshold และ ROC curves เป็นสิ่งที่ฉันใช้ในการตรวจสอบข้ามประเภทอื่นทุกประเภท ดังนั้นโดยทั่วไปเหตุผลเดียวกันที่การวิเคราะห์ ROC นั้นมีประโยชน์สำหรับการตรวจสอบความถูกต้องของ k-fold หากมีวิธีที่แตกต่างกันแบบอะนาล็อกสำหรับ LOO xval แล้วมันก็เป็นเรื่องที่น่ารู้ นอกจากนี้ฉันจะทำอะไรบางอย่างเช่น xval แบบ 10 เท่าหากฉันมีข้อมูลเพียงพอและนี่จะไม่เป็นปัญหา
user1121

1
ฉันจะบอกว่าคุณทำมันอย่างสมเหตุสมผลเพียงสร้างเส้นโค้ง ROC เดี่ยวโดยใช้ lable ที่แท้จริงและค่าที่คาดการณ์สำหรับแต่ละกรณี (กรณีที่ถูกระงับ)
B_Miner

คำตอบ:


15

ถ้าลักษณนามเอาท์พุทน่าจะเป็นแล้วรวมเอาจุดทดสอบทั้งหมดสำหรับโค้ง ROC เดียวที่เหมาะสม ถ้าไม่ให้ปรับขนาดเอาต์พุตของลักษณนามในลักษณะที่จะทำให้มันเปรียบโดยตรงข้ามลักษณนาม ตัวอย่างเช่นสมมติว่าคุณกำลังใช้การวิเคราะห์จำแนกเชิงเส้น ฝึกอบรมลักษณนามแล้วใส่ข้อมูลการฝึกอบรมผ่านลักษณนาม เรียนรู้สองน้ำหนัก: พารามิเตอร์ขนาดσ (ค่าเบี่ยงเบนมาตรฐานของเอาต์พุตลักษณนามหลังจากลบค่าเฉลี่ยของคลาส) และพารามิเตอร์ shift μ(ค่าเฉลี่ยของชั้นหนึ่ง) ใช้พารามิเตอร์เหล่านี้เพื่อทำให้วัตถุดิบเป็นปกติr เอาต์พุตของตัวแยกประเภท LDA แต่ละรายการผ่าน n=(rμ)/σและจากนั้นคุณสามารถสร้างเส้นโค้ง ROC จากชุดเอาต์พุตปกติ นี่เป็นข้อแม้ที่คุณประมาณค่าพารามิเตอร์มากขึ้นดังนั้นผลลัพธ์อาจเบี่ยงเบนไปเล็กน้อยกว่าถ้าคุณสร้างเส้นโค้ง ROC โดยใช้ชุดทดสอบแยกต่างหาก

ถ้ามันเป็นไปไม่ได้ที่จะทำให้ปกติลักษณนามเอาท์พุทหรือแปลงเป็นความน่าจะเป็นแล้วการวิเคราะห์ ROC จาก LOO-CV นั้นไม่เหมาะสม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.