การประเมินประสิทธิภาพของตัวแบบการถดถอยโดยใช้ชุดฝึกอบรมและชุดทดสอบ?


10

ฉันมักจะได้ยินเกี่ยวกับการประเมินประสิทธิภาพของรูปแบบการจำแนกประเภทโดยถือชุดทดสอบและฝึกอบรมแบบจำลองในชุดฝึกอบรม จากนั้นสร้างเวกเตอร์ 2 ตัวหนึ่งรายการสำหรับค่าที่คาดการณ์และอีกหนึ่งรายการสำหรับค่าจริง เห็นได้ชัดว่าการเปรียบเทียบช่วยให้ผู้ตัดสินประสิทธิภาพของแบบจำลองโดยใช้พลังการทำนายโดยใช้สิ่งต่าง ๆ เช่นคะแนน F, สถิติ Kappa, ความแม่นยำ & การเรียกคืน, เส้นโค้ง ROC เป็นต้น

สิ่งนี้เปรียบเทียบกับการประเมินการทำนายตัวเลขเช่นการถดถอยอย่างไร ฉันจะสมมติว่าคุณสามารถฝึกรูปแบบการถดถอยในชุดฝึกอบรมใช้เพื่อทำนายค่าจากนั้นเปรียบเทียบค่าที่ทำนายเหล่านี้กับค่าจริงที่อยู่ในชุดทดสอบ เห็นได้ชัดว่าการวัดประสิทธิภาพจะต้องแตกต่างกันเนื่องจากนี่ไม่ใช่งานจัดหมวดหมู่ สถิติทั่วไปและเหลือเป็นมาตรการที่ชัดเจน แต่มีวิธีที่ดีกว่า / ดีกว่าในการประเมินประสิทธิภาพสำหรับตัวแบบการถดถอยหรือไม่? ดูเหมือนว่าการจัดประเภทมีตัวเลือกมากมาย แต่การถดถอยถูกปล่อยไว้ที่และส่วนที่เหลือR2R2


1
ฉันไม่แน่ใจอย่างแน่นอนว่าคุณกำลังถามคำถามอะไร แต่ตัวชี้วัดข้อผิดพลาดที่ชัดเจนสำหรับตัวแบบการถดถอยที่มีเอาต์พุตต่อเนื่องคือ Mean Square error (MSE) ระหว่างเอาท์พุทโมเดลและตัวแปรผลลัพธ์
BGreene

ดังนั้นเพียงแค่ข้อผิดพลาดวัดระหว่างจริงและทำนาย
StatTime

ใช่ปรับให้เหมาะสมกับชุดฝึกอบรมและตรวจสอบความถูกต้องโดยใช้ชุดทดสอบ
BGreene

คำตอบ:


2

ตามที่ได้กล่าวไว้โดยทั่วไปจะใช้ค่าเฉลี่ยข้อผิดพลาดกำลังสอง คุณคำนวณรูปแบบการถดถอยของคุณตามชุดการฝึกอบรมของคุณและประเมินประสิทธิภาพโดยใช้ชุดทดสอบแยก (ชุดที่อินพุต x และเอาต์พุตที่คาดการณ์ที่รู้จัก y) โดยการคำนวณ MSE ระหว่างเอาต์พุตของชุดทดสอบ (y) และเอาต์พุตที่กำหนด โดย model (f (x)) สำหรับอินพุตที่ให้มาเหมือนกัน (x)

หรือคุณสามารถใช้ตัวชี้วัดต่อไปนี้: ข้อผิดพลาดค่าเฉลี่ยของรูทข้อผิดพลาด, ข้อผิดพลาดกำลังสองสัมพัทธ์, ข้อผิดพลาดสัมบูรณ์เฉลี่ย, ข้อผิดพลาดสัมบูรณ์สัมพัทธ์ ... (ถาม google เพื่อหาคำจำกัดความ)


คำตอบที่ดี. สิ่งเหล่านี้เกี่ยวข้องกับช่วงเวลาที่สองของการแจกแจง คุณสามารถดูผลรวมของความแตกต่างได้หากคุณพยายามกำจัดอคติหรือใช้ชุดค่าผสมใด ๆ ที่คุณต้องการ ตัวอย่างเช่นโดยที่ A และ B ถูกเลือกน้ำหนักสำหรับวิธีการให้คะแนนแต่ละวิธี จริงๆแล้วมันจะขึ้นอยู่กับปัจจัยที่มีความสำคัญต่อปัญหาเฉพาะของคุณ err=A(xxi)+B(xxi)2
Greg Petersen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.