วิธีที่สามถูกต้อง ทำไมมีรายละเอียดที่ยอดเยี่ยมอย่างแน่นอนในองค์ประกอบของการเรียนรู้ทางสถิติดูหัวข้อ "การตรวจสอบข้ามที่ผิดและถูกต้อง" และในบทสุดท้ายของการเรียนรู้จากข้อมูลในตัวอย่างตลาดหุ้น
โดยพื้นฐานแล้วขั้นตอนที่ 1 และ 2 ข้อมูลการรั่วไหลเกี่ยวกับการตอบสนองหรือจากอนาคตจากข้อมูลที่คุณตั้งไว้ในการฝึกอบรมหรือการประเมินผลของแบบจำลองของคุณ สิ่งนี้อาจทำให้มีอคติในแง่ดีในการประเมินโมเดลของคุณ
แนวคิดในการตรวจสอบแบบจำลองคือการเลียนแบบสถานการณ์ที่คุณจะต้องทำเมื่อแบบจำลองของคุณกำลังตัดสินใจผลิตเมื่อคุณไม่สามารถเข้าถึงการตอบสนองที่แท้จริง ผลที่ตามมาคือคุณไม่สามารถใช้การตอบสนองในชุดทดสอบเพื่ออะไรก็ได้ยกเว้นการเปรียบเทียบกับค่าที่คาดการณ์ของคุณ
อีกวิธีในการเข้าถึงคือการจินตนาการว่าคุณสามารถเข้าถึงจุดข้อมูลเดียวจากการระงับการใช้งานของคุณในแต่ละครั้ง (สถานการณ์ทั่วไปสำหรับโมเดลการผลิต) อะไรก็ตามที่คุณไม่สามารถทำได้ภายใต้สมมติฐานนี้คุณควรสงสัยอย่างยิ่ง เห็นได้ชัดว่าสิ่งหนึ่งที่คุณไม่สามารถทำได้คือรวมจุดข้อมูลใหม่ทั้งหมดในอดีตและอนาคตเพื่อทำให้การผลิตข้อมูลของคุณเป็นปกติ - ดังนั้นการทำแบบเดียวกันสำหรับการตรวจสอบแบบจำลองนั้นไม่ถูกต้อง
คุณไม่ต้องกังวลเกี่ยวกับค่าเฉลี่ยของชุดการทดสอบของคุณที่ไม่เป็นศูนย์นั่นเป็นสถานการณ์ที่ดีกว่าที่จะประเมินค่าประสิทธิภาพการทำงานของคุณ ถึงแม้ว่าแน่นอนถ้าการทดสอบนั้นมาจากการแจกแจงพื้นฐานเช่นเดียวกับรถไฟของคุณ (ข้อสมมติฐานสำคัญในการเรียนรู้เชิงสถิติ) กล่าวว่าค่าเฉลี่ยควรจะออกมาเป็นศูนย์ประมาณ
R
หรือไม่? ดูคำถามนี้: stackoverflow.com/questions/49260862/…