แบ่งข้อมูลอนุกรมเวลาออกเป็นชุดการฝึกอบรม / ทดสอบ / การตรวจสอบความถูกต้อง


12

อะไรคือวิธีที่ดีที่สุดในการแบ่งข้อมูลอนุกรมเวลาออกเป็นชุดรถไฟ / ทดสอบ / การตรวจสอบความถูกต้องซึ่งจะใช้ชุดการตรวจสอบความถูกต้องสำหรับการปรับพารามิเตอร์ไฮเปอร์พารามิเตอร์

เรามีข้อมูลการขายรายวัน 3 ปีและแผนของเราคือใช้ข้อมูลการฝึกอบรม 2015-2016 จากนั้นสุ่มตัวอย่าง 10 สัปดาห์จากข้อมูล 2017 เพื่อใช้เป็นชุดการตรวจสอบและอีก 10 สัปดาห์จากข้อมูล 2017 สำหรับ ชุดทดสอบ จากนั้นเราจะเดินหน้าในแต่ละวันในชุดทดสอบและการตรวจสอบความถูกต้อง

คำตอบ:


8

คุณควรใช้ตัวแบ่งตามเวลาเพื่อหลีกเลี่ยงอคติการมองไปข้างหน้า ฝึกอบรม / ตรวจสอบ / ทดสอบตามลำดับนี้ตามเวลา

ชุดทดสอบควรเป็นส่วนล่าสุดของข้อมูล คุณต้องจำลองสถานการณ์ในสภาพแวดล้อมการผลิตซึ่งหลังจากฝึกอบรมแบบจำลองแล้วคุณจะประเมินข้อมูลที่มาหลังจากเวลาที่สร้างแบบจำลอง การสุ่มตัวอย่างที่คุณใช้สำหรับการตรวจสอบและการฝึกอบรมจึงไม่ใช่ความคิดที่ดี


5

ฉันคิดว่าวิธีที่สมบูรณ์แบบที่สุดในการใช้ประโยชน์ข้อมูลอนุกรมเวลาของคุณสำหรับการฝึกอบรม / การตรวจสอบ / การทดสอบ / การทำนายคือ:

ป้อนคำอธิบายรูปภาพที่นี่

ภาพอธิบายตนเองหรือไม่? ถ้าไม่ได้โปรดแสดงความคิดเห็นและฉันจะเพิ่มข้อความเพิ่มเติม ...


3

แทนที่จะสร้างชุดการฝึกอบรม / การตรวจสอบความถูกต้องเพียงชุดเดียวคุณสามารถสร้างชุดดังกล่าวเพิ่มเติมได้

ชุดฝึกอบรมแรกอาจเป็นข้อมูล 6 เดือน (ภาคการศึกษาแรกของปี 2015) และชุดการตรวจสอบจะเป็นอีกสามเดือนถัดไป (กรกฎาคม - สิงหาคม 2558) ชุดฝึกอบรมที่สองจะเป็นการรวมกันของชุดฝึกอบรมชุดแรกและชุดตรวจสอบความถูกต้อง ชุดการตรวจสอบความถูกต้องจะเป็นอีกสามเดือนถัดไป (ก.ย. - ต.ค. 2558) และอื่น ๆ

นี่เป็นรูปแบบของการตรวจสอบข้ามแบบ K-Fold ที่ชุดการฝึกอบรมเป็นการรวมกันของชุดการฝึกอบรมและการตรวจสอบก่อนหน้านี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.