คำถามที่น่าสนใจ โดยส่วนตัวฉันไม่เคยเห็นมาก่อนว่าจะมีผลิตภัณฑ์ใดเข้าสู่การผลิต แต่เข้าใจตรรกะ
ในทางทฤษฎียิ่งคุณเห็นโมเดลที่ปรับใช้ของคุณมากเท่าไหร่ ดังนั้นถ้าคุณฝึกแบบจำลองกับชุดข้อมูลที่คุณมีอยู่มันควรจะสรุปได้ดีกว่าแบบจำลองที่เห็นเฉพาะชุดรถไฟ / val (เช่น ~ 90%) จากชุดข้อมูลแบบเต็ม
ปัญหาเกี่ยวกับสิ่งนี้ (และเหตุผลที่เราแบ่งข้อมูลออกเป็นชุดฝึกอบรม / val / การทดสอบในตอนแรก!) คือเราต้องการให้สามารถอ้างสิทธิ์ทางสถิติเพื่อความถูกต้องของข้อมูลที่มองไม่เห็น ทันทีที่เราทำการฝึกอบรมแบบจำลองอีกครั้งกับข้อมูลทั้งหมดจะไม่สามารถทำการเรียกร้องดังกล่าวได้อีกต่อไป
[แก้ไข]
นี่คือคำถามที่เกี่ยวข้องกับการตรวจสอบข้ามซึ่งคำตอบที่ได้รับการยอมรับทำให้ประเด็นที่คล้ายกันกับฉันและกล่าวถึงวิธีอื่น ๆ ในการทำสิ่งต่าง ๆ
เราวนซ้ำ:
- ฝึกอบรมนางแบบ
- →
- เปลี่ยนรูปแบบ
- ไปที่ขั้นตอนที่ 1
- ประเมินประสิทธิภาพของชุดทดสอบ
- แสดงแบบจำลองที่มีความแม่นยำในการทดสอบในขั้นตอนที่ 5
ในที่สุดหากคุณจัดการเพื่อให้ได้คะแนนที่ยอดเยี่ยมในชุดทดสอบคุณสามารถอ้างได้ว่าเป็นการสรุปที่ดี ดังนั้นคำถามที่ว่าการฝึกอบรมใหม่บนชุดข้อมูลแบบเต็มจะปรับปรุงประสิทธิภาพของข้อมูลที่มองไม่เห็นในอนาคตไม่ใช่สิ่งที่คุณสามารถทดสอบได้อย่างเคร่งครัด หลักฐานเชิงประจักษ์ของประสิทธิภาพที่ดีขึ้นในชุดปัญหาอื่น ๆ ที่เกี่ยวข้องจะเป็นเพียงแหล่งข้อมูลหรือคำแนะนำ ณ เวลาที่คุณต้องตัดสินใจ
การตรวจสติจะเป็นการทดสอบโมเดลที่ได้รับการฝึกฝนขั้นสุดท้ายอีกครั้งในชุดทดสอบต้นฉบับ คาดหวังว่าจะได้คะแนนสูงกว่าที่เคยทำเมื่อแบบจำลองเห็นเฉพาะชุดรถไฟ / วาลเท่านั้นเนื่องจากเห็นชุดทดสอบจริงระหว่างการฝึกอบรม สิ่งนี้จะไม่ทำให้ฉันรู้สึกมั่นใจ 100% ว่ารุ่นสุดท้ายนี้เหนือกว่าในทุกกรณีในอนาคต แต่อย่างน้อยมันก็ดีเท่าที่จะเป็นไปได้กับข้อมูลที่ได้รับ
อาจมีข้อโต้แย้งที่เข้มงวดมากขึ้นในการทำสิ่งที่คุณพูด (อาจเป็นแรงกระตุ้นทางวิชาการ) แต่ดูเหมือนว่าจะน่าสนใจสำหรับการใช้งานจริง!