ขึ้นอยู่กับปริมาณข้อมูลที่คุณมีค่าใช้จ่ายเฉพาะวิธีการและผลลัพธ์ที่คุณต้องการ
ตัวอย่างบางส่วน:
หากคุณมีข้อมูลเพียงเล็กน้อยคุณอาจต้องการใช้การตรวจสอบข้าม (k-fold, ออกจากรายการครั้งเดียว ฯลฯ ) โมเดลของคุณอาจไม่ใช้ทรัพยากรมากในการฝึกอบรมและทดสอบอย่างไรก็ตาม เป็นวิธีที่ดีที่จะได้รับประโยชน์สูงสุดจากข้อมูลของคุณ
คุณมีข้อมูลจำนวนมาก: คุณอาจต้องการชุดทดสอบที่มีขนาดใหญ่พอสมควรทำให้มั่นใจได้ว่าจะมีความเป็นไปได้น้อยที่ตัวอย่างแปลก ๆ บางอย่างจะให้ความแปรปรวนกับผลลัพธ์ของคุณมาก คุณควรใช้ข้อมูลเท่าไหร่ ขึ้นอยู่กับข้อมูลและรุ่นของคุณอย่างสมบูรณ์ ในการรู้จำเสียงพูดตัวอย่างเช่นถ้าคุณจะใช้ข้อมูลมากเกินไป (สมมติว่า 3000 ประโยค) การทดลองของคุณอาจใช้เวลาเป็นวันเนื่องจากปัจจัยแบบเรียลไทม์ของ 7-10 นั้นเป็นเรื่องปกติ ถ้าคุณจะใช้เวลาน้อยเกินไปมันขึ้นอยู่กับลำโพงที่คุณเลือกมากเกินไป (ซึ่งไม่ได้รับอนุญาตในชุดฝึกอบรม)
โปรดจำไว้ว่าในหลายกรณีก็เป็นการดีที่จะมีการตรวจสอบ / พัฒนาเช่นกัน!