การตรวจสอบความถูกต้องไขว้เป็นเครื่องมือในการประมาณความแปรปรวนของตัวชี้วัดประสิทธิภาพของคุณเนื่องจากการสุ่มในข้อมูล (และอาจจะเป็นในอัลกอริทึมการเรียนรู้
ดังนั้นหากคุณใช้การแยกเพียงครั้งเดียวเช่นรถไฟ 80% การทดสอบ + 20% และรายงานตัวชี้วัดประสิทธิภาพของคุณจากการทดสอบเดี่ยวนี้มีโอกาสดีที่ทุกคนที่พยายามจำลองการทดสอบของคุณโดยใช้พารามิเตอร์เดียวกันจะพบว่าตัวเลขประสิทธิภาพแตกต่างกัน แตกต่างกัน) ยกเว้นกรณีที่คุณให้แยกแน่นอนเดียวกันซึ่งไม่มีความหมาย
หากต้องการกลับมาที่คำถามของคุณฉันคิดว่าคุณควรใช้ CV เพื่อรายงานผลการปฏิบัติงานของคุณ (เช่น CV 10 เท่าและรายงานค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการวัดประสิทธิภาพ) ตอนนี้สำหรับการปรับอัลกอริทึมของคุณคุณอาจใช้ชุดการตรวจสอบความถูกต้องขนาดเล็กกว่ามากตัวอย่างจากชุดการฝึกอบรม (ตรวจสอบให้แน่ใจว่ามันไม่รวมอยู่ในชุดทดสอบ)
หากคุณกลัวว่าคุณจะไม่พบไฮเปอร์พารามิเตอร์ที่ดีที่สุดโดยใช้ชุดเล็ก ๆ คุณอาจจะคิดอัลกอริธึมของคุณไปที่ชุดข้อมูลเฉพาะ หากคุณไม่สามารถหาการกำหนดค่าโดยใช้ตัวอย่างขนาดเล็กที่ให้ประสิทธิภาพการทำงานที่เหมาะสมในทุกช่วงเวลาแสดงว่าอัลกอริทึมนั้นอาจไม่มีประโยชน์ในทางปฏิบัติ
โปรดระลึกไว้เสมอว่าอัลกอริทึมบางตัวนั้นช้าเกินไป / ปรับขนาดได้ไม่ดีนักในการกำหนดค่าบางอย่าง นี่เป็นส่วนหนึ่งของการเลือกแบบจำลองที่ใช้งานได้จริง
เนื่องจากคุณพูดถึง SVMs การใช้งานส่วนใหญ่จะช้าเมื่อพยายามค้นหาพารามิเตอร์สำหรับเมล็ดที่ไม่เป็นเชิงเส้นด้วยการค้นหากริด การค้นหากริดมีความซับซ้อนแบบทวีคูณดังนั้นให้ใช้กับพารามิเตอร์ที่น้อยมาก โปรดทราบว่าไลบรารีส่วนใหญ่มีพารามิเตอร์เริ่มต้นที่สมเหตุสมผล (หรืออย่างน้อยคุณจะตั้งค่าหนึ่งพารามิเตอร์และมีฮิวริสติกเพื่อตั้งค่าอื่น ๆ )