การแบ่งเป็นชั้น ๆ พยายามที่จะทำให้แน่ใจว่าแต่ละครั้งจะเป็นตัวแทนของชั้นข้อมูลทั้งหมด โดยทั่วไปจะทำในวิธีการจัดหมวดหมู่แบบมีผู้สอนและมีจุดมุ่งหมายเพื่อให้แน่ใจว่าแต่ละชั้นเรียน (โดยประมาณ) แสดงเท่า ๆ กันในแต่ละช่วงเวลาของการทดสอบ
สัญชาตญาณที่อยู่เบื้องหลังสิ่งนี้เกี่ยวข้องกับอคติของอัลกอริธึมการจำแนกส่วนใหญ่ พวกเขามักจะให้น้ำหนักแต่ละตัวอย่างเท่า ๆ กันซึ่งหมายความว่าคลาสที่มีผู้แสดงมากเกินไปจะได้รับน้ำหนักมากเกินไป (เช่นการปรับ F-measure, ความแม่นยำหรือข้อผิดพลาดในรูปแบบเสริม) การแบ่งชั้นไม่สำคัญสำหรับอัลกอริทึมที่ให้น้ำหนักแต่ละคลาสเท่า ๆ กัน (เช่นการเพิ่มประสิทธิภาพ Kappa, Informedness หรือ ROC AUC) หรือตามเมทริกซ์ต้นทุน (เช่นให้ค่ากับน้ำหนักแต่ละคลาสอย่างถูกต้องและ / หรือค่าใช้จ่ายสำหรับแต่ละวิธีของ misclassifying) ดูเช่นพลัง DMW (2014) สิ่งที่การวัด F ไม่ได้วัด: คุณสมบัติข้อบกพร่องการเข้าใจผิดและการแก้ไข http://arxiv.org/pdf/1503.06410
ปัญหาเฉพาะอย่างหนึ่งที่มีความสำคัญในอัลกอริธึมที่ไม่เอนเอียงหรือสมดุลย์คือพวกเขามักจะไม่สามารถเรียนรู้หรือทดสอบคลาสที่ไม่ได้แสดงในเวลาเดียวกันและแม้แต่กรณีที่มีเพียงคลาสเดียวเท่านั้น แสดงในครึ่งพับไม่อนุญาตให้วางทั่วไปเพื่อดำเนินการ resp การประเมินผล อย่างไรก็ตามการพิจารณานี้ไม่เป็นสากลและตัวอย่างก็ไม่ได้นำไปใช้กับการเรียนรู้ในชั้นเรียนมากเพียงใดซึ่งพยายามที่จะตัดสินว่าอะไรคือสิ่งที่ปกติสำหรับแต่ละชั้นเรียนและระบุผู้ผิดได้อย่างมีประสิทธิภาพว่าเป็นชั้นเรียนที่แตกต่างกัน เป็นเรื่องเกี่ยวกับการพิจารณาสถิติที่ไม่ได้สร้างตัวจําแนกเฉพาะ
ในอีกทางหนึ่งการแบ่งชั้นภายใต้การกำกับดูแลจะลดความบริสุทธิ์ทางเทคนิคของการประเมินเนื่องจากฉลากของข้อมูลการทดสอบไม่ควรส่งผลกระทบต่อการฝึกอบรม แต่ในการแบ่งชั้นจะใช้ในการเลือกอินสแตนซ์การฝึกอบรม การแบ่งชั้นที่ไม่ได้รับการสำรองนั้นยังมีความเป็นไปได้โดยอาศัยการกระจายข้อมูลที่คล้ายกันรอบ ๆ เพื่อดูเฉพาะคุณลักษณะของข้อมูลไม่ใช่คลาสจริง ดูตัวอย่างเช่น
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.469.8855
NA Diamantidis, D. Karlis, EA Giakoumakis (1997), การแบ่งชั้นการตรวจสอบข้ามที่ไม่ได้รับการรับรองเพื่อความถูกต้อง
การแบ่งชั้นยังสามารถนำไปใช้กับการถดถอยมากกว่าการจัดหมวดหมู่ซึ่งในกรณีเช่นการแบ่งชั้นที่ไม่ได้รับการสำรองความคล้ายคลึงกันมากกว่าการใช้เอกลักษณ์ แต่รุ่นที่อยู่ภายใต้การดูแลจะใช้ค่าฟังก์ชันจริงที่รู้จัก
ภาวะแทรกซ้อนเพิ่มเติมคือชั้นเรียนที่หายากและการจำแนกประเภทหลายแถบซึ่งการจำแนกประเภทจะดำเนินการในหลายมิติ (อิสระ) ที่นี่ tuples ของป้ายกำกับที่แท้จริงในทุกมิติสามารถใช้เป็นคลาสเพื่อจุดประสงค์ในการตรวจสอบข้าม อย่างไรก็ตามไม่จำเป็นต้องมีชุดค่าผสมทั้งหมดและชุดค่าผสมบางชุดอาจหายาก คลาสที่หายากและชุดค่าผสมที่หายากเป็นปัญหาที่คลาส / ชุดค่าผสมที่เกิดขึ้นอย่างน้อยหนึ่งครั้ง แต่น้อยกว่า K คูณ (ใน K-CV) ไม่สามารถแสดงได้ในการทดสอบทั้งหมด ในกรณีเช่นนี้เราสามารถพิจารณารูปแบบของการเพิ่มระดับแบบแบ่งชั้น (การสุ่มตัวอย่างที่มีการแทนที่เพื่อสร้างการฝึกอบรมแบบเต็มขนาดที่มีการคาดคะเนซ้ำและ 36.8% คาดว่าจะไม่ได้เลือกสำหรับการทดสอบ .
อีกวิธีหนึ่งในการแบ่งเป็นหลายกลุ่มคือพยายามแบ่งชั้นหรือ bootstrap แต่ละมิติของคลาสแยกจากกันโดยไม่ต้องการให้แน่ใจว่าเลือกชุดค่าผสมที่เป็นตัวแทน ด้วย L label และอินสแตนซ์ N และ Kkl อินสแตนซ์ของคลาส k สำหรับเลเบล l เราสามารถสุ่มเลือก (โดยไม่ต้องเปลี่ยน) จากชุดของอินสแตนซ์ที่มีป้ายกำกับที่เกี่ยวข้อง Dkl โดยประมาณอินสแตนซ์ N / LKkl สิ่งนี้ไม่รับประกันความสมดุลที่เหมาะสม สิ่งนี้สามารถปรับปรุงได้โดยการ จำกัด การเลือกป้ายกำกับที่หรือเกินโควต้าเว้นแต่จะไม่มีตัวเลือก (เนื่องจากชุดค่าผสมบางอย่างไม่เกิดขึ้นหรือหายาก) ปัญหามักจะหมายถึงว่ามีข้อมูลน้อยเกินไปหรือมีมิติไม่อิสระ