ฉันไม่แน่ใจว่าการจำแนกประเภทจำเป็นต้องมีคำสั่งเกี่ยวกับจำนวนประชากรที่จุดข้อมูลถูกดึงออกมา การจำแนกประเภทดังที่คุณอาจทราบว่าใช้ข้อมูลการฝึกอบรมประกอบด้วยเวกเตอร์ "ฟีเจอร์" บางอันแต่ละเลเบลพร้อมคลาสเฉพาะเพื่อทำนายเลเบลคลาสที่เป็นของเวกเตอร์คุณลักษณะที่ไม่มีป้ายกำกับอื่น ๆ ตัวอย่างเช่นเราอาจใช้สัญญาณชีพของผู้ป่วยและการวินิจฉัยของแพทย์เพื่อคาดการณ์ว่าผู้ป่วยรายอื่นมีสุขภาพดีหรือไม่ดี
ตัวแยกประเภทบางตัวเรียกว่า "ตัวแยกประเภทแบบกำเนิด" พยายามที่จะสร้างแบบจำลองประชากรหรือกระบวนการสร้างข้อมูลที่สร้างแต่ละชั้นอย่างชัดเจน ตัวอย่างเช่นอัลกอริทึม Naive Bayes คำนวณสำหรับแต่ละคลาสโดยถือว่าคุณสมบัตินั้นเป็นอิสระทั้งหมด แบบจำลองเหล่านี้อาจถูกมองว่าเป็นข้อความเกี่ยวกับประชากรอย่างสมเหตุสมผลคP(class=c|features)c
อย่างไรก็ตามตัวแยกประเภทอื่น ๆ มองหาความแตกต่างระหว่างคลาสโดยไม่ต้องสร้างโมเดลคลาสเอง สิ่งเหล่านี้เรียกว่าลักษณนามจำแนก ตัวอย่างคลาสสิกอย่างหนึ่งคือตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดซึ่งกำหนดตัวอย่างที่ไม่มีชื่อให้กับคลาสของเพื่อนบ้านที่ใกล้เคียงที่สุด (โดยที่คำนิยามใกล้จะถูกกำหนดด้วยวิธีที่เหมาะสมสำหรับปัญหา) ดูเหมือนว่ามันจะมีข้อมูลเกี่ยวกับประชากรที่จุดข้อมูลถูกดึงออกมาไม่มากนัก
หากคุณสนใจในความแตกต่างระหว่างสถิติเชิงพรรณนาและเชิงอนุมานอาจเป็นประโยชน์มากกว่าที่จะคิดเกี่ยวกับจุดประสงค์ของการวิเคราะห์ สถิติเชิงพรรณนาเช่นค่าเฉลี่ยอาจบอกคุณได้ว่าเทราต์เลคจำนวนหนึ่งในทะเลสาบทั่วไป - พวกเขาอธิบายอะไรบางอย่าง สถิติเชิงอนุมานเช่น -test อาจบอกคุณได้ว่าโดยทั่วไปแล้วปลาเทราท์มากกว่าเบสในทะเลสาบเหล่านี้ - มันช่วยให้คุณสามารถอ้างสิทธิ์เกี่ยวกับสถิติเชิงพรรณนาt