ถ้าฉันมีชุดข้อมูลการฝึกอบรมและฉันฝึกตัวจําแนก Naive Bayes บนมันและฉันมีค่าคุณลักษณะที่มีความน่าจะเป็นศูนย์ ฉันจะจัดการสิ่งนี้ได้อย่างไรหากฉันต้องการทำนายการจัดประเภทของข้อมูลใหม่ในภายหลัง ปัญหาคือถ้ามีศูนย์ในการคำนวณผลิตภัณฑ์ทั้งหมดจะกลายเป็นศูนย์ไม่ว่าจะมีค่าอื่น ๆ อีกกี่ค่าที่ฉันได้รับซึ่งอาจจะหาวิธีแก้ไขปัญหาอื่นได้
ตัวอย่าง:
ผลิตภัณฑ์ทั้งหมดกลายเป็นเพราะในข้อมูลการฝึกอบรมแอตทริบิวต์ TimeZone US จะเป็น Yes เสมอในชุดข้อมูลการฝึกอบรมขนาดเล็กของเรา ฉันจะจัดการสิ่งนี้ได้อย่างไร ฉันควรใช้ชุดข้อมูลการฝึกอบรมที่ใหญ่กว่านี้หรือมีความเป็นไปได้อื่นที่จะเอาชนะปัญหานี้ได้หรือไม่?