ในการจำแนกอย่างง่ายเรามีสองคลาส: class-0 และ class-1 ในข้อมูลบางอย่างฉันมีค่าสำหรับ class-1 เท่านั้นดังนั้นไม่มีสำหรับ class-0 ตอนนี้ฉันกำลังคิดที่จะสร้างแบบจำลองเพื่อจำลองข้อมูลสำหรับ class-1 ดังนั้นเมื่อมีข้อมูลใหม่มาโมเดลนี้จะถูกนำไปใช้กับข้อมูลใหม่และพบว่ามีความน่าจะเป็นที่จะบอกว่าข้อมูลใหม่นั้นเหมาะสมกับโมเดลนี้อย่างไร จากนั้นเปรียบเทียบกับเกณฑ์ฉันสามารถกรองข้อมูลที่ไม่เหมาะสม
คำถามของฉันคือ:
- นี่เป็นวิธีที่ดีในการทำงานกับปัญหาดังกล่าวหรือไม่?
- ลักษณนาม RandomForest สามารถใช้กับกรณีนี้ได้หรือไม่? ฉันจำเป็นต้องเพิ่มข้อมูลเทียมสำหรับ class-0 ซึ่งฉันหวังว่าตัวจําแนกเป็นเสียงรบกวนหรือไม่?
- แนวคิดอื่นใดที่อาจช่วยแก้ไขปัญหานี้ได้?