1) ฉันจะเปลี่ยนเกณฑ์การจำแนกได้อย่างไร (ฉันคิดว่าเป็น 0.5 โดยค่าเริ่มต้น) ใน RandomForest ใน sklearn
2) ฉันจะตัวอย่างน้อยใน sklearn ได้อย่างไร
3) ฉันมีผลลัพธ์ต่อไปนี้จากลักษณนาม RandomForest: [[1635 1297] [520 3624]]
precision recall f1-score support
class 0 0.76 0.56 0.64 2932
class 1 0.74 0.87 0.80 4144
เฉลี่ย / รวม 0.75 0.74 0.73 7076
ก่อนข้อมูลไม่สมดุล (30% จากคลาส 0 และ 70% จากคลาส -1) ดังนั้นฉันคิดว่าตัวจําแนกมีแนวโน้มที่จะลำเอียงมากขึ้นสำหรับความหมายระดับ 1 ย้ายบางส่วนจากคลาส 0 ไปเป็นคลาส 1 ฉันจะแก้ไขสิ่งนี้ได้อย่างไร ถ้าการสุ่มตัวอย่างสามารถช่วยได้? หรือเปลี่ยนเกณฑ์การจำแนกประเภท?
อัปเดต: class-0 มี 40% ของประชากรในขณะที่ class-1 คือ 60% อย่างไรก็ตามการเลื่อนจาก class-0 ถึง class-1 (1297) นั้นสูงในขณะที่ฉันต้องการให้มันลดลง