ผมถือว่าคุณหมายถึงการเลือกคุณลักษณะเป็นวิศวกรรมคุณลักษณะ กระบวนการที่ฉันมักจะทำตามและฉันเห็นบางคนทำคือ
- คุณสมบัติวิศวกรรม
ลองใช้อัลกอริทึมสองสามอันซึ่งมักจะเป็นคนที่มีประสิทธิภาพสูงเช่น RandomForest ต้นไม้ไล่ระดับสีไล่โทนสีเครือข่ายที่เป็นกลางหรือ SVM ในฟีเจอร์
2.1 ทำการปรับแต่งพารามิเตอร์อย่างง่ายเช่นการค้นหากริดในช่วงของพารามิเตอร์ขนาดเล็ก
หากผลลัพธ์ของขั้นตอนที่ 2 ไม่เป็นที่น่าพอใจให้กลับไปที่ขั้นตอนที่ 1 เพื่อสร้างคุณลักษณะเพิ่มเติมหรือลบคุณลักษณะที่ซ้ำซ้อนและรักษาคุณสมบัติที่ดีที่สุดไว้โดยทั่วไปผู้คนมักจะเรียกการเลือกคุณลักษณะนี้ หากแนวคิดใหม่หมดไปลองใช้อัลกอริธึมเพิ่มเติม
หากผลลัพธ์ไม่เป็นไรหรือใกล้เคียงกับสิ่งที่คุณต้องการให้ย้ายไปที่ขั้นตอนที่ 3
- การปรับพารามิเตอร์ที่กว้างขวาง
เหตุผลในการทำเช่นนี้คือการจัดหมวดหมู่เป็นเรื่องเกี่ยวกับวิศวกรรมฟีเจอร์และถ้าคุณไม่รู้จักตัวแยกประเภทที่ทรงพลังอย่างเหลือเชื่อเช่นการเรียนรู้เชิงลึกที่ปรับแต่งสำหรับปัญหาเฉพาะเช่น Computer Vision การสร้างคุณสมบัติที่ดีเป็นกุญแจสำคัญ การเลือกลักษณนามเป็นสิ่งสำคัญ แต่ไม่สำคัญ ตัวแยกประเภททั้งหมดที่กล่าวมาข้างต้นนั้นมีความคล้ายคลึงกันในแง่ของประสิทธิภาพและส่วนใหญ่ตัวแยกประเภทที่ดีที่สุดจะกลายเป็นหนึ่งในนั้น
การปรับพารามิเตอร์สามารถเพิ่มประสิทธิภาพในบางกรณีค่อนข้างมาก แต่ถ้าไม่มีคุณสมบัติที่ดีการปรับจูนก็ไม่ช่วยอะไรมาก โปรดทราบว่าคุณมีเวลาเสมอสำหรับการปรับพารามิเตอร์ นอกจากนี้ยังไม่มีจุดปรับพารามิเตอร์อย่างกว้างขวางจากนั้นคุณค้นพบคุณลักษณะใหม่และทำซ้ำสิ่งทั้งหมด