ใครช่วยบอกฉันได้ว่าจุดประสงค์ของการสร้างคุณลักษณะคืออะไร และเหตุใดจึงต้องเพิ่มพื้นที่ของฟีเจอร์ก่อนจัดประเภทรูปภาพ มันเป็นขั้นตอนที่จำเป็น?
มีวิธีใดบ้างในการเพิ่มพื้นที่คุณลักษณะ?
ใครช่วยบอกฉันได้ว่าจุดประสงค์ของการสร้างคุณลักษณะคืออะไร และเหตุใดจึงต้องเพิ่มพื้นที่ของฟีเจอร์ก่อนจัดประเภทรูปภาพ มันเป็นขั้นตอนที่จำเป็น?
มีวิธีใดบ้างในการเพิ่มพื้นที่คุณลักษณะ?
คำตอบ:
การสร้างคุณลักษณะ - นี่คือกระบวนการรับข้อมูลดิบที่ไม่มีโครงสร้างและการกำหนดคุณสมบัติ (เช่นตัวแปร) เพื่อใช้ในการวิเคราะห์ทางสถิติของคุณ ตัวอย่างเช่นในกรณีของการทำเหมืองข้อความคุณอาจเริ่มต้นด้วยบันทึกข้อความดิบของข้อความนับพัน (เช่น SMS, อีเมล, ข้อความเครือข่ายโซเชียล ฯลฯ ) และสร้างคุณสมบัติโดยการลบคำที่มีมูลค่าต่ำ (เช่นคำหยุด) โดยใช้ขนาดที่แน่นอน บล็อกของคำ (เช่น n-grams) หรือใช้กฎอื่น ๆ
การแยกคุณสมบัติ - หลังจากสร้างฟีเจอร์มันมักจะจำเป็นในการทดสอบการเปลี่ยนแปลงของฟีเจอร์ดั้งเดิมและเลือกเซ็ตย่อยของพูลของฟีเจอร์ดั้งเดิมและฟีเจอร์ที่เป็นไปได้สำหรับใช้ในโมเดลของคุณ (เช่นการดึงฟีเจอร์และการเลือก) ค่าที่ได้จากการทดสอบเป็นขั้นตอนทั่วไปเนื่องจากข้อมูลอาจมีข้อมูลสำคัญซึ่งมีรูปแบบที่ไม่ใช่เชิงเส้นหรือความสัมพันธ์กับผลลัพธ์ของคุณดังนั้นความสำคัญขององค์ประกอบข้อมูลอาจปรากฏเฉพาะในสถานะที่ถูกเปลี่ยนรูปเท่านั้น (เช่นอนุพันธ์ลำดับที่สูงกว่า) การใช้คุณสมบัติมากเกินไปอาจส่งผลให้เกิดความซ้ำซ้อนของสีหรือทำให้แบบจำลองทางสถิติสับสนขณะที่การแยกฟีเจอร์จำนวนน้อยที่สุดเพื่อให้เหมาะกับจุดประสงค์ของการวิเคราะห์ของคุณจะเป็นไปตามหลักการของความประหยัด
การเพิ่มพื้นที่คุณลักษณะของคุณในลักษณะนี้มักเป็นขั้นตอนที่จำเป็นในการจัดหมวดหมู่ของรูปภาพหรือวัตถุข้อมูลอื่น ๆ เนื่องจากพื้นที่คุณลักษณะดิบมักจะเต็มไปด้วยข้อมูลที่ไม่มีโครงสร้างและไม่เกี่ยวข้องซึ่งประกอบด้วยสิ่งที่มักเรียกว่า "เสียง" ในกระบวนทัศน์ ของ "สัญญาณ" และ "สัญญาณรบกวน" (ซึ่งจะกล่าวว่าข้อมูลบางอย่างมีค่าการทำนายและข้อมูลอื่นไม่ได้) ด้วยการปรับปรุงพื้นที่คุณลักษณะคุณจะสามารถระบุข้อมูลสำคัญที่มีค่าพยากรณ์หรือค่าอื่น ๆ ในการวิเคราะห์ของคุณได้ดีขึ้น (เช่น "สัญญาณ") ในขณะที่ลบข้อมูลที่รบกวน (เช่น "เสียง")