ความแตกต่างระหว่างการสร้างคุณลักษณะและการแยกคุณสมบัติคืออะไร?


13

ใครช่วยบอกฉันได้ว่าจุดประสงค์ของการสร้างคุณลักษณะคืออะไร และเหตุใดจึงต้องเพิ่มพื้นที่ของฟีเจอร์ก่อนจัดประเภทรูปภาพ มันเป็นขั้นตอนที่จำเป็น?

มีวิธีใดบ้างในการเพิ่มพื้นที่คุณลักษณะ?

คำตอบ:


13

การสร้างคุณลักษณะ - นี่คือกระบวนการรับข้อมูลดิบที่ไม่มีโครงสร้างและการกำหนดคุณสมบัติ (เช่นตัวแปร) เพื่อใช้ในการวิเคราะห์ทางสถิติของคุณ ตัวอย่างเช่นในกรณีของการทำเหมืองข้อความคุณอาจเริ่มต้นด้วยบันทึกข้อความดิบของข้อความนับพัน (เช่น SMS, อีเมล, ข้อความเครือข่ายโซเชียล ฯลฯ ) และสร้างคุณสมบัติโดยการลบคำที่มีมูลค่าต่ำ (เช่นคำหยุด) โดยใช้ขนาดที่แน่นอน บล็อกของคำ (เช่น n-grams) หรือใช้กฎอื่น ๆ

การแยกคุณสมบัติ - หลังจากสร้างฟีเจอร์มันมักจะจำเป็นในการทดสอบการเปลี่ยนแปลงของฟีเจอร์ดั้งเดิมและเลือกเซ็ตย่อยของพูลของฟีเจอร์ดั้งเดิมและฟีเจอร์ที่เป็นไปได้สำหรับใช้ในโมเดลของคุณ (เช่นการดึงฟีเจอร์และการเลือก) ค่าที่ได้จากการทดสอบเป็นขั้นตอนทั่วไปเนื่องจากข้อมูลอาจมีข้อมูลสำคัญซึ่งมีรูปแบบที่ไม่ใช่เชิงเส้นหรือความสัมพันธ์กับผลลัพธ์ของคุณดังนั้นความสำคัญขององค์ประกอบข้อมูลอาจปรากฏเฉพาะในสถานะที่ถูกเปลี่ยนรูปเท่านั้น (เช่นอนุพันธ์ลำดับที่สูงกว่า) การใช้คุณสมบัติมากเกินไปอาจส่งผลให้เกิดความซ้ำซ้อนของสีหรือทำให้แบบจำลองทางสถิติสับสนขณะที่การแยกฟีเจอร์จำนวนน้อยที่สุดเพื่อให้เหมาะกับจุดประสงค์ของการวิเคราะห์ของคุณจะเป็นไปตามหลักการของความประหยัด

การเพิ่มพื้นที่คุณลักษณะของคุณในลักษณะนี้มักเป็นขั้นตอนที่จำเป็นในการจัดหมวดหมู่ของรูปภาพหรือวัตถุข้อมูลอื่น ๆ เนื่องจากพื้นที่คุณลักษณะดิบมักจะเต็มไปด้วยข้อมูลที่ไม่มีโครงสร้างและไม่เกี่ยวข้องซึ่งประกอบด้วยสิ่งที่มักเรียกว่า "เสียง" ในกระบวนทัศน์ ของ "สัญญาณ" และ "สัญญาณรบกวน" (ซึ่งจะกล่าวว่าข้อมูลบางอย่างมีค่าการทำนายและข้อมูลอื่นไม่ได้) ด้วยการปรับปรุงพื้นที่คุณลักษณะคุณจะสามารถระบุข้อมูลสำคัญที่มีค่าพยากรณ์หรือค่าอื่น ๆ ในการวิเคราะห์ของคุณได้ดีขึ้น (เช่น "สัญญาณ") ในขณะที่ลบข้อมูลที่รบกวน (เช่น "เสียง")


2
คำตอบที่ดี! (+1)
Aleksandr Blekh

1
ด้วยความยินดี!
Aleksandr Blekh

ขอบคุณ .. มีวิธีการในการเพิ่มพื้นที่ของฟีเจอร์หรือไม่?
Saratha Priya

แน่ใจ มีวิธีการดังกล่าวมากมาย ตัวอย่างเช่นตัวกรอง Gabor เป็นอัลกอริทึมการตรวจจับขอบตัวกรอง bandpass ที่ใช้กันทั่วไปสำหรับการสร้างคุณสมบัติในการจดจำใบหน้าและการจำแนกพื้นผิว สิ่งนี้สามารถใช้ร่วมกับอัลกอริธึมการจัดหมวดหมู่เช่นการสนับสนุนเครื่องเวกเตอร์
Hack-R

ฉันสามารถใช้สิ่งนั้นเพื่อเพิ่มคุณสมบัติในการจัดประเภทภาพได้หรือไม่?
Saratha Priya
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.