ฉันคิดว่าพวกเขาเป็น 2 สิ่งที่แตกต่างกัน
เริ่มต้นด้วยการเลือกคุณสมบัติ :
เทคนิคนี้ใช้สำหรับการเลือกคุณสมบัติที่อธิบายตัวแปรเป้าหมายส่วนใหญ่ (มีความสัมพันธ์กับตัวแปรเป้าหมาย) การทดสอบนี้จะดำเนินการก่อนที่โมเดลจะถูกนำไปใช้กับข้อมูล
เพื่ออธิบายให้ดีขึ้นให้เราไปตามตัวอย่าง: มี 10 คุณสมบัติและตัวแปรเป้าหมาย 1 ตัวคุณสมบัติ 9 ตัวอธิบาย 90% ของตัวแปรเป้าหมายและ 10 คุณสมบัติรวมกันอธิบาย 91% ของตัวแปรเป้าหมาย ดังนั้นตัวแปร 1 นั้นไม่ได้สร้างความแตกต่างมากนักดังนั้นคุณมักจะลบมันก่อนการสร้างแบบจำลอง (มันเป็นเรื่องของธุรกิจเช่นกัน) ฉันสามารถเรียกได้ว่าเป็น Predictor สำคัญ
ตอนนี้ให้พูดคุยเกี่ยวกับคุณสมบัติของการสกัด ,
ซึ่งใช้ในการเรียนรู้ Unsupervised, การสกัดของรูปทรงในภาพ, การสกัด Bi-grams จากข้อความ, การแยกหน่วยเสียงจากการบันทึกข้อความพูด เมื่อคุณไม่รู้อะไรเกี่ยวกับข้อมูลเช่นไม่มีพจนานุกรมข้อมูลคุณลักษณะที่มากเกินไปซึ่งหมายความว่าข้อมูลนั้นไม่อยู่ในรูปแบบที่เข้าใจได้ จากนั้นคุณลองใช้เทคนิคนี้เพื่อรับคุณสมบัติบางอย่างซึ่งอธิบายถึงข้อมูลส่วนใหญ่ การแยกคุณลักษณะเกี่ยวข้องกับการเปลี่ยนแปลงคุณสมบัติซึ่งมักไม่สามารถย้อนกลับได้เนื่องจากข้อมูลบางอย่างสูญหายไปในกระบวนการลดมิติข้อมูล
คุณสามารถใช้การสกัดคุณลักษณะบนข้อมูลที่กำหนดเพื่อแยกฟีเจอร์จากนั้นใช้การเลือกคุณสมบัติที่เกี่ยวข้องกับ Target Variable เพื่อเลือกเซ็ตย่อยซึ่งสามารถช่วยในการสร้างแบบจำลองที่ดีพร้อมผลลัพธ์ที่ดี
คุณสามารถผ่านLink-1 , Link-2เหล่านี้เพื่อความเข้าใจที่ดีขึ้น
เราสามารถนำไปใช้ใน R, Python, SPSS
แจ้งให้เราทราบหากต้องการคำชี้แจงเพิ่มเติม