คุณสมบัติวิศวกรรมที่ไม่เชื่อเรื่องพระเจ้าที่ยังคงรักษาความหมายของความหมาย?


12

คุณสมบัติทางวิศวกรรมมักเป็นส่วนประกอบสำคัญในการเรียนรู้ของเครื่อง (มันถูกใช้อย่างหนักเพื่อเอาชนะ KDD Cup ในปี 2010 ) อย่างไรก็ตามฉันพบว่าเทคนิคทางวิศวกรรมส่วนใหญ่มีคุณสมบัติเช่นกัน

  • ทำลายความหมายใด ๆ ที่ใช้งานง่ายของคุณสมบัติพื้นฐานหรือ
  • มีความเฉพาะเจาะจงกับโดเมนหนึ่ง ๆ หรือแม้กระทั่งคุณสมบัติบางประเภท

ตัวอย่างแบบดั้งเดิมของอดีตคือการวิเคราะห์องค์ประกอบหลัก สำหรับฉันแล้วความรู้ใด ๆ ที่ผู้เชี่ยวชาญในหัวเรื่องจะมีเกี่ยวกับคุณลักษณะนั้นจะถูกทำลายโดยการแปลงคุณสมบัติเหล่านั้นให้เป็นองค์ประกอบหลัก

ตรงกันข้ามกับเทคนิคง่ายๆในการแปลงวันที่เป็นคุณสมบัติสำหรับ "วันของเดือน" และ "วันของสัปดาห์" ความหมายพื้นฐานยังคงอยู่ในคุณลักษณะใหม่ แต่เห็นได้ชัดว่าเทคนิคเฉพาะนี้ใช้เฉพาะกับวันที่เท่านั้นและไม่ใช่คุณสมบัติที่กำหนดเอง

มีเนื้อหามาตรฐานของเทคนิควิศวกรรมฟีเจอร์ที่ไม่ทำลายความหมายของคุณสมบัติพื้นฐานในขณะที่ใช้กับโดเมนที่กำหนดเอง (หรืออย่างน้อยก็มีโดเมนที่หลากหลาย)


2
PCA บางครั้งสามารถใช้ในการค้นหาความหมายที่ใช้งานง่ายสำหรับคุณสมบัติ - เช่นeigenfaces
tdc

คุณสามารถยกตัวอย่างของข้อมูลที่คุณมีอยู่ในใจได้หรือไม่ หากคุณสามารถระบุแอพพลิเคชั่นของคุณได้มากขึ้น (แม้แต่ตัวอย่างที่กำหนดเอง) มันจะง่ายกว่าที่จะให้คำตอบที่แม่นยำ (เพิ่มเติม)
Dov

1
@Dov ประเด็นทั้งหมดคือ (นึกคิด) ฉันต้องการบางสิ่งบางอย่างที่สามารถใช้งานได้กับชุดข้อมูลแบบตารางที่มีโครงสร้าง ดังนั้นนี่อาจเป็นข้อมูลการขายข้อมูลทางการเงินข้อมูลการค้นพบยาเสพติดข้อมูลเบสบอล ฯลฯ
Michael McGowan

คำตอบ:


7

ฉันตระหนักถึงวิธีการสลายตัววิธีหนึ่ง (แต่อาจมีมากกว่า ... ) ที่สามารถเป็นประโยชน์ในสถานการณ์ที่คุณอธิบาย มันเป็นเหมือน 2D-PCA - วิธีการสลายตัวในลำดับสูงที่การสลายตัว (เช่นปัจจัย) มีความหมายบางอย่าง คุณสามารถดูตัวอย่างและอ่านได้ที่นี่และที่นี่และลองที่นี่


+ โปรดยกโทษให้ฉันด้วยว่าฉันไม่ใช่เจ้าของภาษาอังกฤษ :)
Dov

จากสิ่งที่ฉันได้รับแจ้งขั้นตอนสุดท้ายของ PCA ควรพยายามค้นหาความหมายสำหรับส่วนประกอบหลัก
jb

5

วิธีการเรียนรู้เชิงลึกล่าสุดโดยใช้เครื่อง Boltzmann ที่ จำกัด ได้แสดงคุณสมบัติที่ดีในประเภทข้อมูลต่างๆ

เนื่องจากวิธีการเหล่านี้สร้างรูปแบบกำเนิดคุณมักจะสามารถสร้างตัวอย่างที่ดีจริงๆจากรูปแบบ

ตรวจสอบสิ่งพิมพ์ของ Hinton http://www.cs.toronto.edu/~hinton/

วิธีการเหล่านี้ไม่เหมือนกันโดยสิ้นเชิง (เรียกใช้รหัสเดียวกันในทุกข้อมูล) แต่รุ่นพื้นฐานมักจะคล้ายกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.