วิธีการใช้เครือข่ายประสาทเทียมกับปัญหาการจำแนกประเภทฉลากหลายป้าย?


12

รายละเอียด:

ให้โดเมนปัญหาเป็นการจัดหมวดหมู่เอกสารที่มีชุดของเวกเตอร์คุณลักษณะแต่ละอันอยู่ใน 1 คลาสขึ้นไป ตัวอย่างเช่นเอกสารdoc_1อาจเป็นของSportsและEnglishหมวดหมู่

คำถาม:

การใช้เครือข่ายประสาทเทียมสำหรับการจำแนกประเภทฉลากจะเป็นอย่างไรสำหรับเวกเตอร์คุณลักษณะ มันจะเป็นเวกเตอร์ที่ประกอบขึ้นเป็นคลาสทั้งหมดหรือไม่ซึ่งค่า 0 นั้นมอบให้กับคลาสที่ไม่เกี่ยวข้องและ 1 สำหรับคลาสที่เกี่ยวข้อง? ดังนั้นหากรายการป้ายกำกับของชั้นเรียนอยู่[Sports, News, Action, English, Japanese]สำหรับเอกสารdoc_1ป้ายกำกับจะเป็น[1, 0, 0, 1, 0]อย่างไร

คำตอบ:


3

ใช่ในการเรียนรู้หลายฉลากข้อมูลฉลากมักจะถูกเข้ารหัสเป็นเวกเตอร์ไบนารีที่คุณอธิบาย นอกจากนี้ยังง่ายกว่าสำหรับการประเมินผล

เราอาจต้องการตรวจสอบMULANซึ่งเป็นไลบรารี Java แบบโอเพนซอร์ซสำหรับการเรียนรู้แบบหลายฉลาก มันเป็นส่วนขยาย Weka และได้ใช้ตัวแยกประเภทหลายป้ายรวมเครือข่ายประสาทเทียม ตัวอย่างเช่นคุณสามารถค้นหา BP-MLL ที่นี่


8

นี่เป็นกระดาษที่คุณกำลังมองหา:

Min-Ling Zhang และ Zhi-Hua Zhou: เครือข่ายนิวรัลแบบหลายฉลากพร้อมแอปพลิเคชั่นสำหรับฟังก์ชั่นฟังก์ชั่นและการจัดหมวดหมู่ข้อความ

จากนามธรรม:

ในการเรียนรู้แบบหลายฉลากแต่ละอินสแตนซ์ในชุดการฝึกอบรมจะเชื่อมโยงกับชุดของฉลากและงานคือการส่งออกชุดฉลากที่ไม่ทราบขนาดสำหรับแต่ละอินสแตนซ์ที่มองไม่เห็นในบทความนี้ปัญหานี้แก้ไขได้ใน วิธีที่อัลกอริทึมเครือข่ายประสาทชื่อ BP-MLL คือ Backpropagation สำหรับการเรียนรู้แบบหลายป้ายเสนอ ... แอปพลิเคชั่นสำหรับปัญหาการเรียนรู้แบบหลายฉลากในโลกแห่งความเป็นจริงเช่นฟังก์ชั่นการทำงานและการจัดหมวดหมู่ข้อความแสดงให้เห็นว่าประสิทธิภาพของ BP-MLL นั้นเหนือชั้นกว่าขั้นตอนวิธีการเรียนรู้แบบหลายฉลากที่เป็นที่ยอมรับ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.