จะเข้าใจเครือข่ายความเชื่ออย่างลึกซึ้งสำหรับการจำแนกประเภทเสียงได้อย่างไร?


11

ใน " เครือข่ายความเชื่อเชิงลึกของ Convolutional สำหรับการเรียนรู้ที่ไม่สามารถปรับขนาดได้ของการเป็นตัวแทนลำดับชั้น " โดย Lee et. al. ( PDF ) ข้อเสนอ DBN ของ Convolutional นอกจากนี้ยังมีการประเมินวิธีการสำหรับการจำแนกภาพ ฟังก์ชั่นนี้ดูสมเหตุสมผลเนื่องจากมีคุณสมบัติภาพในพื้นที่เป็นธรรมชาติเช่นมุมและขอบเล็ก ๆ เป็นต้น

ใน " การเรียนรู้คุณลักษณะที่ไม่ได้รับการสนับสนุนสำหรับการจำแนกประเภทเสียงโดยใช้เครือข่ายความเชื่อที่ลึกซึ้ง " อัล วิธีนี้ใช้สำหรับเสียงในการจำแนกประเภทต่าง ๆ การระบุลำโพง, การระบุเพศ, การจำแนกประเภทโทรศัพท์และการจำแนกประเภทเพลง / ศิลปิน

ส่วนของเครือข่ายนี้สามารถตีความได้อย่างไรสำหรับเสียงเช่นมันสามารถอธิบายได้ว่าภาพเป็นขอบ?


ใครมีรหัสสำหรับกระดาษ

คำตอบ:


9

แอปพลิเคชั่นเสียงเป็นการลดความซับซ้อนของปัญหาการจำแนกภาพสองมิติ ฟอนิม (ตัวอย่าง) คืออะนาล็อกเสียงของคุณสมบัติภาพเช่นขอบหรือวงกลม ไม่ว่าในกรณีใดคุณสมบัติดังกล่าวมีสถานที่สำคัญ: มีลักษณะเฉพาะด้วยค่าภายในย่านที่ค่อนข้างเล็กของที่ตั้งภาพ Convolutions เป็นรูปแบบปกติของค่าเฉลี่ยถ่วงน้ำหนักควบคุมภายในละแวกใกล้เคียงท้องถิ่น จากนี้มาหวังว่ารูปแบบconvolutionalของ DBN สามารถประสบความสำเร็จในการระบุและแยกแยะคุณสมบัติที่มีความหมาย


1

ในกรณีที่ Convolutional RBM นำไปใช้กับข้อมูลเสียงผู้เขียนได้ทำการแปลงฟูริเยร์ระยะสั้นก่อนแล้วจึงกำหนดแถบพลังงานบนสเปกตรัม จากนั้นพวกเขาได้ใช้ RBM ของ convolutional กับเสียงที่แปลงแล้ว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.