ทำไมคุณสมบัติที่ได้รับมาใช้ในโครงข่ายประสาทเทียม?


13

ตัวอย่างเช่นหนึ่งต้องการที่จะทำนายราคาบ้านและมีสองคุณสมบัติการป้อนข้อมูลความยาวและความกว้างของบ้าน บางครั้งหนึ่งยังมีคุณสมบัติอินพุตพหุนามที่ได้มาของเช่นพื้นที่ซึ่งเป็นความกว้าง * ความยาว

1) อะไรคือจุดรวมของฟีเจอร์ที่ได้รับ? เครือข่ายประสาทไม่ควรเรียนรู้การเชื่อมต่อระหว่างความยาวความกว้างและราคาระหว่างการฝึกอบรมหรือไม่? เหตุใดคุณสมบัติที่สามพื้นที่ซ้ำซ้อนไม่ได้

นอกจากนี้บางครั้งฉันก็เห็นว่าผู้คนเรียกใช้อัลกอริทึมการคัดเลือกทางพันธุกรรมในคุณสมบัติการป้อนข้อมูลเพื่อลดจำนวนของพวกเขา

2) อะไรคือจุดลดคุณสมบัติการป้อนข้อมูลหากทุกอย่างมีข้อมูลที่มีประโยชน์ เครือข่ายประสาทควรกำหนดน้ำหนักที่เหมาะสมให้กับแต่ละคุณสมบัติอินพุตตามความสำคัญหรือไม่ จุดประสงค์ของการใช้ขั้นตอนวิธีคัดเลือกพันธุกรรมคืออะไร

คำตอบ:


8

nlnlnl

2): มีสองเหตุผลที่ฉันรู้เรื่องนี้ ก่อนอื่นถ้าคุณมีฟีเจอร์มากมายที่ให้มา (มักจะเกิดขึ้นในข้อมูลโลกแห่งความเป็นจริง) และสั้นในเวลา CPU สำหรับการฝึกอบรม (เช่นการเกิดขึ้นทั่วไป) คุณสามารถใช้อัลกอริทึมการเลือกคุณสมบัติต่าง ๆ เพื่อลดพื้นที่ ล่วงหน้า. หลักการที่ใช้หลักการนี้มักใช้มาตรการทางสารสนเทศเพื่อเลือกคุณลักษณะที่มีพลังการทำนายสูงที่สุด ประการที่สองแม้ว่าคุณจะสามารถฝึกอบรมข้อมูลทั้งหมดและคุณลักษณะทั้งหมดที่คุณมีได้เครือข่ายประสาทมักถูกวิจารณ์ว่าเป็นโมเดล 'กล่องดำ' การลดพื้นที่คุณลักษณะล่วงหน้าสามารถช่วยบรรเทาปัญหานี้ได้ ตัวอย่างเช่นผู้ใช้ที่ดู NN ไม่สามารถบอกได้อย่างง่ายดายว่าน้ำหนักของ 0.01 หมายถึง "0 แต่กระบวนการปรับให้เหมาะสมไม่ได้อยู่ที่นั่น" หรือ "


0

1) เครือข่ายประสาทส่วนใหญ่ไม่สามารถทำการคูณได้ พวกเขาสามารถคำนวณผลรวมเท่านั้น (ซึ่งจะถูกป้อนผ่านแต่ละรายการผ่านฟังก์ชันการเปิดใช้งาน ) พวกเขาต้องประเมินการคูณเหล่านั้นแทนหากพวกเขามีความสำคัญซึ่งต้องการเซลล์ประสาทจำนวนมากโดยเฉพาะอย่างยิ่งหากปัจจัยสามารถขยายช่วงใหญ่

หากปรากฏว่าพื้นที่บ้านเป็นคุณลักษณะสำคัญคุณจะช่วยเครือข่ายได้หากคุณให้พื้นที่กับมันเพราะสามารถใช้เซลล์ประสาทที่จำเป็นต้องใช้ในการประมาณการคูณความกว้างและความยาว ทำสิ่งอื่น ๆ

ดังนั้นในบางกรณีอาจรวมถึงคุณสมบัติพหุนามอาจเป็นประโยชน์ต่อเครือข่าย แต่ในบางกรณีก็ไม่มีผลกระทบอย่างมีนัยสำคัญ นอกจากนี้คุณสมบัติพหุนามเป็นคุณสมบัติที่ได้มาเพียงประเภทเดียวที่อาจเป็นประโยชน์ต่อเครือข่าย คุณสมบัติที่ได้รับอีกประเภทหนึ่งที่อาจเป็นประโยชน์ได้ตัวอย่างเช่นค่าลอการิทึมของตัวแปรอินพุต (ถือว่าเป็นค่าบวก) ซึ่งเครือข่ายต้องประเมินเพื่อให้ได้

ความคิดที่จะอนุญาตให้เครือข่ายทำการดำเนินการระหว่างตัวเลขมากกว่าส่วนเพิ่มเติมเท่านั้นเพื่อให้สามารถคำนวณสิ่งต่าง ๆ เช่นคุณสมบัติพหุนามได้อย่างมีประสิทธิภาพ แต่ไม่ชัดเจนว่าจะทำงานอย่างไร สถาปัตยกรรมหนึ่งที่ดูเหมือนว่ามันไม่สิ่งที่คล้ายกันเป็นเครือข่ายรวมผลิตภัณฑ์

2) ยกเว้นจากค่าใช้จ่ายในการคำนวณที่จอห์นพูดถึงการเพิ่มจำนวนพารามิเตอร์ในโมเดลซึ่งหลีกเลี่ยงไม่ได้เกิดขึ้นเมื่อคุณแนะนำอินพุตมากขึ้นนอกจากนี้ยังเพิ่มความเสี่ยงสำหรับเครือข่ายให้โอเวอร์โหลดโดยเฉพาะถ้าคุณมีข้อมูลการฝึกอบรมน้อย

อย่างไรก็ตามสิ่งนี้สามารถทำให้เกิดปัญหาน้อยลงหากใช้วิธีการทำให้เป็นมาตรฐานที่ดี (ดูเหมือนว่าการออกกลางคันจะทำงานได้ดีมากสำหรับเรื่องนี้) ในทางทฤษฎีด้วยวิธีการทำให้เป็นมาตรฐานที่ดีพอการ overfitting ไม่น่าจะเป็นปัญหาเลย เมื่อฮินตันชี้ให้เห็นว่ามนุษย์มีความสามารถในการเรียงลำดับ 10 ^ 14 ในสมอง (ตรงกับการเชื่อมต่อในเครือข่ายประสาทเทียม) แต่มีชีวิตอยู่ในลำดับ 10 ^ 9 วินาที แต่เราก็ยังคงสามารถ พูดคุยค่อนข้างดี ชัดเจนว่าการมีพารามิเตอร์จำนวนมากที่สามารถปรับได้ควรใช้อัลกอริธึมที่เหมาะสมเท่านั้นจึงจะได้เปรียบ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.