คุณอาจเคยได้ยินมันบอกว่าเครือข่ายประสาทเทียมเป็น "ตัวประมาณฟังก์ชั่นสากล " ในสาระสำคัญทฤษฎีบท Cybenko บอกว่าสำหรับการทำแผนที่ฟังก์ชั่นใด ๆ ที่ reals คุณสามารถประมาณได้ด้วยเครือข่ายประสาทที่มีฟังก์ชั่นการเปิดใช้งาน sigmoid ในความเป็นจริงปรากฎว่าเครือข่ายประสาทเทียมช่วยให้คุณสามารถคำนวณฟังก์ชันใด ๆ ที่คำนวณโดยเครื่องทัวริง (เช่นสิ่งใดก็ตามที่คุณสามารถเขียนอัลกอริธึมเพื่อคำนวณ) น่าเสียดายที่หลักฐานเหล่านี้บอกเพียงว่าสำหรับการกำหนดค่าบางอย่างของเซลล์ประสาทและน้ำหนักคุณสามารถประมาณฟังก์ชั่นใด ๆ
ทฤษฎีเป็นสิ่งที่ดีและสวยงาม แต่คำถามของคุณดูเหมือนจะเป็นไปตามแนวทางการเข้ารหัสการคำนวณของฟังก์ชันบางอย่างในชุดของเซลล์ประสาทและน้ำหนัก เพื่ออธิบายให้พิจารณาตัวอย่างง่ายๆ - แบบพิเศษหรือ XOR รับสองอินพุตผ่านอินพุตเหล่านั้น เมื่อเปิดใช้งานอินพุตอินพุตเพียงหนึ่งอินพุตเท่านั้นโหนดเอาต์พุตจะถูกเปิดใช้งาน เมื่อเปิดใช้งานอินพุตทั้งสองหรือไม่อินพุตจะไม่เปิดใช้งานโหนดเอาต์พุต
ขอให้สังเกตว่าสามโหนที่ซ่อนอยู่ทำสิ่งต่าง ๆ โหนดซ้ายและขวาส่วนใหญ่จะผ่านการเปิดใช้งานโหนดการป้อนข้อมูลด้วยความเคารพ เซลล์ประสาทตรงกลางจะรับอินพุตทั้งสองและจะลบล้างพวกมันหากพวกมันทั้งคู่เปิดอยู่ การรวมกันอย่างชาญฉลาดและการรวมเข้าด้วยกันของอินพุตเป็นวิธีการทำงานในเครือข่ายประสาทเทียม
เห็นได้ชัดว่าสำหรับฟังก์ชั่นที่ซับซ้อนมากขึ้นการรวมและการรวมตัวกันอีกครั้งจะต้องทำในวิธีที่ชาญฉลาดและซับซ้อนมากขึ้น แต่นี่คือสิ่งสำคัญที่เกิดขึ้นในระดับต่ำ สิ่งที่บ้าคือนี่คือสิ่งที่คุณต้องการในการคำนวณฟังก์ชั่นการคำนวณใด ๆ ! จากนั้นอีกครั้งเครื่องทัวริงก็กลายเป็นเรื่องง่ายที่หลอกลวง ...
ปัญหาคือเราไม่มีวิธีสร้างเครือข่ายประสาทเทียมที่คำนวณฟังก์ชันตามอำเภอใจได้อย่างน่าอัศจรรย์ หลักฐานเพียงบอกเราว่ามีบางเครือข่ายออกมีที่สามารถทำได้ เมื่อเราฝึกโครงข่ายประสาทเราแค่พยายามหาเครือข่ายที่ใกล้เคียง
ในบริบทของการจดจำรูปภาพคุณสามารถจินตนาการถึงรูปแบบการเข้ารหัสในเครือข่าย ตัวอย่างเช่นหากต้องการจดจำหมายเลข '1' คุณสามารถจินตนาการถึงโหนดที่ซ่อนอยู่ซึ่งคาดว่าคอลัมน์พิกเซลจะเปิดใช้งานเป็นส่วนใหญ่หรือทั้งหมดเปิดใช้งานโดยปิดพิกเซลที่อยู่ใกล้เคียง โหนดที่ซ่อนอยู่นี้อาจดีพอที่จะรับรู้เส้นตรงในคอลัมน์นั้น ใส่ให้พอเข้าด้วยกันและในไม่ช้าคุณก็มีโหนดมากมายที่ทำมันในสถานที่ที่มีภาพของคุณมากพอที่จะแสดงให้เห็นว่าถ้าฉันแสดงเครือข่ายหนึ่ง ๆ ปัญหาของการเรียนการสอนกลายเป็นเรื่องทั่วไปของเครือข่ายเพื่อให้สามารถรับรู้ชุดของอินพุตที่หลากหลาย
หวังว่านี่จะช่วยให้คุณเข้าใจแนวคิดของโครงข่ายประสาทที่สามารถทำการคำนวณได้มากขึ้นหรือน้อยลง อย่างไรก็ตามคุณได้พบกับจุดที่ค่อนข้างสำคัญเกี่ยวกับเครือข่ายประสาท: โดยทั่วไปแล้วมันเป็นเรื่องยากที่จะเข้าใจว่าทำไมเครือข่ายพ่นเอาท์พุทโดยเฉพาะอย่างยิ่งโดยเฉพาะอย่างยิ่งเมื่อคุณพิจารณาสิ่งนั้นเช่นการรับรู้ภาพ ใหญ่พอที่มนุษย์จะมีช่วงเวลาที่ยากลำบากในการทำความเข้าใจแต่ละส่วนที่เคลื่อนไหวของเครื่องจักร สิ่งที่ทำให้เกิดความยุ่งยากมากขึ้นคือโดยทั่วไปโครงข่ายประสาทส่วนใหญ่ไม่มีโหนดที่ซ่อนอยู่เพียงตัวเดียวสำหรับคุณสมบัติเล็ก ๆ น้อย ๆ แต่ละเครือข่ายสามารถเรียนรู้เกี่ยวกับข้อมูลได้ แต่การตรวจจับบางอย่างเช่นเส้นตรงเพื่อจำแนกหมายเลข '1' จะเกิดขึ้นในลักษณะที่ไม่รวมศูนย์ผ่านโหนดที่ซ่อนอยู่จำนวนมาก อัลกอริทึมอื่น ๆ
หากคุณกำลังมองหาการอ่านเพิ่มเติมฉันขอแนะนำให้อ่านบทแนะนำนี้ที่ ai junkie มันจะนำคุณไปสู่พื้นฐานของการทำงานของเครือข่ายประสาทและยังให้ตัวอย่างรหัสง่ายๆที่ทำให้เครือข่ายประสาทเทียมขับรถถังไปสู่เป้าหมาย อย่างไรก็ตามการสอนไม่ครอบคลุม backpropagation ซึ่งเป็นวิธีที่ใช้กันโดยทั่วไปมากที่สุดในการฝึกอบรมโครงข่ายประสาทเทียมและใช้อัลกอริธึมทางพันธุกรรมแบบง่าย ๆ แทน เมื่อเขาเริ่มพูดพันธุศาสตร์ฉันคิดว่าคุณสามารถหยุดอ่าน ...