ฉันเตือนไม่ให้คาดหวังว่าจะมีความคล้ายคลึงกันอย่างมากระหว่างเครือข่ายประสาทเทียมและชีวภาพ ฉันคิดว่าชื่อ "โครงข่ายประสาทเทียม" นั้นค่อนข้างอันตรายเพราะมันหลอกคนให้คาดหวังว่ากระบวนการทางระบบประสาทและการเรียนรู้ของเครื่องควรจะเหมือนกัน ความแตกต่างระหว่างเครือข่ายประสาทเทียมและชีวภาพมีมากกว่าความคล้ายคลึงกัน
เป็นตัวอย่างของสิ่งที่เกิดขึ้นได้อย่างไรคุณสามารถเปลี่ยนเหตุผลในการโพสต์ต้นฉบับบนหัวของมัน คุณสามารถฝึกอบรมเครือข่ายประสาทเทียมเพื่อเรียนรู้ที่จะรับรู้รถยนต์ในช่วงบ่ายโดยมีคอมพิวเตอร์ที่รวดเร็วพอสมควรและมีข้อมูลการฝึกอบรมจำนวนหนึ่ง คุณสามารถทำให้เป็นงานไบนารี (รถยนต์ / ไม่ใช่รถยนต์) หรืองานหลายระดับ (รถยนต์ / รถราง / จักรยาน / เครื่องบิน / เรือ) และยังคงมั่นใจในความสำเร็จระดับสูง
ในทางตรงกันข้ามฉันไม่คิดว่าเด็กจะสามารถเลือกรถยนต์ได้ทั้งวัน - หรือแม้แต่สัปดาห์ - หลังจากที่มันเกิดขึ้นแม้หลังจากที่ได้เห็น "ตัวอย่างการฝึกอบรมมากมาย" เห็นได้ชัดว่ามีความแตกต่างระหว่างเด็กอายุสองขวบกับเด็กทารกที่มีความสามารถในการเรียนรู้ที่แตกต่างกันในขณะที่เครือข่ายประสาทการจำแนกภาพวานิลลาสามารถจำแนกประเภทของวัตถุได้ทันทีหลังจากเกิด ฉันคิดว่ามีความแตกต่างที่สำคัญสองประการ: (1) ปริมาณข้อมูลการฝึกอบรมที่มีอยู่และ (2) กลไกการเรียนการสอนด้วยตนเองที่พัฒนาขึ้นตามกาลเวลาเนื่องจากข้อมูลการฝึกอบรมที่มากมาย
โพสต์ต้นฉบับตีแผ่สองคำถาม ชื่อและเนื้อหาของคำถามถามว่าทำไมเครือข่ายประสาทจึงต้องการ "ตัวอย่างมากมาย" เมื่อเปรียบเทียบกับประสบการณ์ของเด็กโครงข่ายประสาทเทียมที่ได้รับการฝึกฝนโดยใช้การเปรียบเทียบภาพทั่วไปมีข้อมูลค่อนข้างน้อย
ฉันจะตอบคำถามในชื่อเรื่องให้อีกครั้ง
"การฝึกอบรมโครงข่ายประสาทเทียมสำหรับเกณฑ์เปรียบเทียบภาพทั่วไปเปรียบเทียบและตรงกันข้ามกับประสบการณ์การเรียนรู้ของเด็กได้อย่างไร"
เพื่อประโยชน์ในการเปรียบเทียบฉันจะพิจารณาข้อมูล CIFAR-10 เพราะเป็นเกณฑ์มาตรฐานรูปภาพทั่วไป ส่วนที่มีข้อความประกอบด้วยรูปภาพ 10 ชั้นที่มี 6,000 รูปต่อชั้นเรียน แต่ละภาพมีขนาด 32x32 พิกเซล หากคุณซ้อนภาพที่มีป้ายกำกับจาก CIFAR-10 และสร้างวิดีโอมาตรฐาน 48 fps คุณจะมีวิดีโอประมาณ 20 นาที
เด็ก 2 ปีที่สังเกตโลกเป็นเวลา 12 ชั่วโมงต่อวันมีประมาณ 263000 นาที (มากกว่า 4000 ชั่วโมง) จากการสังเกตโดยตรงของโลกรวมถึงการตอบรับจากผู้ใหญ่ (ป้ายกำกับ) (ตัวเลขเหล่านี้เป็นเพียง ballpark - ฉันไม่รู้กี่นาทีที่เด็กอายุสองขวบใช้เวลาสำรวจโลก) นอกจากนี้เด็กจะได้สัมผัสกับวัตถุจำนวนมากหลายชิ้นนอกเหนือจากคลาส 10 ที่ประกอบด้วย CIFAR- 10
ดังนั้นจึงมีบางอย่างที่เล่น หนึ่งคือเด็กมีการสัมผัสกับข้อมูลโดยรวมมากขึ้นและเป็นแหล่งข้อมูลที่หลากหลายกว่ารุ่น CIFAR-10 ความหลากหลายของข้อมูลและปริมาณข้อมูลได้รับการยอมรับเป็นอย่างดีว่าเป็นข้อกำหนดเบื้องต้นสำหรับรุ่นที่มีประสิทธิภาพโดยทั่วไป ในแง่นี้ดูเหมือนว่าไม่น่าแปลกใจที่โครงข่ายประสาทนี้จะแย่กว่างานนี้เนื่องจากเด็กที่มีโครงข่ายประสาทที่ได้รับการฝึกฝนใน CIFAR-10 นั้นมีข้อมูลเชิงบวกเมื่อเปรียบเทียบกับเด็กวัยสองขวบ ความละเอียดของภาพสำหรับเด็กนั้นดีกว่าภาพ 32x32 CIFAR-10 ดังนั้นเด็กสามารถเรียนรู้ข้อมูลเกี่ยวกับรายละเอียดของวัตถุอย่างละเอียด
การเปรียบเทียบ CIFAR-10 ถึงสองปีนั้นไม่สมบูรณ์แบบเนื่องจากแบบจำลอง CIFAR-10 จะได้รับการฝึกฝนด้วยการส่งผ่านภาพนิ่งที่เหมือนกันหลายครั้งในขณะที่เด็กจะมองเห็นโดยใช้การมองเห็นแบบสองตา - มิติสามมิติในขณะที่เคลื่อนที่ไปมาและด้วยสภาพแสงและมุมมองที่แตกต่างกันบนวัตถุเดียวกัน
เรื่องเล็ก ๆ น้อย ๆ เกี่ยวกับลูกของ OP หมายถึงคำถามที่สอง
"เครือข่ายประสาทเทียมสามารถเรียนรู้ด้วยตนเองได้อย่างไร"
เด็ก ๆ มีความสามารถพิเศษในการเรียนรู้ด้วยตนเองเพื่อให้สามารถเพิ่มประเภทของวัตถุใหม่ได้ตลอดเวลาโดยไม่ต้องเริ่มต้นใหม่
ข้อสังเกตของ OP เกี่ยวกับการถ่ายโอนการเรียนรู้ชื่อการปรับรูปแบบหนึ่งประเภทในบริบทการเรียนรู้ของเครื่อง
ในความคิดเห็นผู้ใช้รายอื่นได้ชี้ให้เห็นว่าการเรียนรู้แบบหนึ่งและสามช็อตเป็นอีกส่วนหนึ่งของการวิจัยการเรียนรู้ด้วยเครื่อง
นอกจากนี้การเรียนรู้การเสริมแรงจะช่วยให้โมเดลการเรียนรู้ด้วยตนเองจากมุมมองที่แตกต่างกันซึ่งช่วยให้หุ่นยนต์ทำการทดลองแบบลองผิดลองถูกเพื่อหากลยุทธ์ที่ดีที่สุดสำหรับการแก้ปัญหาเฉพาะ (เช่นเล่นหมากรุก)
อาจเป็นเรื่องจริงที่กระบวนทัศน์การเรียนรู้ของเครื่องทั้งสามนี้เป็นสิ่งที่ดีสำหรับการปรับปรุงวิธีการที่เครื่องปรับให้เข้ากับงานการมองเห็นด้วยคอมพิวเตอร์เครื่องใหม่ การปรับรูปแบบการเรียนรู้ของเครื่องให้เข้ากับงานใหม่อย่างรวดเร็วเป็นพื้นที่ของการวิจัย อย่างไรก็ตามเนื่องจากเป้าหมายในทางปฏิบัติของโครงการเหล่านี้ (ระบุอินสแตนซ์ใหม่ของมัลแวร์จดจำผู้กระตุ้นรูปถ่ายหนังสือเดินทางทำดัชนีอินเทอร์เน็ต) และเกณฑ์ความสำเร็จแตกต่างจากเป้าหมายของเด็กที่เรียนรู้เกี่ยวกับโลกและความจริงที่ว่า คอมพิวเตอร์ที่ใช้คณิตศาสตร์และอีกอันทำด้วยวัสดุอินทรีย์โดยใช้เคมีการเปรียบเทียบโดยตรงระหว่างสองอย่างนั้นยังคงเต็มไปด้วยความยากลำบาก
นอกจากนี้มันน่าสนใจที่จะศึกษาวิธีพลิกปัญหา CIFAR-10 ไปรอบ ๆ และฝึกอบรมเครือข่ายประสาทเทียมเพื่อรับรู้วัตถุ 6,000 ชิ้นจาก 10 ตัวอย่างของแต่ละตัวอย่าง แต่สิ่งนี้จะไม่เป็นการเปรียบเทียบที่ยุติธรรมกับเด็กอายุ 2 ปีเพราะยังคงมีความคลาดเคลื่อนจำนวนมากในปริมาณรวมความหลากหลายและความละเอียดของข้อมูลการฝึกอบรม
* ปัจจุบันเราไม่มีแท็กสำหรับการเรียนรู้แบบ one-shot หรือเรียนรู้แบบ shot-shot