ในสถานการณ์ส่วนใหญ่ข้อมูลได้มากขึ้นมักจะดีกว่า การเอาชนะมากเกินไปคือการเรียนรู้สหสัมพันธ์ปลอมที่เกิดขึ้นในข้อมูลการฝึกอบรมของคุณ แต่ไม่ใช่โลกแห่งความจริง ตัวอย่างเช่นหากคุณพิจารณาเฉพาะเพื่อนร่วมงานของฉันคุณอาจเรียนรู้ที่จะเชื่อมโยง "ชื่อแมตต์" กับ "มีเครา" ใช้ได้จริง 100% ( , แม้!) แต่โดยทั่วไปไม่เป็นความจริง การเพิ่มขนาดของชุดข้อมูลของคุณ (เช่นทั้งอาคารหรือเมือง) ควรลดความสัมพันธ์ปลอม ๆ เหล่านี้และปรับปรุงประสิทธิภาพของผู้เรียนของคุณn = 4
นั่นคือสถานการณ์หนึ่งที่ข้อมูลจำนวนมากไม่ได้ช่วย --- และอาจเจ็บ - คือถ้าข้อมูลการฝึกอบรมเพิ่มเติมของคุณมีเสียงดังหรือไม่ตรงกับสิ่งที่คุณพยายามทำนาย ฉันเคยทำการทดลองที่ฉันเสียบโมเดลภาษาที่แตกต่างกัน [*] เข้ากับระบบจองร้านอาหารที่เปิดใช้งานด้วยเสียง ฉันเปลี่ยนแปลงปริมาณข้อมูลการฝึกอบรมรวมถึงความเกี่ยวข้อง: ณ จุดหนึ่งฉันมีคอลเล็กชั่นรวบรวมผู้คนที่จองโต๊ะอย่างละเอียดซึ่งเป็นคู่ที่สมบูรณ์แบบสำหรับใบสมัครของฉัน ที่อื่น ๆ ผมก็มีแบบประเมินจากขนาดใหญ่คอลเลกชันของวรรณกรรมคลาสสิกรูปแบบภาษาที่ถูกต้องมากขึ้น แต่การแข่งขันที่เลวร้ายมากไปยังโปรแกรมประยุกต์ ด้วยความประหลาดใจของฉันโมเดลที่มีขนาดเล็ก แต่มีความเกี่ยวข้องมีประสิทธิภาพสูงกว่าโมเดลที่มีขนาดใหญ่ แต่น้อยกว่านั้นมาก
สถานการณ์ที่น่าประหลาดใจที่เรียกว่า
โคตรสองครั้งก็เกิดขึ้นเมื่อขนาดของชุดการฝึกอบรมใกล้เคียงกับจำนวนพารามิเตอร์โมเดล ในกรณีเหล่านี้ความเสี่ยงในการทดสอบจะลดลงก่อนตามขนาดของชุดฝึกอบรมที่เพิ่มขึ้นเพิ่มขึ้นชั่วคราวเมื่อ
เพิ่มข้อมูลการฝึกอบรมอีกเล็กน้อยและในที่สุดก็เริ่มลดลงอีกครั้งเมื่อชุดฝึกอบรมยังคงเติบโต ปรากฏการณ์นี้ถูกรายงาน 25 ปีในวรรณคดีโครงข่ายประสาท (ดู Opper, 1995) แต่เกิดขึ้นในเครือข่ายสมัยใหม่ด้วย (
Advani and Saxe, 2017 ) สิ่งที่น่าสนใจนี้เกิดขึ้นแม้จะมีการถดถอยเชิงเส้นแม้ว่าจะเหมาะสมโดย SGD (
Nakkiran, 2019) ปรากฏการณ์นี้ยังไม่เป็นที่เข้าใจอย่างสมบูรณ์และมีความสนใจในเชิงทฤษฎีเป็นส่วนใหญ่: ฉันจะไม่ใช้มันเป็นเหตุผลที่จะไม่รวบรวมข้อมูลเพิ่มเติม (แม้ว่าฉันอาจเล่นซอกับขนาดชุดฝึกอบรมหาก n == p และประสิทธิภาพการทำงานไม่ดีโดยไม่คาดคิด )
[*] โมเดลภาษาเป็นเพียงความน่าจะเป็นที่จะเห็นลำดับของคำเช่น'สุนัขจิ้งจอก'}) สิ่งเหล่านี้มีความสำคัญต่อการสร้างตัวจดจำคำพูด / อักขระที่เหมาะสม
P( ด้วยn= 'ด่วน', wn + 1= 'สีน้ำตาล', wn + 2= 'fox' )