วิธีง่าย ๆ ที่จะอธิบายก็คือการทำให้เป็นมาตรฐานนั้นไม่เหมาะสมกับเสียงรบกวน แต่ก็ไม่ได้ทำอะไรมากในแง่ของการกำหนดรูปทรงของสัญญาณ หากคุณคิดว่าการเรียนรู้อย่างลึกซึ้งในฐานะผู้ประมาณฟังก์ชั่นที่ยอดเยี่ยมขนาดยักษ์คุณจะรู้ว่ามันต้องการข้อมูลจำนวนมากเพื่อกำหนดรูปทรงของสัญญาณที่ซับซ้อน
หากไม่มีเสียงดังรบกวนการเพิ่มความซับซ้อนของ NN จะทำให้การประมาณดีขึ้น จะไม่มีการลงโทษใด ๆ กับขนาดของ NN ที่ใหญ่กว่าจะดีกว่าในทุกกรณี พิจารณาเทย์เลอร์โดยประมาณคำศัพท์อื่น ๆ จะดีกว่าสำหรับฟังก์ชันที่ไม่ใช่พหุนาม (ละเว้นปัญหาความแม่นยำเชิงตัวเลข)
สิ่งนี้จะพังเมื่อมีสัญญาณรบกวนเนื่องจากคุณเริ่มปรับให้เหมาะสมกับเสียงรบกวน ดังนั้นนี่คือการทำให้เป็นปกติเพื่อช่วย: มันอาจลดความเหมาะสมของสัญญาณรบกวนดังนั้นเราจึงสามารถสร้างNN ที่ใหญ่กว่าเพื่อให้เหมาะกับปัญหาที่ไม่เชิงเส้น
การสนทนาต่อไปนี้ไม่จำเป็นสำหรับคำตอบของฉัน แต่ฉันเพิ่มบางส่วนเพื่อตอบความคิดเห็นและกระตุ้นให้เนื้อหาหลักของคำตอบข้างต้น โดยพื้นฐานแล้วคำตอบที่เหลือของฉันก็เหมือนกับไฟไหม้ฝรั่งเศสที่มาพร้อมกับอาหารเบอร์เกอร์คุณสามารถข้ามมันได้
(Ir) กรณีที่เกี่ยวข้อง: การถดถอยพหุนาม
ลองดูตัวอย่างของเล่นของการถดถอยพหุนาม นอกจากนี้ยังเป็นตัวประมาณที่ดีมากสำหรับฟังก์ชั่นต่างๆ เราจะมองไปที่ฟังก์ชั่นในภูมิภาค อย่างที่คุณเห็นได้จากซีรี่ส์ของ Taylor ด้านล่างการขยายลำดับที่ 7 นั้นค่อนข้างดีอยู่แล้วดังนั้นเราสามารถคาดหวังได้ว่าพหุนามของลำดับที่ 7+ น่าจะพอดีเช่นกัน:x ∈ ( - 3 , 3 )sin(x)x∈(−3,3)
ต่อไปเราจะใส่พหุนามกับคำสั่งที่สูงขึ้นเรื่อย ๆ กับชุดข้อมูลที่มีเสียงดังมาก ๆ พร้อมข้อสังเกต 7 ข้อ:
เราสามารถสังเกตสิ่งที่เราได้รับการบอกเล่าเกี่ยวกับชื่อพหุนามที่หลายคนรู้จัก: พวกมันไม่เสถียรและเริ่มสั่นคลอนอย่างดุเดือดเมื่อมีคำสั่งพหุนามเพิ่มขึ้น
อย่างไรก็ตามปัญหาไม่ใช่ตัวพหุนาม ปัญหาคือเสียงรบกวน เมื่อเราใส่ชื่อพหุนามกับข้อมูลที่มีเสียงดังส่วนหนึ่งของความพอดีคือเสียงดังไม่ใช่สัญญาณ นี่คือชื่อพหุนามที่เหมือนกันพอดีกับชุดข้อมูลเดียวกัน แต่มีการขจัดจุดรบกวนอย่างสมบูรณ์ เหมาะอย่างยิ่ง!
ขอให้สังเกตแบบที่สมบูรณ์แบบสำหรับการสั่งซื้อสายตา 6. นี้ไม่ควรแปลกใจตั้งแต่วันที่ 7 ข้อสังเกตคือทั้งหมดที่เราจำเป็นต้องระบุตัวตนเพื่อที่ 6 พหุนามและที่เราเห็นจากพล็อตเทย์เลอร์ประมาณข้างต้นว่าการสั่งซื้อที่มีอยู่แล้ว 6 ประมาณการที่ดีมากที่จะในช่วงข้อมูลของเราsin(x)
นอกจากนี้โปรดสังเกตว่าชื่อพหุนามคำสั่งที่สูงกว่านั้นไม่เหมาะกับคำสั่งที่ 6 เนื่องจากมีการสังเกตไม่เพียงพอที่จะกำหนด ลองดูว่าเกิดอะไรขึ้นกับการสังเกต 100 ข้อ ในแผนภูมิด้านล่างคุณจะเห็นว่าชุดข้อมูลขนาดใหญ่ช่วยให้เราสามารถใส่คำสั่งชื่อพหุนามที่สูงขึ้นได้อย่างไร
เยี่ยมมาก แต่ปัญหาคือเรามักจะจัดการกับข้อมูลที่มีเสียงดัง ดูสิ่งที่เกิดขึ้นหากคุณพอดีกับการสังเกต 100 ครั้งของข้อมูลที่มีเสียงดังมากดูแผนภูมิด้านล่าง เรากลับไปที่สี่เหลี่ยมจัตุรัสหนึ่ง: พหุนามลำดับที่สูงขึ้นทำให้เกิดการสั่นที่น่ากลัว ดังนั้นการเพิ่มชุดข้อมูลจึงไม่ช่วยในการเพิ่มความซับซ้อนของแบบจำลองเพื่ออธิบายข้อมูลได้ดีขึ้น นี่เป็นอีกครั้งเพราะโมเดลที่ซับซ้อนนั้นเหมาะสมกว่าไม่เพียง แต่กับรูปร่างของสัญญาณ แต่ยังรวมถึงรูปร่างของเสียงด้วย
ในที่สุดเรามาลองใช้การทำให้เป็นมาตรฐานสำหรับปัญหานี้ แผนภูมิด้านล่างแสดงการทำให้เป็นมาตรฐาน (ซึ่งมีบทลงโทษแตกต่างกัน) นำไปใช้กับการถดถอยพหุนาม 9 เปรียบเทียบสิ่งนี้กับคำสั่ง (กำลัง) 9 พอดีกับพหุนามข้างต้น: ในระดับที่เหมาะสมของการทำให้เป็นมาตรฐานมันเป็นไปได้ที่จะพอดีกับพหุนามคำสั่งที่สูงขึ้นกับข้อมูลที่มีเสียงดัง
ในกรณีที่มันไม่ชัดเจน: ฉันไม่แนะนำให้ใช้การถดถอยพหุนามด้วยวิธีนี้ พหุนามเป็นสิ่งที่ดีสำหรับคนในท้องถิ่นดังนั้นพหุนามที่ชาญฉลาดจึงเป็นทางเลือกที่ดี เพื่อให้พอดีกับโดเมนทั้งหมดกับพวกเขามักจะเป็นความคิดที่ไม่ดีเพราะพวกเขามีความไวต่อเสียงรบกวนแน่นอนเพราะมันควรจะเห็นได้ชัดจากแปลงข้างต้น เสียงไม่ว่าจะเป็นตัวเลขหรือมาจากแหล่งอื่น ๆ นั้นไม่สำคัญเท่าไรในบริบทนี้ เสียงนั้นเป็นเสียงรบกวนและพหุนามจะตอบสนองต่อมันอย่างหลงใหล