การเพิ่มเสียงในข้อมูลช่วยปรับปรุงความสามารถในการเรียนรู้ของเครือข่ายหรือไม่? มันสร้างความแตกต่างหรือไม่หรือขึ้นอยู่กับปัญหาที่กำลังแก้ไข? มันส่งผลกระทบต่อกระบวนการทั่วไปอย่างไร?
การเพิ่มเสียงในข้อมูลช่วยปรับปรุงความสามารถในการเรียนรู้ของเครือข่ายหรือไม่? มันสร้างความแตกต่างหรือไม่หรือขึ้นอยู่กับปัญหาที่กำลังแก้ไข? มันส่งผลกระทบต่อกระบวนการทั่วไปอย่างไร?
คำตอบ:
สัญญาณรบกวนในข้อมูลในปริมาณที่เหมาะสมอาจช่วยให้เครือข่ายทั่วไปดีขึ้น บางครั้งมันก็มีผลตรงกันข้าม ส่วนหนึ่งขึ้นอยู่กับชนิดของเสียง ("จริง" เทียบกับประดิษฐ์)
AI คำถามที่พบบ่อยเกี่ยวกับ ANNจะช่วยให้ภาพรวมที่ดี ข้อความที่ตัดตอนมา:
เสียงรบกวนในข้อมูลจริงนั้นไม่ใช่สิ่งที่ดีเนื่องจากมันจำกัดความแม่นยำของการวางนัยทั่วไปที่สามารถทำได้ไม่ว่าจะมีชุดการฝึกอบรมที่กว้างขวางเพียงใด ในอีกทางหนึ่งการฉีดเสียงเทียม (กระวนกระวายใจ) ลงในอินพุตระหว่างการฝึกอบรมเป็นหนึ่งในหลายวิธีในการปรับปรุงการทำงานทั่วไปให้ราบรื่นเมื่อคุณมีชุดฝึกอบรมขนาดเล็ก
ในบางสาขาเช่นการมองเห็นด้วยคอมพิวเตอร์เป็นเรื่องปกติที่จะเพิ่มขนาดของชุดฝึกอบรมโดยการคัดลอกตัวอย่างและเพิ่มเสียงหรือการแปลงอื่น ๆ
โดยทั่วไปเราคิดว่ารูปแบบการเรียนรู้ของเครื่องเป็นแบบจำลองสองส่วนที่แตกต่างกันของข้อมูลการฝึกอบรม - ความจริง generalizable พื้นฐาน (สัญญาณ) และการสุ่มเฉพาะชุดข้อมูลนั้น (เสียง)
การติดตั้งทั้งสองส่วนเพิ่มความแม่นยำของชุดการฝึกอบรม แต่การปรับสัญญาณยังเพิ่มความแม่นยำของชุดการทดสอบ (และประสิทธิภาพที่แท้จริงของโลก) ในขณะที่การปรับแต่งเสียงจะลดลงทั้งสองอย่าง ดังนั้นเราจึงใช้สิ่งต่าง ๆ เช่นการทำให้เป็นปกติและการออกกลางคันและเทคนิคที่คล้ายกันเพื่อทำให้มันยากขึ้นเพื่อให้พอดีกับเสียงรบกวนและมีแนวโน้มที่จะเหมาะสมกับสัญญาณมากขึ้น
การเพิ่มปริมาณเสียงรบกวนในข้อมูลการฝึกอบรมเป็นวิธีหนึ่งดังกล่าว แต่ดูเหมือนว่าจะไม่เป็นประโยชน์ เปรียบเทียบกระวนกระวายใจแบบสุ่มกับการส่งเสริมที่ไม่เหมาะสมเช่น ครั้งแรกจะช้าและโดยอ้อมปรับปรุงความทนทานในขณะที่หลังจะปรับปรุงอย่างมากและโดยตรง
PS: มีคำตอบที่ดีอยู่แล้วที่นี่ฉันจะเพิ่มคำตอบนี้ด้วยความหวังว่าบางคนจะพบว่ามีประโยชน์:
การแนะนำเสียงให้กับชุดข้อมูลอาจมีอิทธิพลเชิงบวกต่อแบบจำลองได้ ในความเป็นจริงนี้สามารถมองเห็นเป็นทำในสิ่งเดียวกันที่คุณมักจะทำอะไรกับregularizersเช่นการออกกลางคัน ตัวอย่างบางส่วนของการทำเช่นนี้คือZur at.al , Cires¸at.alซึ่งผู้เขียนประสบความสำเร็จในการนำชุดข้อมูลไปใช้เพื่อลดเสียงรบกวนในชุดข้อมูล
จับอยู่ในรู้ว่าเสียงมากเกินไป หากคุณเพิ่มสัญญาณรบกวนมากเกินไปสิ่งนี้อาจทำให้ชุดข้อมูลของคุณไร้ประโยชน์เนื่องจากชุดข้อมูลที่ได้อาจไม่มีความคล้ายคลึงกับชุดข้อมูลดั้งเดิมอีกต่อไปดังนั้นคุณอาจฝึกอบรมชุดข้อมูลที่แตกต่างไปจากเดิมอย่างสิ้นเชิง ดังนั้นเสียงรบกวนมากเกินไปอาจทำให้เกิดข้อผิดพลาดเช่นเดียวกับอัตราการออกกลางคันที่สูงมาก
เป็นคำพูดที่ไป; ความสมดุลในการเปลี่ยนแปลงคือเครื่องเทศแห่งชีวิต :)