ฉันเริ่มต้นโครงการที่มีหน้าที่ระบุประเภทรองเท้าผ้าใบจากรูปภาพ ฉันกำลังอ่านเกี่ยวกับการใช้งานTensorFlowและTorch คำถามของฉันคือต้องมีกี่ภาพต่อชั้นเพื่อให้ได้ประสิทธิภาพการจำแนกประเภทที่เหมาะสม
ฉันเริ่มต้นโครงการที่มีหน้าที่ระบุประเภทรองเท้าผ้าใบจากรูปภาพ ฉันกำลังอ่านเกี่ยวกับการใช้งานTensorFlowและTorch คำถามของฉันคือต้องมีกี่ภาพต่อชั้นเพื่อให้ได้ประสิทธิภาพการจำแนกประเภทที่เหมาะสม
คำตอบ:
จาก ตัวอย่างการฝึกอบรมมีน้อยเกินไปเมื่อฝึกอบรมโครงข่ายประสาทเทียม บน CV:
มันขึ้นอยู่กับชุดข้อมูลของคุณและสถาปัตยกรรมเครือข่าย หนึ่งกฎง่ายๆที่ฉันได้อ่าน (2) คือตัวอย่างสองสามพันตัวอย่างต่อคลาสเพื่อให้เครือข่ายประสาทเทียมเริ่มทำงานได้ดีมาก ในทางปฏิบัติผู้คนลองและดู
วิธีที่ดีในการประเมินคร่าวๆว่ามันจะเป็นประโยชน์ต่อการมีตัวอย่างการฝึกอบรมมากขึ้นคือการวางแผนการทำงานของโครงข่ายประสาทเทียมตามขนาดของชุดฝึกอบรมเช่นจาก (1):
(2) Cireşan, Dan C. , Ueli Meier และJürgen Schmidhuber "ถ่ายโอนการเรียนรู้สำหรับตัวอักษรละตินและจีนด้วยเครือข่ายประสาทลึก" ในการประชุมร่วมระหว่างประเทศปี 2555 เรื่องโครงข่ายประสาทเทียม (IJCNN), หน้า 1-6 IEEE, 2012 https://scholar.google.com/scholar?cluster=7452424507909578812&hl=th&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :
สำหรับงานการจำแนกประเภทที่มีตัวอย่างไม่กี่พันตัวอย่างต่อชั้นผลประโยชน์ของการเตรียมล่วงหน้า (แบบไม่ดูแลหรือดูแล) นั้นไม่ใช่เรื่องง่ายที่จะแสดงให้เห็น
วิธีที่ดีที่สุดคือการรวบรวมข้อมูลให้ได้มากที่สุด จากนั้นเริ่มต้นกับโครงการและสร้างแบบจำลองข้อมูล
ตอนนี้คุณสามารถประเมินโมเดลของคุณเพื่อดูว่ามันมีอคติสูงหรือความแปรปรวนสูง
ความแปรปรวนสูง : ในสถานการณ์นี้คุณจะเห็นว่าข้อผิดพลาดการตรวจสอบความถูกต้องสูงกว่าข้อผิดพลาดการฝึกอบรมหลังจากการบรรจบกันมีช่องว่างที่สำคัญถ้าคุณพล็อตแบบเดียวกันกับขนาดข้อมูลการฝึกอบรม
High Bias : ในสถานการณ์นี้ข้อผิดพลาดการตรวจสอบข้ามจะสูงกว่าข้อผิดพลาดการฝึกอบรมเล็กน้อยซึ่งตัวเองสูงเมื่อถูกพล็อตเทียบกับขนาดข้อมูลการฝึกอบรมโดยวางแผนกับขนาดข้อมูลการฝึกอบรมที่ฉันหมายถึงคุณสามารถป้อน และพล็อตข้อผิดพลาด
หากคุณเห็นรูปแบบของคุณมีความแปรปรวนสูง (มากเกินไป) การเพิ่มข้อมูลมักจะช่วยในทางตรงกันข้ามกับโมเดลที่มีอคติสูง (ต่ำกว่า) ซึ่งการเพิ่มข้อมูลการฝึกอบรมใหม่ไม่ได้ช่วยอะไร
นอกจากนี้ในแต่ละชั้นเรียนคุณต้องพยายามทำให้ได้จำนวนภาพเท่ากันไม่เช่นนั้นชุดข้อมูลอาจเบ้ (มากกว่าหนึ่งประเภท)
นอกจากนี้ฉันขอแนะนำให้คุณใช้TensorFlowหรือไม่อ่านเพิ่มเติมเกี่ยวกับINCEPTION Image Classifier ของ GOOGLE มันได้รับการฝึกฝนแล้วลักษณนามบนฐานข้อมูลภาพของ google และคุณสามารถใช้มันสำหรับภาพของคุณด้วยวิธีการที่ต้องการสำหรับจำนวนภาพที่ลดลงอย่างมาก