ฉันใช้สองทิศทาง RNN เพื่อตรวจสอบเหตุการณ์ที่เกิดขึ้นไม่สมดุลกัน ชั้นบวกเป็น 100 ครั้งน้อยกว่าชั้นลบ ในขณะที่ไม่มีการใช้งานแบบปกติฉันสามารถได้รับความถูกต้อง 100% ในชุดรถไฟและ 30% สำหรับชุดการตรวจสอบ ฉันเปิดใช้งานการทำให้เป็นปกติ l2 และผลลัพธ์นั้นมีความแม่นยำเพียง 30% ในชุดรถไฟแทนการเรียนรู้ที่ยาวนานขึ้นและความแม่นยำ 100% ในชุดการตรวจสอบความถูกต้อง
ฉันคิดว่าข้อมูลของฉันอาจเล็กเกินไปดังนั้นสำหรับการทดลองฉันรวมชุดรถไฟกับชุดทดสอบซึ่งฉันไม่เคยใช้มาก่อน สถานการณ์เหมือนกันกับฉันจะใช้การทำให้เป็นมาตรฐาน l2 ซึ่งฉันไม่ได้ตอนนี้ ฉันได้รับความแม่นยำ 30% สำหรับรถไฟ + การทดสอบและการตรวจสอบ
ในการใช้หน่วยที่ถูกซ่อน 128 และ 80 เวลาในการทดลองที่กล่าวถึงเมื่อฉันเพิ่มจำนวนหน่วยที่ซ่อนอยู่เป็น 256 ฉันสามารถ overfit บนรถไฟ + ชุดทดสอบอีกครั้งเพื่อให้ได้ความถูกต้อง 100% แต่ยังคงมีเพียง 30% ในชุดการตรวจสอบ
ฉันลองตัวเลือกมากมายสำหรับพารามิเตอร์และเกือบจะไม่มีผลลัพธ์ บางทีเอนโทรปีของการถ่วงน้ำหนักอาจทำให้เกิดปัญหาในการทดลองที่กำหนดน้ำหนักของชั้นบวกคือ 5 ในขณะที่การลองตุ้มน้ำหนักขนาดใหญ่ผลลัพธ์มักจะแย่ลงประมาณ 20% ของความแม่นยำ
ฉันลองเซลล์ LSTM และ GRU ไม่แตกต่างกัน
ผลลัพธ์ที่ดีที่สุดที่ฉันได้รับ ฉันลองเลเยอร์ที่ซ่อนอยู่ 2 แห่งกับ 256 ยูนิตที่ซ่อนอยู่มันใช้เวลาในการคำนวณประมาณ 3 วันและหน่วยความจำ GPU 8GB ฉันมีความแม่นยำประมาณ 40-50% ก่อนที่จะเริ่มทำการ overfitting อีกครั้งในขณะที่การทำให้เป็นมาตรฐาน l2 นั้นเปิดอยู่ แต่ไม่แรงมาก
ฉันใช้เครื่องมือเพิ่มประสิทธิภาพของอดัมคนอื่นทำงานได้ไม่ดี คุณสมบัติที่ฉันมีเพียงพอเพราะในขณะที่ใช้เครื่องรัฐฉันจะได้รับความแม่นยำ 90% ในเครื่องของรัฐนั้นคุณสมบัติหลักคือการรวมและการกำหนดใหม่ขึ้นอยู่กับคุณสมบัติของคุณสมบัติอื่น ๆ และความยาวของตัวแปรบางครั้งมันเป็น 10, บางครั้ง 20 เวลาประทับที่พูดถึงคุณสมบัติ
มีแนวทางทั่วไปที่ควรทำในสถานการณ์นี้หรือไม่? ฉันหาอะไรไม่เจอ