ใน dell core i7 ของฉัน - RAM 16GB - แล็ปท็อป GPU ความจุ 4 ล้าน 960m ฉันกำลังทำงานในโครงการเพื่อจัดประเภทภาพปอด CT โดยใช้ 3d CNN ฉันใช้ซีพียูรุ่น tensorflow ภาพถูกจัดทำขึ้นเป็นขนาดอาร์เรย์แบบ numpy (25,50,50)
โมเดล CNN ของฉันมี 2 Conv ชั้น, maxpool สองชั้น, หนึ่งชั้น FC และชั้นผลลัพธ์ ด้วยสถาปัตยกรรมนี้ฉันสามารถฝึกฝนโมเดลด้วยตัวอย่างประมาณ (5,000 ถึง 6,000) หลังจากเพิ่มเลเยอร์มากขึ้นแบบจำลองของฉันตอนนี้มีชั้นความเชื่อมั่น 6 ชั้น, เลเยอร์พูลสูงสุด 3 ชั้น, FC และชั้นผลลัพธ์ ปัญหาของฉันคือหลังจากเปลี่ยนสถาปัตยกรรมที่มีตัวอย่างมากกว่า 1,000 ตัวอย่างหน่วยความจำของฉันเต็มและฉันได้รับข้อผิดพลาดของหน่วยความจำ ฉันพยายามทำให้แบทช์เล็กลง แต่ทุกครั้งที่ได้รับข้อผิดพลาดเดียวกัน ฉันมีสองคำถาม:
ทำไมการเพิ่มเลเยอร์เพิ่มขึ้นโมเดลต้องการหน่วยความจำเพิ่มขึ้น
มีวิธีจัดการกับปัญหาประเภทนี้หรือไม่?