1
เหตุใดการร้องขอ GPUs เป็นทรัพยากรทั่วไปในคลัสเตอร์ที่ใช้ SLURM ที่มีปลั๊กอินในตัวล้มเหลว
คำเตือน: โพสต์นี้ค่อนข้างยาวเพราะฉันพยายามให้ข้อมูลการกำหนดค่าที่เกี่ยวข้องทั้งหมด สถานะและปัญหา: ฉันยอมรับคลัสเตอร์ gpu และฉันต้องการใช้ slurm สำหรับการจัดการงาน โชคไม่ดีที่ฉันไม่สามารถร้องขอ GPU ได้โดยใช้ปลั๊กอินทรัพยากรทั่วไปที่เกี่ยวข้องของ slurm หมายเหตุ: test.sh เป็นสคริปต์ขนาดเล็กที่พิมพ์ตัวแปรสภาพแวดล้อม CUDA_VISIBLE_DEVICES การรันงานด้วย--gres=gpu:1ไม่สมบูรณ์ แสดงsrun -n1 --gres=gpu:1 test.shผลลัพธ์ในข้อผิดพลาดต่อไปนี้: srun: error: Unable to allocate resources: Requested node configuration is not available เข้าสู่ระบบ: gres: gpu state for job 83 gres_cnt:4 node_cnt:0 type:(null) _pick_best_nodes: job 83 never runnable _slurm_rpc_allocate_resources: Requested …