NVIDIA-SMI ล้มเหลวเนื่องจากไม่สามารถสื่อสารกับไดรเวอร์ NVIDIA ตรวจสอบให้แน่ใจว่าได้ติดตั้งและใช้งานไดรเวอร์ NVIDIA รุ่นล่าสุดแล้ว


23

ฉันเพิ่งติดตั้ง CUDA ในสมุดบันทึกเช่นนี้:

sudo apt-get install cuda

เช่นกล่าวว่าที่นี่

การรวบรวม wokrs ทำได้ดี แต่เมื่อฉันพยายามเรียกใช้ฉันมีปัญหา followin: ข้อผิดพลาดของ CUDA ที่ file.cu:128 รหัส = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (สตรีม [i]))"

เวอร์ชัน ncc ของฉัน:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

ข้อมูลกราฟิกการ์ด:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

ฉันยังติดตั้ง VirtualGL, bumblebee-nvidia, primus, freeglut3-dev ต่อไปนี้

เมื่อฉันพยายามที่จะทำงานอะไรบางอย่างบนภมรฉันได้รับนี้: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

ไดรเวอร์ nvidia ไม่ทำงาน

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

ดูเหมือนว่าติดตั้ง nvidia 375 version แล้วแต่ฉันไม่สามารถใช้งานได้

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

และข้อมูลไดรเวอร์บางอย่าง

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

ฉันคิดว่าอาจเป็นปัญหารุ่นของไดรเวอร์:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

ฉันกำลังคิดถึงอะไร


คุณติดตั้งไดรเวอร์ได้อย่างไร?
Charlie Parker

ประสบกับข้อผิดพลาดเดียวกันและไม่มีคำตอบใดที่ทำงานได้ $ reboot nowสิ่งที่ได้ทำงานเป็นที่เรียบง่าย:
darthbhyrava

คำตอบ:


14

ถ้าคุณnvidia-smiล้มเหลวในการสื่อสาร prime-selectแต่คุณได้ติดตั้งไดรเวอร์หลายครั้งเพื่อตรวจสอบ

  1. วิ่งprime-select queryเพื่อรับตัวเลือกที่เป็นไปได้ทั้งหมด nvidia | intelคุณควรจะเห็นอย่างน้อย
  2. prime-select nvidiaเลือก
  3. ถ้ามีข้อความว่าnvidia is already selectedให้เลือกอันอื่นเช่นprime-select intelจากนั้นเปลี่ยนกลับเป็น nvidiaprime-select nvidia
  4. Reboot nvidia-smiและตรวจสอบ

ช่วยฉันด้วย ขอบคุณ!
Yaroslav Schubert

1
อ๊ะprime-select queryไม่ได้
จด

11

คุณอาจต้องการติดตั้งชุดเครื่องมือ cuda ใช้คำสั่งต่อไปนี้เพื่อติดตั้ง

sudo apt install nvidia-cuda-toolkit

เมื่อการติดตั้งเสร็จสิ้นให้รีบูตเครื่อง nvidia-smiควรทำงาน.


ได้ผลสำหรับฉัน !!
x0v

สิ่งนี้ใช้ได้สำหรับฉัน
Sundeep

6
มันไม่ทำงานที่นี่
Bill Kotsias

2
อย่าทำสิ่งนี้ถ้าคุณมี cuda> = 10 มันจะลดระดับ cuda ของคุณเป็น 9 ซึ่งมีให้บริการบน Ubuntu ในปัจจุบันโดยไม่มี CUDA PPA
loretoparisi

ทำsudo apt-get purge nvidia-*ก่อนหน้านี้จากนั้นบรรทัดข้างต้นแก้ไขทุกอย่างที่เกี่ยวข้องกับฉัน CUDA ติดตั้งไดรเวอร์ 430 ด้วย CUDA 10.1
Dinari

6

ฉันปิดใช้งาน Secure Boot และทำงานได้ดี

@ แกนสมิ ธ aswered อีกคำถามที่เฉพาะเจาะจงมากขึ้นอธิบายวิธีการที่จะทำมันโดยทั่วไปคือการตั้งค่าการติดตั้ง แต่เขายังเขียนบทความที่ดีเกี่ยวกับวิธีการทำในที่นี่


2
มันช่วยฉันด้วยไดรเวอร์ NVIDIA รุ่น 390 ด้วย! ฉันไม่เคยคิดว่าอาจเป็นเพราะการบูตอย่างปลอดภัยขอบคุณ
samutamm

โหมด UEFI พร้อมการเปิดใช้งานการรักษาความปลอดภัยเริ่มต้นแล้ว =) ดูเหมือนว่าจะไม่ได้ผลสำหรับทุกคน แต่น่าเสียดายที่
Renan Willian Prado

3

เนื่องจากฉันไม่สามารถแสดงความคิดเห็นกับคำตอบของ @ Rodolfo ด้านบน (ชื่อเสียงไม่เพียงพอ) ฉันจึงเพิ่มคำตอบใหม่

บนเครื่องของฉันฉันต้องกำหนดค่าSecure Bootตามระบบปฏิบัติการของฉัน ฉันมีเมนบอร์ด ASUS ที่ใช้งาน Ubuntu 18.04 และพยายามติดตั้ง NVIDIA CUDA 10.1 Update 2 พร้อมไดรเวอร์ NVIDIA ที่จัดทำแพคเกจ ฉันประสบปัญหาเดียวกันตามที่อธิบายไว้ข้างต้น เมื่อเปิดออกSecure Bootได้รับการตั้งค่าเป็นโหมด Windows UEFI การเปลี่ยนเป็นระบบปฏิบัติการอื่นแก้ไขให้ฉัน


1
ขอบคุณฉันต้องปิดการใช้งานSecure Bootซึ่งเปิดใช้งานใหม่โดยอัตโนมัติในระหว่างการอัปเดตอัตโนมัติ Windows / BIOS !!! ตอนนี้ NVIDIA ทำงานได้ดี
Bill Kotsias

คุณจะอธิบายวิธีเปลี่ยน boot boot อย่างปลอดภัยเป็นOS อื่นหรือไม่?
Inspi

1
@BillKotsias ขอบคุณ! : D
Marek

0

สำหรับผู้อ่านในอนาคต:

ฉันอยู่ในอินสแตนซ์ของเครื่องเสมือน (แพลตฟอร์ม Google Cloud)

และฉันกำลังติดตามส่วนสำคัญนี้เพื่อติดตั้งCudaและCuDNnบน VM ของฉัน

ฉันต้องอัปโหลดCuDNnส่วนด้วยตนเอง (เพิ่งวางไว้ตรงนั้น)

ตอนนี้รับข้อผิดพลาด:

ฉันพบปัญหานี้ แต่การเริ่มต้นอินสแตนซ์ใหม่ทำให้งานเสร็จสมบูรณ์ และเมื่อเริ่มต้นใหม่อย่างสมบูรณ์ฉันหมายถึงการหยุดอินสแตนซ์และเปิดอีกครั้ง

ฉันหวังว่านี่จะช่วยให้ใครบางคน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.