ติดตั้งไดรเวอร์ cuda ในคอนเทนเนอร์เสมือนของ proxmox


3

ฉันได้ติดตั้ง2.6.32-17-pveบนเครื่องโฮสต์ของฉันด้วย:

    02:00.0 VGA compatible controller: NVIDIA Corporation Device 11c6 (rev a1) (prog-if 00 [VGA controller])
    Subsystem: Giga-byte Technology Device 3557
    Flags: fast devsel, IRQ 16
    Memory at fa000000 (32-bit, non-prefetchable) [size=16M]
    Memory at c0000000 (64-bit, prefetchable) [size=256M]
    Memory at d0000000 (64-bit, prefetchable) [size=32M]
    I/O ports at e000 [size=128]
    Expansion ROM at fb000000 [disabled] [size=512K]
    Capabilities: [60] Power Management version 3
    Capabilities: [68] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [78] Express Endpoint, MSI 00
    Capabilities: [b4] Vendor Specific Information: Len=14 <?>
    Capabilities: [100] Virtual Channel
    Capabilities: [128] Power Budgeting <?>
    Capabilities: [600] Vendor Specific Information: ID=0001 Rev=1 Len=024 <?>
    Capabilities: [900] #19

หลังจากสร้าง virtual container ของ ubuntu 12.04 ฉันพยายามติดตั้ง cuda-driver ดังนี้:

  1. vzctl set 100 --pci_add 02:00.0บนโฮสต์และlspci -vในการพิมพ์ vz:

    02:00.0 VGA compatible controller: NVIDIA Corporation Device 11c6 (rev a1) (prog-if 00 [VGA controller])
    Subsystem: Giga-byte Technology Device 3557
    Flags: fast devsel, IRQ 16
    Memory at fa000000 (32-bit, non-prefetchable) [size=16M]
    Memory at c0000000 (64-bit, prefetchable) [size=256M]
    Memory at d0000000 (64-bit, prefetchable) [size=32M]
    I/O ports at e000 [size=128]
    Expansion ROM at fb000000 [disabled] [size=512K]
    Capabilities: <access denied>
    Kernel modules: nouveau, nvidiafb
    
  2. ฉันติดตั้งแพคเกจที่แนะนำสำหรับการติดตั้ง cuda และเปลี่ยนรุ่น gcc เป็น 4.4

  3. ในการติดตั้งส่วนหัวเคอร์เนลของ pve ฉันจะเพิ่ม source.list ของ pve: deb http://download.proxmox.com/debian squeeze pveและรันsudo apt-get install pve-headers-2.6.32-17-pve
  4. ตอนนี้ฉันพยายามติดตั้งไดรเวอร์ แต่:

    ERROR: Unable to load the kernel module 'nvidia.ko'.  This happens most
    frequently when this kernel module was built against the wrong or
    improperly configured kernel sources, with a version of gcc that
    differs from the one used to build the target kernel, or if a driver
    such as rivafb, nvidiafb, or nouveau is present and prevents the
    NVIDIA kernel module from obtaining ownership of the NVIDIA graphics
    device(s), or NVIDIA GPU installed in this system is not supported
    by this NVIDIA Linux graphics driver release.
    

ฉันคิดว่าเหตุผลอาจเป็นเพราะ vz ไม่ได้รับความเป็นเจ้าของอุปกรณ์กราฟิก แต่ฉันไม่แน่ใจและไม่ทราบวิธีการแก้ไข ใครช่วยแนะนำฉันบ้าง

ขอบคุณ


ฉันไม่ใช่ผู้ใช้ vz แต่ดูเหมือนว่าฉันมีปัญหาในไคลเอนต์ - ดูเหมือนว่าไดรเวอร์ nvidia ไม่พบ / โหลดโดยเคอร์เนลที่คุณใช้ - บางทีคุณอาจต้องติดตั้งโมดูล nvidia ใน โฮสต์เสมือน?
davidgo

คุณได้ลองวิธีดูอัลซึ่งประกอบด้วยการติดตั้งไดรเวอร์ nvidia ในโฮสต์แล้วแชร์ /dev/nvidia0กับแขกหรือไม่?
MP0

คำตอบ:


1

ห้ามทำการโหลดโมดูลเคอร์เนลจากภายในคอนเทนเนอร์ OpenVZ: เป็นมาตรการรักษาความปลอดภัยเนื่องจากเคอร์เนลถูกแชร์ระหว่างโฮสต์และคอนเทนเนอร์ทั้งหมด

สิ่งที่อาจใช้งานได้: โหลดเคอร์เนลไดรเวอร์ที่จำเป็นบนโฮสต์เพิ่มการเข้าถึงอุปกรณ์ที่เกี่ยวข้องโดยใช้ --devnodes และในกรณีที่เปิดใช้งานความสามารถทั้งหมดโดยใช้ - ความสามารถในการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.