web-dev-qa-db-ja.com

「nvidia_352」を挿入できませんでした:そのようなデバイスはありません

Linux Ubuntucaffe を実行しようとしています。インストール後、GPUでcaffeを実行しますが、エラーは

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0
modprobe: ERROR: could not insert 'nvidia_352': No such device
F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0)  no CUDA-capable device is detected
*** Check failure stack trace: ***
    @     0x7ffd3b9a7daa  (unknown)
    @     0x7ffd3b9a7ce4  (unknown)
    @     0x7ffd3b9a76e6  (unknown)
    @     0x7ffd3b9aa687  (unknown)
    @     0x7ffd3bf91cb5  caffe::Caffe::SetDevice()
    @           0x40a5a7  time()
    @           0x4080f8  main
    @     0x7ffd3aeb9ec5  (unknown)
    @           0x408618  (unknown)
    @              (nil)  (unknown)
Aborted (core dumped)

NVIDIAドライバーは352.41です。 352をインストールしましたが、最新バージョンがインストールされています。

Sudo apt-get install nvidia-352[Sudo] 
Reading package lists... Done
Building dependency tree       
Reading state information... Done
nvidia-352 is already the newest version.
The following packages were automatically installed and are no longer required:
  account-plugin-windows-live libupstart1
Use 'apt-get autoremove' to remove them.
0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded.

私のUbuntuにはNVIDIAドライバー352があり、なぜ私は

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0
    modprobe: ERROR: could not insert 'nvidia_352': No such device
    F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0)  no CUDA-capable device is detected

のようなCUDA対応デバイスがあるかどうかを確認しました

lspci | grep -i nvidia
05:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K2000] (rev a1)
05:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1)

CUDA対応デバイスを使用していますが、なぜエラーが発生しますか?

編集1:ええ、。/ deviceQueryを使用したテストは失敗しました。

../NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release/deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

Dev /フォルダーにチェックインしました。nvidia0があります。

crwxrwxrwx  1 root root    195,   0 Sep 10 16:51 nvidia0
crw-rw-rw-  1 root root    195, 255 Sep 10 16:51 nvidiactl

私のnvcc -Vチェックは私に与えました

li@li-HP-Z420-Workstation:/dev$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015
Cuda compilation tools, release 7.5, V7.5.17

それから私のバージョンチェック

li@li-HP-Z420-Workstation:/dev$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module  352.41  Fri Aug 21 23:09:52 PDT 2015
GCC version:  gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04) 

何が間違っているのでしょうか?

16
batuman

別の方法は、.runファイルを使用してインストールすることです。最初にXサーバーを強制終了する必要があります。 Xサーバーは次のように強制終了されます。

Make sure you are logged out.
Hit CTRL+ALT+F1 and login using your credentials.
kill your current X server session by typing Sudo service lightdm stop or Sudo stop lightdm
Enter runlevel 3 (or 5) by typing Sudo init 3 (or Sudo init 5) and install your .run file.
You might be required to reboot when the installation finishes. If not, run Sudo service start lightdm or Sudo start lightdm to start your X server again.

次にrun .run file as Sudo sh xxxxx.run

The distribution-provided pre-install script failed! Are you sure you want to continue?としてエラーが発生する場合があります。その後、インストールを中止し、

disable the "Nouveau kernel driver" as Sudo update-initramfs -u

次に、システムを再起動し、redo stop X server, enter runlevel 3 and do Sudo sh xxxx.run again.

今回は、メッセージを無視して、そのプリスクリプト失敗メッセージを続行できます。その後、.runファイルからNvidia Driverをインストールできます。

0
batuman

これで問題は解決しました。私はチェックした Sudo dpkg --list | grep nvidia私のカーネルは352.41ですが、クライアントには304.12があります。だから私はSudo apt-get remove --purge nvidia-*。すべてのパッケージを削除しました。次に、352.41を次のようにインストールします

$ Sudo add-apt-repository ppa:xorg-edgers/ppa -y
$ Sudo apt-get update
$ Sudo apt-get install nvidia-352

その後

$ Sudo dpkg --list | grep nvidia
rc nvidia-304 304.128-0ubuntu0~gpu14.04.2 AMD64 NVIDIA legacy binary driver - version 304.128
rc nvidia-304-updates 304.125-0ubuntu0.0.2 AMD64 NVIDIA legacy binary driver - version 304.125
ii nvidia-352 352.41-0ubuntu0~gpu14.04.1 AMD64 NVIDIA binary driver - version 352.41
rc nvidia-opencl-icd-304 304.128-0ubuntu0~gpu14.04.2 AMD64 NVIDIA OpenCL ICD
rc nvidia-opencl-icd-304-updates 304.125-0ubuntu0.0.2 AMD64 NVIDIA OpenCL ICD
ii nvidia-opencl-icd-352 352.41-0ubuntu0~gpu14.04.1 AMD64 NVIDIA OpenCL ICD
ii nvidia-prime 0.6.2 AMD64 Tools to enable NVIDIA's Prime
ii nvidia-settings 355.11-0ubuntu0~gpu14.04.1 AMD64 Tool for configuring the NVIDIA graphics driver

バージョンが一致するようになりました。その後、。/ deviceQueryおよびすべてが期待どおりに機能します。ありがとう

11
batuman

私にもこの問題があります。また、nvidiaドライバーを再インストールしても問題は解決しませんでした。

最後に、grubで2つのカーネルパラメーターを追加して、この問題を解決しました。

加える:

GRUB_CMDLINE_LINUX_DEFAULT

で:

pci=nocrs pci=realloc

これはcuda7.5およびkernel3.19

2
SPWW

非nvidiaデバイスからのビデオを表示しているが、ドライバーがインストールされている場合、Gnomeが機能するように、「-no-opengl-files」フラグを付けてインストールする必要があります。

別のドライバーをダウンロードし、コンソールにログインして手動でインストールすることをお勧めします。

1. Alt Ctrl F2/f3/f4/f5 to get to console.
2. “init 3”  to kill UI
3. relogin if necessary to console
4. wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-

ドライバーx86_64-418.67.run

5. sh NVIDIA-Linux-x86_64-418.67.run --no-opengl-files
6. After installation - reboot
0
batuman