web-dev-qa-db-ja.com

Ubuntu 18.04にNVIDIA GPU RTX 2070 SUPERのtensorflowをインストールする方法

新しいRTX 2070 SuperにTensorflowをインストールしようとしています。私は次の指示に従いました:

歩数

システムにcuda対応のgpuがあることを確認します

nvidia cudaツールキットとcudnnをダウンロードしてインストールします

環境変数の設定

インストールを確認する

以前のインストールがある場合は、最初にそれを削除してください。

Sudo apt-get purge nvidia*
Sudo apt remove nvidia-*
Sudo rm /etc/apt/sources.list.d/cuda*
Sudo apt-get autoremove && Sudo apt-get autoclean
Sudo rm -rf /usr/local/cuda*

あなたのGPUがCUDAがチェックを有効にしていることを確認するには

lspci | grep -i nvidia

cudaツールキットを使用した開発には、gccコンパイラーが必要です。 gcc installのバージョンを確認するには、次のように入力します。

gcc --version

システムアップデート

Sudo apt-get update
Sudo apt-get upgrade

他のインポートパッケージをインストールする

Sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

最初にPPAリポジトリドライバーを取得する

Sudo add-apt-repository ppa:graphics-drivers/ppa
Sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
echo "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64 /" | Sudo tee /etc/apt/sources.list.d/cuda.list

#CUDA-10.0のインストール

Sudo apt-get -o Dpkg::Options::="--force-overwrite" install cuda-10-0 cuda-drivers

パスを設定する

echo 'export PATH=/usr/local/cuda-10.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
Sudo ldconfig

cuDNN v7.5をインストールする

cuDNNをダウンロードするには、ここで再登録する必要があります https://developer.nvidia.com/developer-program/signup

次に、cuDNN v7.5フォームをダウンロードします https://developer.nvidia.com/cudnn

CUDNN_TAR_FILE="cudnn-10.0-linux-x64-v7.5.0.56"
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.5.0.56/prod/10.0_20190219/cudnn-10.0-linux-x64-v7.5.0.56.tgz
tar -xzvf ${CUDNN_TAR_FILE}

以下のファイルをcuda toolkitディレクトリにコピーします。

Sudo cp -P cuda/include/cudnn.h /usr/local/cuda-10.0/include
Sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64/
Sudo chmod a+r /usr/local/cuda-10.0/lib64/libcudnn*

最後に、インストールを確認するには、

nvidia-smi
nvcc -V

tensorflow(オープンソースの機械学習フレームワーク)をインストールします

CUDA 10.0 ToolkitおよびcuDNN 7.5と互換性があり安定しているため、バージョン1.13.1を選択しました

pip3 install --user tensorflow-gpu == 1.13.1

ただし、nvidia-smi次のメッセージが表示されます:NVMLの初期化に失敗しました:ドライバー/ライブラリバージョンの不一致

また、最新のNVIDIAドライバー(440.35)をダウンロードしようとしましたが、.runファイルを実行できませんでした。 「ディストリビューションが提供するプレインストールスクリプトが失敗しました!」というメッセージが表示され続けました。

どんな助けでも大歓迎です!

1
bonie10

次のインストールで、GeForce RTX 2070 SuperにTensorflowを最終的にインストールすることができました。

Ubuntu 18.04

CuDNN 7.5

CUDA 10.0

NVIDIAドライバーバージョン430.50

それから私はちょうどpip3 install --user tensorflow-gpu==1.13.1 Conda環境を使用しています。

1
bonie10