Tensorflow 2.5 + GPU & Dccker
Tensorflow 2.5をGPU付きでWindows 10上にインストールする手順(2021年6月時点)
- グラボのドライバーは最新のものを入れる。
-
Pythonはバージョン3.8
-
CUDA ToolkitはCUDA Toolkit 11.2 Update 1(デフォルトでは出てこないので、右上の検索窓に11.2と入れて見つける。)インストーラを起動すれば後はPATH設定を含めてほぼ自動的にやってくれる。
-
cuDNNは11.x用をダウンロードする
-
cuDNNのドキュメントにある通りダウンロードしたファイルをコピーする。(installpathはダウンロードしたパス、Cドライブ以下はPATH環境変数にインストーラが設定してくれているものの枝)
- Copy
\cuda\bin\cudnn*.dll to C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vx.x\bin. - Copy
\cuda\include\cudnn*.h to C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vx.x\include. - Copy
\cuda\lib\x64\cudnn*.lib to C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vx.x\lib\x64.
- Copy
- Tensorflow 2.5のインストールhttps://www.tensorflow.org/install/gpuに記載されている。
-
Tensorflow 2.5のインストール確認コマンド。
py -3.8 -c "import tensorflow as tf; print( tf.__version__ )"
成功していれば2.5.0と返ってくる。こちらのコマンドも下のコマンドもWindows 10から直接開いたコマンドプロンプトで実施すること。Anacondaから開いたものではpyをコマンドと認識しない。
-
GPU付きかどうかの確認コマンド
py -3.8 -c "from tensorflow.python.client import device_lib; print(device_lib.list_local_devices())"
成功していればdevicetype “GPU”やNVIDIA~の表示が最後の方に表示されている。
-
Dockerについて
一番簡単だと言われているが、Linux限定のようでWindows 10上のLinuxサブシステム用は開発中のようである。
-
AnacondaではTensorflow2.3まで?
安定して長時間動けばいいと思っていたので今のところCUDA Toolkit(とcuDNN)は今回のバージョンで満足している。NVIDIAのページの情報ではcuDNNがバージョンアップする度にどんどん性能向上しているのは気にはなる。
ただAnaconda環境では今のところTensorflow 2.3までしか成功していない。その場合にはCUDA Toolkitは11.1になってしまう。PyTorchでも現在(2021/08/03)11.1止まりなのでPyTorch+GPU環境も同時に設定したければTensorflowは2.3というのも手である。2つとも入れて環境変数CUDA_PATHで切り替えても良いが、うちはML用PCが2台あるのでそれぞれに別の環境を設定した。
PyTorch+GPU環境については項を改めて記載する。