GPU付きのTensorflowの最新版(2.5.0: 2021/08/05)をWindows 10にインストールしてローカルのJupyterLab等で利用する方法
機械学習と言ってもいろいろある。具体的に今、何できるのかを調査したいので、やはり最新版を入れてやることにした。1台はPyTorch最新安定版1.9.0を入れてあるのでもう1台にTensorflow 2.5.0を入れるのだ。推奨は仮想環境だが今回はシステムに直接入れるパターンで行く。
前提条件:
1. CUDA Toolkith11.2がインストールしてあり、cuDNNも必要なものが入れてある。
2. Python 3.9>が入っている
方法
これまで見てきたとおり、condaでは2.3.0止まり。だからpipで入れる。pipで入れるデメリットもあって、必要に応じてライブラリ(numpyなど基本的なものまで)を自分でインストールしていかなくてはならないこと。(ただし依存性があれば解決してくれる。)
手順
- pipが入っていなければ入れる。pipをシステム全体で入れるなら管理者権限のコマンドプロンプトで実行する必要がある。
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py python get-pip.py
- pipの確認
>pip -V pip 21.2.2 from c:\python39\lib\site-packages\pip (python 3.9)
python 3.9を確認する。Tensorflow 2.5.0はpython 3.9>が必要だ。
- Tensorflowのインストール(通常のコマンドプロンプトで実施)
pip install --user --upgrade tensorflow
- 確認
python -c "import tensorflow as tf; print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
これでグラボの型番その他が出ていれば成功。
-
Jupyter notebook (JupyterLab)のインストール
pip install notebook or pip install jupyterlab
- 必須ライブラリのインストール(通常のコマンドプロンプトで実施)
pip install ライブラリ
人によって必須ライブラリは異なるが、まずはnumpy, matplotlib, pandasなどと言ったところか。
- Jupyter notebook (JupyterLab)の起動
jupyter notebook or jupyter-lab
まとめ
やはりPyTorchより面倒な感じがする。しかしこれで晴れてGPU付きTensorflow 2.5.0をJupyter Notebookのバックで利用できる。PyTorchの最新版とは同時実行したければvenvに設定する事になりそう。ただCUDA_PATHの問題で同時には無理で、片方を実行するなら片方を止める必要があるかも知れない。
既にプロダクションレベルで動き出している会社で、いくらでもGPUインスタンスを使って良い、という所なら別だが「ある程度」「これから」本格的にやるならGPU付きのWindowsパソコンを2台手に入れた方が良いかもしれない。クラウドにある中途半端なGPUより高性能なものもあるのだ。
理論的背景のスタディも必須だが、いろんなサンプルをビルドして動かしてみるだけでも感覚が掴めることが少なくない。
素粒子物理(量子力学)が一気に進歩していた頃を描いたドキュメンタリーに「紙と鉛筆と加速器と」という本があった。現代の機械学習における加速器はGPUの事かも知れないと思った。そこでいろんな理論に基づいたアプリケーションを実行してみて実用性を探るのが差し当たっての課題かも知れない。