現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御 ダウンロード|翔泳社の本
  1. ホーム >
  2. 書籍 >
  3. 現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御 >
  4. ダウンロード

現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御

  • サンプルファイル[14.9 MB]
    □本書のサンプルプログラム
     本書で使用するサンプルプログラムは、Docker環境構築に必要なファイルも含まれています。Docker環境構築の詳細については本書の付録AP2を参照してください。

    □Colaboratory環境の場合
     Colaboratory環境を使用する場合、Googleアカウントが必要です。ご自身のGoogleアカウントにログインしてから下記サイトを開いてください。開いたページのコピーをご自身のGoogleドライブ上にコピーしてお使いください。詳細は本書の付録AP1を参照してください。

    ・Colaboratory環境
    《URL》https://colab.research.google.com/github/drlbook-jp/drlbook/blob/master/drlbook_examples.ipynb

    □Google Colaboratory のTensorFlow2系への対応(2025/01/23)
     Google Colaboratory のアップデートにより、TensorFlow 1系が使用できなくなりました。付属の Python コードは、基本的には TensorFlow のインポート文を変更するだけで動作しますが、7-1節 SeqGAN の Python コードは、インポート文の変更だけでは動作しません。そのため、SeqGAN に限って、TensorFlow 2系で動く Python コードを用意しました。Colaboratory から取得される Python コードは、Docker 環境で動作するサンプルコードと異なるのでご注意ください。なお、書籍では、すべて Docker 環境で動作するサンプルコードを引用しています。

    □Docker環境の場合
     Docker環境を使用する場合、サンプルファイル(RL_Book.zip)をローカルPCのHOME直下に解凍して置いてください。フォルダの内容は 以下の通りです。
     Dockerは、下記URLからDocker Desktop Installer.exeをダウンロードして利用してください。

     ・Docker
     《URL》https://www.docker.com/get-started/


    RL_Book/
    ├── contents #各章のサンプルプログラム(Python)
    │   ├── 2_dp_officeworker #第2章 会社員のMDP
    │   ├── 3_keras_example #第3章 MLP, CNN, RNN, LSTMのKeras実装
    │   ├── 4-2_dqn_pendulum #第4章 DQNによる倒立振子制御
    │   ├── 4-3_ac_pendulum #第4章 Actor-Critic法による倒立振子制御
    │   ├── 5_walker2d #第5章 ヒューマノイドの2足歩行
    │   ├── 6-2_tsp #第6章 巡回セールスマン問題
    │   ├── 6-3_rubiks_cube #第6章 ルービックキューブ解法
    │   ├── 7-1_seqgan #第7章 文書生成
    │ └── 7-2_enas #第7章 ニューラルアーキテクチャ探索
    ├── docker #Docker環境構築用の設定ファイル
    │   ├── Dockerfile
    │ └── requirements.txt
    ├── README.md 
    ├── run_docker.sh #Docker環境を起動する実行ファイル
    └── demo.ipynb #Docker環境でサンプルを実行するノートブック


     Docker環境でサンプルプログラムを実行する場合は、各章のサンプルプログラムを収めたサブフォルダに移動して、train.pyなどの実行用Pythonコードをコマンドラインから実行してください(詳細は付録AP2を参照)。