ITエンジニアのための強化学習理論入門
- 中井悦司 著
- 定価
- 3,278円(本体2,980円+税10%)
- 発売日
- 2020.7.17
- 判型
- A5
- 頁数
- 296ページ
- ISBN
- 978-4-297-11515-9 978-4-297-11516-6
概要
前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。
こんな方にオススメ
- 機械学習、AI(人工知能)に興味があるITエンジニア、大学生、高専生、高校生など
目次
第1章 強化学習のゴールと課題
- 1.1 強化学習の考え方
- 1.2 実行環境のセットアップ
- 1.3 バンディットアルゴリズム(基本編)
- 1.4 バンディットアルゴリズム(応用編)
第2章 環境モデルを用いた強化学習の枠組み
- 2.1 マルコフ決定過程による環境のモデル化
- 2.2 エージェントの行動ポリシーと状態価値関数
- 2.3 動的計画法による状態価値関数の決定
第3章 行動ポリシーの改善アルゴリズム
- 3.1 ポリシー反復法
- 3.2 価値反復法
- 3.3 より実践的な実装例
第4章 サンプリングデータを用いた学習法
- 4.1 モンテカルロ法
- 4.2 TD(Temporal-Difference)法
第5章 ニューラルネットワークによる関数近似
- 5.1 ニューラルネットワークによる状態価値関数の計算
- 5.2 ニューラルネットワークを用いたQ-Learning
プロフィール
中井悦司
1971 年4 月大阪生まれ。ノーベル物理学賞を本気で夢見て、理論物理学の研究に没頭する学生時代、大学受験教育に情熱を傾ける予備校講師の頃、そして、華麗なる(?)転身を果たして、外資系ベンダーでLinux エンジニアを生業にするに至るまで、妙な縁が続いて、常にUnix/Linux サーバーと人生を共にする。その後、Linux ディストリビューターのエバンジェリストを経て、現在は、米系IT 企業のSolutions Architectとして活動。
最近は、機械学習をはじめとするデータ活用技術の基礎を世に広めるために、講演活動のほか、雑誌記事や書籍の執筆にも注力。主な著書は、『[改訂新版]プロのためのLinux システム構築・運用技術』『IT エンジニアのための機械学習理論入門』(いずれも技術評論社)、『TensorFlow とKeras で動かしながら学ぶディープラーニングの仕組み』(マイナビ出版)など。