著者の一言

近年、大規模言語モデル(LLM:Large Language Model)をはじめとする、実用性の高い生成AIが話題を集めています。SNSには「生成AIの最新機能」⁠生成AIの活用法」といった情報が溢れています。このようなユーザー目線の話題や情報には事欠かない一方で、⁠エンジニアとして生成AIの仕組みを正しく理解しておきたい」――そんな要望に応える情報は、まだ十分とは言えなさそうです。実用レベルの生成モデルに関する学術論文が次々と公開されており、⁠最新の論文を読みこなして、生成AIをもっと深く学びたい!」と考える方も少なくないはずですが、これらの論文を理解するには、まずは、生成AIの基礎となるモデルの仕組みを知る必要があります。

本書では、最先端の論文を読みこなす準備として、画像生成モデルと自然言語モデルのそれぞれについて、変分オートエンコーダ(VAE:Variational autoencoder)やLSTM(Long short-term memory)などの基礎的なモデルから始まり、拡散モデル(Diffusion model)やトランスフォーマーと言った、最先端の生成AIの先駆けとなったモデルの仕組みを学びます。

ただし、⁠モデルの仕組み」と言っても、数学的な動作原理を解説することが主眼ではありません。数学的な説明は最低限に留めて、それぞれのモデルの主要な機能をシンプルに実装したサンプルコードを通して、⁠このモデルはどのような処理をしており、どのように生成モデルとして機能するのか」という仕組みの部分を理解します。また、モデルのパラメーターを変更して実行結果がどのように変わるかを観察する、いくつかの演習課題も用意しています。演習課題に取り組みながらコードの内容を読み解くことで、実感を持ってモデルの仕組みが理解できるでしょう。

一般の利用者の立場で生成AIの能力に驚かされるのも楽しいものですが、その背後の仕組みを技術的に理解する事で、新たに見える世界もきっとあるはずです。一歩進んだエンジニア視点で生成AIを理解して使いこなしていく――本書がその第一歩を踏み出す一助となることを願っています。

中井悦司(なかいえつじ)

1971年4月大阪生まれ。ノーベル物理学賞を本気で夢見て,理論物理学の研究に没頭する学生時代,大学受験教育に情熱を傾ける予備校講師の頃,そして,華麗なる(?)転身を果たして,外資系ベンダーでLinuxエンジニアを生業にするに至るまで,妙な縁が続いて,常にUnix/Linuxサーバーと人生を共にする。その後,Linuxディストリビューターのエバンジェリストを経て,現在は,米系IT企業のAI Solutions Architectとして活動。

主な著書は,『[改訂新版]ITエンジニアのための機械学習理論入門』『Google Cloudで学ぶ生成AIアプリ開発入門――フロントエンドからバックエンドまでフルスタック開発を実践ハンズオン』(いずれも技術評論社),『TensorFlowとKerasで動かしながら学ぶディープラーニングの仕組み』『JAX/Flaxで学ぶディープラーニングの仕組み』(いずれもマイナビ出版)など。