概要
LLM をはじめとする生成AI の台頭により,パフォーマンスエンジニアリング (Performance Engineering)が再び注目されています。パフォーマンスエンジニアリングとは,コンピューターシステムやソフトウェアのパフォーマンス(処理性能)を改善するために必要な技術を扱う総合分野です。近年のAI は,「モデルの規模を大きくすることで精度が良くなる傾向がある」という考え方が主流になりつつあり,大規模なモデルを扱えなければ最新のAI 分野についていくことが難しくなっています。そこで,本書では,パフォーマンスエンジニアリングを用いてAI の処理性能を改善し,処理時間を削減するための技術を取りまとめました。前半ではパフォーマンスエンジニアリングの理論や技法を網羅的に解説し,後半では大規模AI の代表格であるLLM を中心とした題材を通して,具体的にどのようにパフォーマンスエンジニアリングを実際のAI に適用できるのかを紹介します。本書を読み通すことで,これまで体系的に説明されてこなかったパフォーマンスエンジニアリングを理解し,AI 時代に必要な知識と技法を習得できます。
こんな方におすすめ
- AI/LLMモデルを使ったサービスの提供を考えている方