概要
Data-centric AIとは,機械学習の権威でありGoogleのAI研究チームを率いたAndrew Ngが2021年に提唱した,モデルよりもデータに主眼を置くというAI開発のアプローチです。過去数十年にわたりAI開発においては,固定されたデータセットに対してニューラルネットワークをはじめとしたモデルを適用し,そのモデルを改善することに関心が寄せられていました。しかし,このモデルを中心としたアプローチでは,データセットへの過度な依存やデータセットが抱える課題への無意味な適合により,実用において期待ほどモデルの性能が改善しないといった問題が指摘されています。そのため近年はモデルを固定したうえで,データ拡張,アノテーションの効率化や一貫性の担保,能動学習といったデータに工夫を加えることによってモデルの性能を向上させるアプローチに注目が集まっています。本書では,Data-centric AIの概要を解説したあとに,画像認識,自然言語処理,ロボットといった分野におけるデータを改善するための具体的なアプローチを解説します。最終章では,企業における実践的な取り組みを紹介します。
こんな方におすすめ
- データセットの作成,データの学習方法に興味のある方
- 基盤モデルに興味がある方