ユースケースから考える 生成AIが得意なこと・苦手なこと

第1回生成AIの得意⁠不得意 2024⁠

皆さんこんにちは。スリーシェイク代表の吉田です。

今回より生成AIを、金融業界や製造業、医療業界など各事業ドメイン固有の課題解決にどう使われているのか、具体的なユースケースを提示しながら、それを実現するアーキテクチャについて解説していきます。この連載を通して、これまで生成AIを実際のシステムに組み込むイメージが湧かない方への第一歩として手助けになれば幸いです。

第1回は、生成AI自体の一般的な得意不得意を踏まえながらユースケースを解説します。

生成AIが得意とする処理とは?

生成AIが得意とするのは、⁠専門性のない一般的な知識をベースにした」テキスト生成、コード生成、画像認識や画像生成が挙げられます。RAG(Retrieval-Augmented Generation)やプロンプトエンジニアリングにより固有ドメインに特化させることは可能ですが、教師あり学習データを前提としたMLやDeepLearningに比べると精度面で課題があります。またシステムに組み込む観点でいうと、パフォーマンス面は考慮にいれる必要があります。

モデルに関わらず生成AIのAPIのレスポンスは1秒以上、複雑なタスクだと30秒を超えるケースも多く、アプリケーションとしてレスポンスを意識しなくてはいけないものには不向きです。⁠ここはChatGPT-4oやGemini flashなど、今後パフォーマンスを意識したLLMも増えていくことから、数年後には変わる可能性が高いです⁠⁠。

生成AIをシステムに組み込むユースケース

生成AIを選択する考え方としては4パターンあると考えます。

創造性が求められるシーン(とくに人とコミュニケーションを取る箇所)

ゲームのBot

ゲーム世界のキャラクターと自然な会話をするBotやNPC(Non Player Character)としての活用が期待されます(表情については、Audio2Faceを活用するケースが多いようです⁠⁠。

この場合、以下2点を注意して実装する必要があります。

  • コスト面:ユーザの会話量に比例して生成AIのAPI利用料が嵩んでいきます。ユーザの入力に対して、直接生成APIをコールするのではなく、中間に会話量の制約を設けるロジックをいれるか、ルールベースの回答を主とし、特定のシーンだけに生成APIをコールするロジックとするのが良いでしょう。
  • クオリティ面:ゲームの状況から見て、不適切な発言をさせないコントロールが必要です。こちらもユーザーの入力に対して、直接生成APIをコールするのではなく、中間にフィルタを掛けて反応しないようにしたり、生成APIからレスポンスされたデータに対してフィルタを掛けて、条件が達していない内容は再帰的に問い合わせることでユーザーに表示する会話品質を担保すると良いでしょう。

高度な専門性を求められない物体/音声認識⁠検出

OCRの代替

生成AIを使ってOCRの代替となるソリューションが非常に増えています。

たとえば、Google CloudのDocument AIは、PDFや画像データから請求書や帳票データ、手書き文字をかなり高精度で構造化データに変換することが可能です。また出力フォーマットもプロンプトエンジニアリングで簡易に変更できる点も魅力です。

大量のデータを安く、レスポンシブにOCRシステムとして組み込む場合には、既存のOCRソリューションや独自にmodelを構築した方が良いです。一方で、OCR機能を簡易実装できる点を考えると、強力な利用用途だと考えられます。

音声文字起こし⁠感情解析

生成AIを使った議事録作成、トーク分析はとても相性が良い例です。

弊社で以前、gemini-1.5-pro-preview-0514を用いた35分の営業ロープレ動画を解析した結果は以下となりました(満足いくレベルの評価は主観です⁠⁠。

図1 既出の音声解析SaaSと比べると価格や解析品質面でまだまだですが、用途によっては1から音声解析のモデルを開発する必要がなく、手軽にシステムに組み込んでいくことが可能です。

高度な専門性を求められない文章の作成や評価

各種レポートの作成(例⁠契約書や報告書など)⁠レビュー⁠要約⁠翻訳

生成AIを使って契約書のリーガルチェックや有価証券報告書の要約など、従来専門家が必要となるレポート周りの業務は大幅に簡素化することが可能で、生成AIが得意とする領域の1つです。

RAGやプロンプティングに定型フォーマットや前提知識を組み込みながら、動的な条件、たとえば議事録データや売上データ、システム変更データなどから、各種報告書を自動で生成するシステムはコスト面でも性能面でも十分耐えうる構成が可能です。

とくに、システムに組み込む際に、生成AIに入力するプロンプトを定量的な指標に基づいて改善を行える仕組みを取り入れると良いでしょう。

既存のMLやDeep Learningが得意とする処理とは?

既存のデータからパターンを学習し、それを元に判断や分類をするケースは、既存手法を選択するほうが相性が良いです。生成AIはあくまでも(過去の状況を無視した)一般的な判断、例えば、財務資料(PLやBS)を見て、アドバイスや評価するようなタスクが向いています。

具体的には、

  • 数値予測
  • 異常検出
  • 過去のデータを鑑みたレコメンド
  • 専門性を求められる画像や音声の分類、検出

などが挙げられます。

また一般的なMLやDeep Learningを組み込んだシステムにおける処理パフォーマンスは1s/req以下で行われることが多く、パフォーマンスが求められるケース、たとえば決済における不正検知は既存手法を選択するほうがベターです。

既存のMLやDeep Learningを優先するユースケース

既存手法を選択する考え方としては大きく2パターンあると考えます。

パフォーマンスを求められるケース

工場内での画像認識⁠物体検出

工場内のロボットなどで利用される画像認識(例えば、不良品の検出)は、生産ラインのスピードに合わせて、求められる認識処理の速度が1sどころかμsレベルの速度が求められます。更に検出率を限りなく100%まで高めていかないとそのまま不良在庫拡大や収益悪化に繋がります。このような場合はパブリッククラウドの利用も通信レイテンシを考えると厳しく、更に仮にデバイス上でLLMを動かしても要件を満たせないでしょう。

不正検知

前述に挙げたとおり、決済や送金時にタイムリーに不正を検知するようなユースケースにおいては、既存手法を用いたほうがベターです。一方で、敢えてタイムリーな不正検知ではなく、バッチ処理を前提として、金額や購入品目、IPアドレスだけでなく、より広範囲なSNSの情報を使って、異常検出を生成AIで行う試みは、教師あり学習を前提とした既存手法と比べて、開発 / 運用効率がリーズナブルで各企業がR&Dをしています。

図2 AWSでのアーキテクト例:参考
図3 Google Cloudでのアーキテクト:参考

過去データから判断が必要なケース

予測系

不動産価格や株価、売上、在庫、リスクの予測などは、過去データをベースにした回帰予測ベースの手法が適切です。予測自体は既存手法を使い、それを用いた活用の部分、たとえば予測に対してどういう手段で対処するべきか? というところで生成AIを使ったアーキテクチャを組むと相性が良いでしょう。

最適化系

配送ルートや在庫の最適化は、複数の条件(そしてその相互作用)を考慮して判断が求められ、その場合は強化学習をベースとした既存手法が適切です。既存手法で出力された最適解を用いて、人間が理解しやすい文言でチャットや音声でアドバイスをする部分で生成AIを使うと相性が良いでしょう。

高度な画像認識や物体/音声検出

専門的知識を有していない人間が判断ができないもの、たとえば医療画像から癌を特定したり、部品の画像から傷を検出するなどの処理は、既存の手法が適切です。

ただし、これまではこういった画像認識や物体検出が用途問わず教師あり学習をベースとしたモデル開発が必要とされていましたが、専門性が求められなくても判断できる認識や検出には、開発コストを考えて生成AIを活用するケースもでてきています(たとえば、車の異音を検出してドライバーに通知する仕組み⁠⁠。

生成AIをクラウド上で組み込んでいく場合のアーキテクト例

生成AIをパブリッククラウド上でシステムとして構築していく際、ベンダに依らず大体同じ構成になります。

AWSの場合

AWSは検索コンポーネントとして、Amazon Kendra、生成AIコンポーネントとしてAmazon Bedrockを据えて、Lambdaを中心としたワークロードになります。

図4 AWSでのアーキテクト:参考

Google Cloudの場合

Google Cloudは検索コンポーネントとして、Vertex AI Search、生成AIコンポーネントとして、Vertex AI Gemini APIやDocument AI APIを据えて、Cloud Runをワークロードになります。

図5 Google Cloudでのアーキテクト:参考

最後に

従来、機械学習を用いたサービス開発はモデル開発の難易度やデータセットに品質が依存するなど数多くの参入障壁があり、ルールベースのロジックに頼らざるを得ないケースもありました。

一方で生成AIを使うことで、簡易的にAIをシステムに組み込むことが可能になりました。ぜひ皆さんの現場でも生成AIを組み込んでみてみましょう!

おすすめ記事

記事・ニュース一覧