GitLabが紐解く:AI時代のソフトウェア開発

エンタープライズAIにカスタマイズが必要な理由[前編]

AIを導入しようとしている組織のほとんどが、エンタープライズソフトウェアを購入した時と同じように、ベンダーを選び、1つのモデルを標準として組織全体に展開しようとします。

その背景にあるのは「1つのモデルが全ての問題を解決してくれる」という思い込みです。しかし実際は、コード生成に優れたモデルがセキュリティ分析を苦手とすることもあれば、プロトタイピングに最適な最先端モデルが、データレジデンシーの要件を満たさないこともあります。

このような思い込みと現実のズレを解決するには、AIモデルの展開方法に対する柔軟性が必要です。高度な推論に大規模モデルを必要とするチームもあれば、特定領域の業務に特化したモデルを必要とするチームもあります。そして何より重要なのは、目の前のタスクに応じて、複数のモデルを組み合わせて使い分けられるようにすることです。

本稿では、こうした柔軟性がなぜエンタープライズAIの成果を左右するのかを、ソフトウェア開発ライフサイクル全体の観点から、前後編に分けて解説します。AI活用をコード生成だけに限定した場合の課題を整理したうえで、タスクごとに求められる性能、品質、コストの違いを踏まえ、複数のモデルをどのように使い分けるべきかを論じます。また、AI支出の管理やコンテキスト連携、ガバナンス、オーケストレーションの重要性についても取り上げます。

AIのパラドックス⁠ソフトウェア開発プロセス全体の最適化

今日のAI導入では、コード生成の高速化に焦点が当てられる傾向が強いですが、コーディングは開発者が実際にしている業務のほんの一部です。GitLabが2025年に実施した調査The Intelligent Software Development Era: How AI will redefine DevSecOps in 2026 and beyond(インテリジェントソフトウェア開発の時代:AIによって2026年以降のDevSecOpsはどのように再定義されるのか⁠⁠」によると、開発者がコード作成に費やす時間は全業務時間の15%にとどまり、残りの時間は、計画、コードのレビュー、テスト、デバッグ、依存関係の管理、チームメンバーとの調整、コンプライアンス要件への対応などに費やされています。

AIはコーディングを加速させているにもかかわらず、ツールチェーンの断片化や手作業による調整が全体の生産性を低下させる「AIパラドックス」が起こっており、開発者1人あたり、週にほぼ1日分の作業時間が失われています。

AIパラドックスの問題を打開するには、AIがコード生成だけでなく、開発ライフサイクル全体で機能する必要があります。ソフトウェアライフサイクルの各所にあるさまざまなアクティビティには、以下のような基本的に異なるパフォーマンス要件があることを理解しなくてはいけません。

  • 開発進行中のコード自動補完や修正提案などのスピード重視のタスクでは、瞬時に近いレスポンスが求められるため、ローカルにホストされた小規模モデルのAIが好まれる可能性があります。
  • アーキテクチャ計画やセキュリティ分析のような品質重視のタスクでは、推論能力に優れた最先端モデルのAIがコストに見合う価値を生み出します。
  • 数百のリポジトリにわたるテスト実行や依存関係の更新など、費用重視の大規模なタスクでは、費用対効果の高いAIを選択することが必要になります。

だからこそ、複数モデルのAIを使い分けることが重要なのです。ソフトウェアライフサイクルの全タスクが同じ価値を生み出すわけではありません。AIを単一モデルへ統一してしまうと、タスクによっては過剰な費用を支払ったり、十分な価値を得られなかったりする原因になり得ます。

これらを理解している組織は、各タスクのパフォーマンス、品質、コストプロファイルを考慮して、それぞれを最も適したモデルに振り分けられる柔軟なシステムを構築しています。

プレミアムモデル利用の優先順位付け

モデルのコストとタスクの価値を一致させることが現実的なアプローチです。

コミットメッセージの記述、ログファイルの要約、テストケースの作成など、大量の定型業務では、オープンソースのモデルなど、可能な限り安価で高速なモデルが選択される傾向があります。一方、複雑な推論が求められるタスクについては、チームはより高い性能を得るために費用を惜しまない傾向にあります。また、決定論的な動作に特化したモデルについては、IaC(Infrastructure as Code)の生成や高精度なデータ変換に対して高い対価を受け入れるチームもあるでしょう。

タスクに応じて異なるモデルをそれぞれ選択できる柔軟性は、パフォーマンスの違い、価格変動、プロバイダーによる製品の提供終了や市場からの完全撤退といった起こり得る問題への防御策になります。

この柔軟性は、それぞれトレードオフを伴う次の3つの選択肢から生まれます。

  1. Anthropic、OpenAI、Googleが提供している商用の最先端モデルは、高い性能を有し、継続的に進化しますが、各社のロードマップと価格設定に依存することになります。
  2. セルフホスト型の商用モデルやオープンソースモデルは、ユーザーがデータレジデンシー、コスト、可用性を自ら管理できますが、インフラストラクチャの管理が必要になります。また、オープンソースモデルは依然としてエージェント型ワークフローに対応できません。
  3. 独自データと明確な成功基準がある限定的・影響度の高いタスクでは、独自に学習させた専門モデルが汎用モデルを上回ることがあります。ただし、高度な専門知識が必要で、運用コストも高くなりがちです。

どのモデルを選んでもトレードオフが伴うため、3種のモデルのすべてを戦略的に使えるシステムの構築が重要なのです。

ここまで見てきたように、エンタープライズAIの価値を引き出すには、単一のモデルに標準化するのではなく、タスクの性質に応じて複数のモデルを使い分ける柔軟性が欠かせません。では、その柔軟性を企業全体で実装し、コストやガバナンスを管理しながら成果につなげるには、どのような考え方が必要なのでしょうか。後編では、AI支出の管理、コンテキスト連携、そしてオーケストレーションの重要性について考えます。

おすすめ記事

記事・ニュース一覧