Microsoft Build 2026⁠AIエージェント開発向けにMicrosoft IQ⁠MAIモデル⁠MXCなどを発表 —⁠—Coreutils for WindowsやIntelligent Terminalも

Microsoftは2026年6月2日から開催されている開発者イベントMicrosoft Build 2026で、AIエージェントの構築、実行、管理に関わる開発者向けの発表を行った。主な内容には、Work IQなど4層からなる「Microsoft IQ⁠⁠、新しいMAIモデルファミリー、OSレベルの実行制御を担う「Microsoft Execution Containers(MXC⁠⁠、Coreutils for WindowsやIntelligent TerminalなどのWindows開発環境、ローカルAI向けハードウェアなどがある。

この記事では、Microsoft IQとWork IQ APIs、MAIモデル、Frontier Tuning、Microsoft Foundry、Agent 365とMXC、Windows開発環境、ローカルAI向けハードウェアなどを中心に紹介する。

なお、GitHub Copilotアプリのテクニカルプレビュー拡大、Canvas、Copilot SDK、Copilot CLIなどは、別記事GitHub⁠⁠、Copilotアプリのテクニカルプレビューを拡大 —⁠—CanvasやSDKの一般提供⁠⁠、サンドボックスも発表を参照のこと。

キーノート⁠エージェント時代の開発基盤を提示

CEOのSatya Nadella氏はBuild 2026のキーノートで、同イベントを「frontier intelligence ecosystem」を示す場として位置付けた。基盤の構成要素として、エッジからクラウドまでの計算資源、モデル、業務データやWeb情報、ツール、エージェントを動かすランタイム、開発ツール、セキュリティ、ガバナンスなどを挙げている。

Microsoft IQとWork IQ APIs⁠エージェントが業務情報を使うための基盤

今回の発表では、エージェントを作るための個別機能だけでなく、業務データや作業状況の利用、実行、管理、改善、利用者への展開までを一連の開発基盤として扱っている。その中で、エージェントに業務情報を参照させるための層が「Microsoft IQ」にあたる。

Microsoft IQは、Work IQ、Fabric IQ、Foundry IQ、Web IQを含む枠組みで、企業内の作業状況、業務データ、ナレッジ、Web情報を組み合わせ、GitHub Copilot、Microsoft Foundry、Copilot Studioから利用できるようにする。

Microsoft 365の作業状況を扱う「Work IQ」は、メール、予定表、会議、チャット、ファイル、人、業務システムなどの情報をもとに、エージェントが「誰が、何を、どの流れで進めているか」を把握するための情報を提供する。Work IQ APIsは2026年6月16日に一般提供予定で、⁠Chat」⁠Context」⁠Tools」⁠Workspaces」の4領域からなる。

Microsoft IQのうち、Fabric IQは構造化された業務データの意味や関係を扱う。Foundry IQは、エージェントが社内文書、業務データ、Web情報などを検索し、回答や処理の根拠として使うための知識取得レイヤーにあたる。

新発表の「Web IQ」は、Webページ、ニュース、画像、動画などから新しい情報を取得し、エージェントが外部情報を根拠として使えるようにするAI向けのWeb検索基盤。Foundry IQからも利用でき、一部のAzure顧客向けに限定アクセスで提供する。

これらの仕組みを仕事用のパーソナルエージェントに組み込む具体例として、⁠Microsoft Scout」を挙げている。Scoutは、Microsoftが「Autopilot」と呼ぶ常時稼働型のエージェント。OpenClawとWork IQを基盤に、Teams、Outlook、OneDrive、SharePoint、ローカルデバイス上の操作にまたがって作業状況を把握し、会議準備、予定の競合調整、定型作業の処理などを支援する。独自のIDを持ち、ユーザーや組織が設定した権限とポリシーの範囲で動作する点も特徴としている。Frontier組織向けに早期実験リリースとして提供する。

MAIモデルファミリー⁠推論⁠コード⁠画像⁠音声など7モデルを発表

モデル層では、Microsoft AIがMAIモデルファミリーとして7つの自社開発モデルを発表した。内訳は、推論モデルの「MAI-Thinking-1⁠⁠、コーディング向けの「MAI-Code-1-Flash⁠⁠、画像生成・編集向けの「MAI-Image-2.5」とFlash版、文字起こし向けの「MAI Transcribe-1.5⁠⁠、音声生成向けの「MAI-Voice-2」「MAI-Voice-2-Flash」の7種類。

MAI-Thinking-1は、Microsoft AI初の推論モデル。35Bのアクティブパラメーター、256Kのコンテキストウィンドウを備え、複雑な複数ステップの指示、長文脈推論、コード生成を想定する。ソフトウェアエンジニアリングの主要ベンチマークで先行モデルに並び、ブラインド評価ではSonnet 4.6と同等の人間選好を得たとしている。Foundryではプライベートプレビューとして提供する。

コーディング向けのMAI-Code-1-Flashは、GitHub Copilot、VS Code、Microsoftの製品群への統合を想定したエージェント型コーディングモデル。5Bのパラメーターを持つ軽量モデルで、Claude Haiku 4.5との比較では、SWE-Bench Verified、SWE-Bench Pro、Terminal Bench 2などのコーディングベンチマークで上回ったとしている。SWE-Bench Proでは51.2%対35.2%で、生成トークン数を最大60%削減できる点も挙げる。VS CodeのGitHub Copilotには順次展開中。

画像生成・編集ではMAI-Image-2.5とそのFlash版を用意する。テキストからの画像生成と画像編集の両方に対応し、Arenaで画像編集2位、テキストからの画像生成で3位となったとしている。比較では、Nano Banana Proの2K設定やGPT-Image-1.5のArenaスコアを上回ったという。PowerPointでは利用可能で、OneDriveには順次展開、Foundryにも導入する。

文字起こし・音声分野では、MAI Transcribe-1.5MAI-Voice-2が加わる。MAI Transcribe-1.5は43言語のドメイン固有用語を扱える文字起こしモデルで、FLEURSの43言語平均やArtificial Analysisの精度・速度指標で高い結果を示し、1時間の音声を15秒未満で処理できるとしている。MAI-Voice-2は15以上の言語に対応する音声生成モデルで、感情制御、長尺コンテンツでの話者一貫性、Hindi-EnglishやSpanish-Englishのコードスイッチングも扱う。MAI-Voice-2-Flashは、リアルタイムエージェントや大量処理向けに、レイテンシーとコストを重視したFlash版として今後提供する。

MAIモデルについては、FoundryやMicrosoftの自社製品への統合に加え、OpenRouter、Fireworks AI、Basetenでも開発者向けに提供する方針を示した。Fireworks AI on Microsoft Foundryは、Fireworks AIのオープンモデル推論基盤をMicrosoft Foundry上で利用するためのサービスで、Azureのエンドポイントやガバナンスを使いながらオープンモデルを実行できる。

Frontier Tuning⁠自社の業務に合わせてエージェントを改善

モデル選択に加えて、組織固有の業務に合わせてAIを改善する仕組みとして「Frontier Tuning」も加わる。

Frontier Tuningでは、企業のデータ、業務プロセス、用語、ワークフロー、評価シグナルを使い、コンプライアンス境界内で強化学習を適用する。Build時点ではForward Deployed Engineersを通じたプライベートプレビューとして提供し、今後はCopilot StudioやMicrosoft Foundryでも利用できるようにする予定。

Foundry⁠エージェントを本番で動かすランタイム⁠ツール⁠観測基盤

エージェントをプロトタイプから本番に移す基盤として、Foundryにも更新が加わった。Build、Deploy、Operateの3層で、エージェント開発、実行、観測、改善の機能を整理している。

構築(Build)の層では、MicrosoftのオープンソースSDKであるSemantic Kernelの企業向け基盤と、AutoGenのマルチエージェントオーケストレーションを統合したMicrosoft Agent Frameworkを更新した。Foundry Toolkit for VS Codeの一般提供も含まれる。

展開(Deploy)の層では、Foundry Agent Serviceにおいて、セッションごとのサンドボックス、専用の計算資源、メモリ、ファイルシステムアクセス、フレームワーク非依存のランタイムを提供する「hosted agents」が中核になる。今後30日以内に一般提供へ到達する予定。

運用(Operate)の層では、hosted agents向けの実行トレースと評価、プロンプトやスキルの改善候補を生成するAgent optimizerも提供する。

このほか、Microsoft TeamsとMicrosoft 365 Copilotへのエージェント公開、Toolboxes in Foundry、Memory、Voice Liveなども更新した。

Agent 365とMXC⁠エージェントを監視⁠制御⁠隔離する

エージェントを本番で使うには、モデルの性能だけでなく、ID、権限、実行範囲、監査、データ保護が必要になる。今回の発表では、Agent 365、Windows、MXCを組み合わせ、エージェントを安全に実行するための基盤を打ち出した。

「Agent 365 for local agents」は、ローカルで動くエージェントも含め、エージェントの観測、管理、保護を行うための制御面として機能する。Entra、Defender、Purviewを拡張し、ホスト先やフレームワークにかかわらずエージェントを管理できるようにする。Windows側では、Agent 365とMXCのネイティブ統合も2026年7月にプレビュー提供する予定。

セキュリティ面では、ポリシー駆動型の安全性評価を行う「ASSERT⁠⁠、エージェントループ内での制御適用を標準化する「Agent Control Specification⁠⁠、脆弱性発見と修正提示を支援するエージェント型セキュリティシステム「Codename MDASH」も加わる。

MXCは、エージェントの実行をOS側で制御するための仕組みになる。単一の隔離方式ではなく、ワークロードやリスクに応じて、プロセス分離、セッション分離、Windows 365 for Agents、将来的なmicro-VMやLinuxコンテナーなどを使い分ける「composable sandbox」の制御面として機能する。OpenClawやNVIDIA OpenShellなどとの連携も進める。

Microsoft Execution Containers(MXC)SDKは、WindowsとWSL上のエージェント向けに、OSが実行時の境界を強制するポリシー駆動型の実行レイヤーを提供する。これにより開発者は、エージェントがアクセスできるファイルやネットワークなどの制約を定義できるようになる。MXC SDKは早期プレビューとして提供する。

Windows開発環境⁠Coreutils⁠Developer Configurations⁠Intelligent Terminal⁠WSL containers

Windows開発環境では、Windowsをエージェント時代の開発環境として整備する方針が示された。

まず、Linuxライクなコマンドラインユーティリティ群「Coreutils for Windows」を提供する。uutilsオープンソースプロジェクトを採用し、Rustで再実装されたGNU Coreutils互換のコマンド群をWindows上でネイティブに実行できるようにする。Linux、macOS、WSL、コンテナ、クラウドを行き来する開発者が、コマンドの違いによる作業の中断を減らす狙いがある。

Windows Developer Configurationsも一般提供する。WinGet構成ファイルと用途別スクリプトにより、VS Code、GitHub Copilot、WSL、PowerShell 7、Git、GitHub CLI、Pythonなどの導入と、開発者向け設定の適用をまとめて行える。クラウド開発環境としては、⁠Windows 365 with Developer configuration」をパブリックプレビューとして提供する。

ターミナル環境ではIntelligent Terminalを実験プレビューとして発表した。Windows Terminalをベースにしたオープンソースの実験的フォークで、ACP(Agent Client Protocol)互換エージェントにターミナルの状況を渡し、コマンド失敗時には専用ペインで原因や修正案を提示できるようになる。

「WSLコンテナー(WSL containers⁠⁠」は、今後数カ月以内にWSLの通常アップデートとしてパブリックプレビューになる予定。Windows上でGNU/Linux環境を動かす既存のWSLに、Linuxコンテナーを作成、実行、操作するためのCLIとAPIを組み込む。サードパーティ製ツールへの依存を減らし、企業ではポリシーに基づく有効化、実行中コンテナーの可視化、イメージ取得元やホストとの相互作用の管理も想定する。進捗はWSLリポジトリで確認できる。

エージェントがWindowsアプリを作るためのWindows Development Skillsも一般提供する。WinUI3 skillsとwinapp CLIを使い、エージェントがネイティブWindowsアプリの構築ライフサイクルを進めるための構造化された知識を提供する。

ローカルAIとハードウェア⁠Aion⁠Windows AI APIs⁠Surface RTX Spark Dev Box

Windows上のローカルAIも大きなテーマとなった。オンデバイス小規模言語モデルでは、⁠Aion 1.0 Instruct」「Aion 1.0 Plan」が加わった。

Aion 1.0 Instructは、現在のWindows OS SLMより小さく、高速で効率的なモデルとして投入する。Edgeブラウザーとの統合や、Hugging Faceでのオープンウェイトモデルとしての提供も予定している。Aion 1.0 Planは14Bのパラメーター、32Kのコンテキスト長の推論・ツール呼び出しモデルで、ローカルのエージェント型ワークフローを想定する。

Windows AI APIsは、NPUだけでなくCPUとGPUにも対応範囲を広げる。これにより、オンデバイスAI機能を利用できるWindows 11 PCが増える。必要なモデルは、対応アプリが要求したタイミングで取得する。

Microsoft Edge向けには、オンデバイスAIの新モデルとAPIも加わる。Edge CanaryとDev channelsでAion-1.0-Instructの開発者向けプレビューを提供し、Edge 148でLanguage Detector APIとTranslator APIを利用可能にする。

この領域では、⁠Project Solara」も示した。エージェント主導の体験を動かすための新しいプラットフォームで、2種類のコンセプトデバイスも含む。Windows開発環境、オンデバイスAI、開発者向けハードウェアとあわせて、環境をまたいだセットアップ、構築、実行をまとめやすくする狙いがある。

ハードウェアでは、Surface RTX Spark Dev Boxを発表した。NVIDIA RTX Spark superchipを搭載した小型の開発者向けPCで、最大1 PFLOPSのAI計算性能と128GBのユニファイドメモリを備える。120Bのパラメータモデルを1Mトークンのコンテキストでローカル実行できるとしている。米国のMicrosoft.com限定で、2026年後半に提供する予定。

RayfinとAzure HorizonDB⁠エージェントアプリの本番基盤

エージェントアプリケーションを本番環境に載せるための基盤として、RayfinとAzure HorizonDBも加わる。Rayfinは、Microsoft Fabric向けのmanaged backend-as-a-serviceとしてプレビューで提供する。コードまたは自然言語で作りたいアプリを指定すると、Rayfinがデータベース、認証、ストレージ、アクセスポリシーを含む型付きのバックエンドを生成する。

Azure HorizonDBは、Azure上のフルマネージドPostgreSQLサービス。エージェント型アプリケーションのスケールに対応するデータベース基盤として、内部テストで同等の自己管理型構成の3倍以上のスループットを提供したとしている。

科学研究と量子コンピューティングへの応用

Build 2026では、科学研究や量子コンピューティングへの応用も扱った。Azure上で動く科学ワークフロー向けのエージェント型AIプラットフォームMicrosoft Discoveryを公開した。BHP、Syensqo、GSKの活用例に加え、より広い科学研究コミュニティ向けに、GitHub Copilotアカウントで使える無料のローカルアプリも早期プレビューとして発表した。

量子コンピューティングでは、次世代トポロジカル量子チップ「Majorana 2」を発表した。前世代のqubitに比べて信頼性が1,000倍向上し、平均qubit lifetimeは20秒、最長で1分に達する例があるとしている。

おすすめ記事

記事・ニュース一覧