オープンソースのマルチモーダルビジュアルモデルKimi K2.5リリース ―100のエージェントを並列実行する「Agent Swarm」プレビューリリース

中国Moonshot AIは2026年1月27日、同社の最も強力なオープンソースモデルとなるKimi K2.5をリリースした。

Kimi K2.5はKimi K2をベースに、約15Tのビジュアルトークンとテキストトークンを混合した継続的な事前学習により構築されたネイティブマルチモーダルモデル。最高レベルのコーディングおよびビジョン機能をもつ。同社によると、コーディングやエージェントにおける各種ベンチマークでGPT-5.2、Claude Opus 4.5、Gemini 3 Pro、DeepSeek V3.2、Qwen3-VL-235B-A22Bといったハイエンドモデルに匹敵、あるいは上回る性能を発揮している。

コーディングでは、特にフロントエンド開発において優れた機能を発揮するという。またテキストだけでなく「視覚的なコーディング」にも対応、画像/動画からコード生成とビジュアルデバッグを行うことができる。たとえば、動画を読み込んでその通り遷移するWebサイトのコードを生成したり、迷路パズルを読み込んで最短経路を表示するコードを推論することが可能。

さらに、リサーチプレビューとして「Kimi K2.5 Agent Swarm」がリリースされている。これは並列エージェント強化学習(PARL)によって最大100個のサブエージェントからなるAgent Swarm(エージェント群)を形成,自律的に制御し、事前定義されたロールや手動で作成されたワークフローを必要とせず最大1,500ステップの協調ワークフローを並列実行するというもの。これにより単一エージェントの4.5倍の速度で動作するという。エージェント群にはオーケストレーターが用意され、専門化されたサブエージェント(AIリサーチャー、物理学リサーチャー、ファクトチェッカーなど)を動的に作成し、複雑なタスクを並列化可能なサブタスクに分解することで、効率的な分散実行を実現している。

Kimi K2.5はkimi.comでチャットモードとエージェントモードを試すことができるほか、Kimi Codeでコーディングエージェントとして利用可能。またHugging Faceでも公開されている。Kimi K2.5 Agent Swarm(ベータ版)は、Kimi.com上で上位ティアの有料ユーザー向けに無料クレジットとともに公開されている。

おすすめ記事

記事・ニュース一覧