xAI⁠高コストパフォーマンスの2Mコンテキストウィンドウ⁠マルチモーダル推論モデル「Grok 4 Fast」リリース

xAIは2025年9月19日、200万トークンのコンテキストウィンドウを備えたコストパフォーマンスの高い最新の推論モデル、Grok 4 Fastをリリースした。

Grok 4 Fastは大規模な強化学習を施された結果、大幅なトークン効率の向上を達成した。同社の評価によると、Grok 4と比較して平均で40%少ない思考トークンの使用で、AIMEなどの数学ベンチマークで同等のパフォーマンスを達成したという。これによりトークンあたりの価格がGrock 4から98%も低下した。

Artificial Analysis Intelligence Indexで公開されている価格対インテリジェンス比においても、Grok 4をはじめとする他のモデルと比較して最先端(state-of-the-art:SOTA)の値を記録している。

また、Grok 4 Fastはツール使用強化学習(RL)を用いてエンドツーエンドで学習させたことで、コード実行やWebブラウジング等のツールを呼び出すタイミングを判断する能力に優れている。これにより最先端のエージェント検索機能を備え、たとえばWebとXをシームレスにブラウジングすることで、リアルタイムデータを用いてクエリを拡張できる。リンクを越えてX上の画像や動画を含むメディアを取り込み、高速に検索結果を統合して表示する。

さらに、これまで推論と非推論では異なるモデルを必要としていたのに対し、Grok 4 Fastでは推論(長い思考の連鎖)と非推論(迅速な応答)が同じモデルの重み付けで処理され、システムプロンプトによって制御される統合アーキテクチャが導入されている。この統合により、エンドツーエンドのレイテンシとトークンコストが削減され、リアルタイムアプリケーションでの使用にも最適となった。

grok.comでは、これにより単純なクエリには即座に応答し、複雑なクエリには拡張推論を実行するといったスムーズな応答が行われる。またxAI APIはgrok-4-fast-reasoning(推論)とgrok-4-fast-non-reasoning(非推論)の2つのモデルで展開され、開発者は推論/非推論の動作を微調整し、速度または深度を最適化できる。

Grok 4 Fastはgrok.comgrok.x.com、そしてiOSアプリAndroidアプリ で無料で利用できる。モデルの適用にはFastモードとAutoモードが利用可能で、検索と情報検索クエリの性能が大幅に向上される。Autoモードでは複雑なクエリに対してはGrok 4 Fastが使用される。このため品質を損なうことなく、より高速なエクスペリエンスが得られるという。また期間限定でOpenRouterVercel AI Gatewayでも無料で利用可能。

なおxAI API経由での利用は有料。詳しくはモデル料金のページを参照。

おすすめ記事

記事・ニュース一覧