xAI⁠大規模言語モデルGrok-1.5を発表 ―GPT-4に迫る性能を謳う

xAIは2024年3月28日、同社が開発する大規模言語モデル(LLM)の最新バージョン「Grok-1.5」を発表した。近日中に𝕏で利用可能となる予定。

Grok-1.5の大きな改善点の1つは、コーディングと数学に関するタスクを処理するパフォーマンス向上である。同社のテストによると、Grok-1.5はMATHベンチマークで50.6%のスコア、GSM8Kベンチマークで90%のスコアを達成したとのこと。この2つのベンチマークで小学校から高校までの試験問題の幅広い範囲をカバーしているという。さらにコード生成と問題解決能力を評価するHumanEvalベンチマークでも74.1%のスコアをマークした。これらのスコアはGPT-4に迫る性能[1]となっている。

またGrok-1.5では推論機能が改良され、コンテキストウィンドウ内で最大128kトークンのコンテキスト長を処理することができる。Grok-1.5のメモリ容量は以前のコンテキスト長の最大16倍となる。

Grok-1.5は間もなく初期テスターおよび既存のGrokユーザーに提供される。

おすすめ記事

記事・ニュース一覧