Google⁠、Gemini 3 Deep Thinkを更新し研究⁠・エンジニアリング用途を強化
——数学研究エージェント「Aletheia」など共同研究の取り組みも
2026-02-13
シェア
Gemini 3 Deep Thinkの更新
GoogleのDeep Thinkチームは2026年2月12日、推論モード「Gemini 3 Deep Think」のモデルを更新したことを発表した。このモデルは、数学・物理学・化学の国際オリンピックや競技プログラミング、各種ベンチマークで非常に高いパフォーマンスを示している。また、明確なガードレールが存在しない問題や、データが不完全な困難な課題に対処できるよう推論を強化しているという。
今回更新されたDeep Thinkモードは、競技プログラミングプラットフォームCodeforcesにおいてEloレーティング3455という数値を記録したほか、一般的な推論能力を測るARC-AGI-2では84.6%、フロンティアモデルをテストするHumanity’s Last Examにおいて、ツールなしで48.4%を達成している。さらに、国際数学オリンピック2025、国際物理オリンピック2025(筆記)、国際化学オリンピック2025(筆記)で金メダルレベルの結果を示している。
The latest Deep Think moves beyond abstract theory to drive practical applications.
It’s state-of-the-art on ARC-AGI-2, a benchmark for frontier AI reasoning.
On Humanity’s Last Exam, it sets a new standard, tackling the hardest problems across mathematics, science, and… pic.twitter.com/Cm0PYDd2Cn