DeepSeek、推論型のLLM「DeepSeek-R1」をリリース ―OpenAI o1と同等のパフォーマンスをもつオープンソースモデル

DeepSeekは2025年1月20日、同社の開発した最新のLLM「DeepSeek-R1」を発表した。DeepSeekは中国のAIスタートアップで、DeepSeek-R1は同社初の推論モデルとなる。

DeepSeek-R1 -GitHub

🚀 DeepSeek-R1 is here!

⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!

🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) January 20, 2025

DeepSeek-R1の予備段階のモデルとして「DeepSeek-R1-Zero」があり、これは教師ありファインチューニング（SFT）に頼らず、ベースモデルに大規模な強化学習（RL）を直接適用することにより、複雑な問題を解決するための思考の連鎖（CoT）を探索できるようになったもの。これに加えて、改善された推論パターンを発見し、人間の好みに合わせることを目的とした2つの強化学習用ステージと、モデルの推論機能と非推論機能の種となる2つのSFTステージを組み込み、推論パフォーマンスをさらに向上させたものがDeepSeek-R1となった。同社によると、DeepSeek-R1は数学、コード、推論タスク全体でOpenAI o1に匹敵するパフォーマンスを発揮するという。

DeepSeek-R1はMITライセンスの元、オープンソースとして提供される。

このほかAPIでも提供され、以下の料金で利用可能。

0.14ドル/100 万入力トークン（キャッシュヒット）
0.55ドル/100 万入力トークン（キャッシュミス）
2.19ドル/100万出力トークン