DeepSeek⁠推論型のLLM「DeepSeek-R1」リリース ―OpenAI o1と同等のパフォーマンスをもつオープンソースモデル

DeepSeekは2025年1月20日、同社の開発した最新のLLM「DeepSeek-R1」を発表した。DeepSeekは中国のAIスタートアップで、DeepSeek-R1は同社初の推論モデルとなる。

DeepSeek-R1の予備段階のモデルとして「DeepSeek-R1-Zero」があり、これは教師ありファインチューニング(SFT)に頼らず、ベースモデルに大規模な強化学習(RL)を直接適用することにより、複雑な問題を解決するための思考の連鎖(CoT)を探索できるようになったもの。これに加えて、改善された推論パターンを発見し、人間の好みに合わせることを目的とした2つの強化学習用ステージと、モデルの推論機能と非推論機能の種となる2つのSFTステージを組み込み、推論パフォーマンスをさらに向上させたものがDeepSeek-R1となった。同社によると、DeepSeek-R1は数学、コード、推論タスク全体でOpenAI o1に匹敵するパフォーマンスを発揮するという。

DeepSeek-R1はMITライセンスの元、オープンソースとして提供される。

このほかAPIでも提供され、以下の料金で利用可能。

  • 0.14ドル/100 万入力トークン(キャッシュヒット)
  • 0.55ドル/100 万入力トークン(キャッシュミス)
  • 2.19ドル/100万出力トークン

おすすめ記事

記事・ニュース一覧