サイバーエージェント、DeepSeek-R1に日本語で追加学習を施したLLMを公開

サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM「DeepSeek-R1」の蒸留モデルに日本語データによる追加学習を行ったLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」を公開した。

【モデル公開のお知らせ】
DeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLMを公開いたしました。今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります。 https://t.co/Oi0l2ITzhh
— サイバーエージェント　広報＆IR (@CyberAgent_PR) January 27, 2025

DeepSeek-R1-Distill-Qwen-14B/32B-Japaneseは、DeepSeek-R1の蒸留モデルであるDeepSeek-R1-Distill-Qwen-14B/32Bを元に、日本語データを用いて追加学習を行ったもの。同モデルはHugging Face上にてMITライセンスにもとづいて公開されている。

DeepSeek-R1-Distill-Qwen-32B-Japanese -Hugging Face
DeepSeek-R1-Distill-Qwen-14B-Japanese -Hugging Face