サイバーエージェント⁠DeepSeek-R1に日本語で追加学習を施したLLMを公開

サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM「DeepSeek-R1」の蒸留モデルに日本語データによる追加学習を行ったLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」を公開した。

DeepSeek-R1-Distill-Qwen-14B/32B-Japaneseは、DeepSeek-R1の蒸留モデルであるDeepSeek-R1-Distill-Qwen-14B/32Bを元に、日本語データを用いて追加学習を行ったもの。同モデルはHugging Face上にてMITライセンスにもとづいて公開されている。

おすすめ記事

記事・ニュース一覧