Swallow LLM Projectは2026年2月20日、OpenAI GPT-OSSおよびAlibaba Qwen3の日本語能力と思考力を強化した推論型言語モデル
📢 GPT-OSS Swallow と Qwen3 Swallow をリリースしました。
— Naoaki Okazaki (@chokkanorg) February 20, 2026
継続事前学習+SFT+強化学習を全面刷新し、
日本語性能と推論能力を両立させたオープンなLLMを、
Apache 2.0ライセンスで利用できます。
Qwen3 Swallow: https://t. co/ tTRVGHnF4M
GPT-OSS Swallow: https://t. co/ L6a2zCjc7i
Swallow LLMは、東京科学大学の岡崎研究室、横田研究室、産業技術総合研究所のメンバーを中心とした研究チームによるプロジェクト。日本語性能を重視した大規模言語モデルを構築・
今回リリースされたのは、OpenAIがオープンなモデルとして公開しているGPT-OSS、そしてAlibabaが同様に公開しているQwen3を元に、日本語、英語、数学、コード、科学分野のデータセットを用いて継続事前学習とSFT
同プロジェクトによると、従来のSwallowモデルでの継続事前学習では、日本語性能が強化されるも数学、コード、科学技術などに関する高難易度のタスクの性能が損なわれるというトレードオフが発生していた。今回のモデルでは上記のような強化法により元となったモデルの持つ数学、コード、科学技術に関する能力を損なわずに学習を行うことができ、各種のベンチマークでも同等かそれ以上の性能を発揮しているという。
Qwen3-SwallowおよびGPT-OSS-Swallowの開発に関するTech Blogを執筆しました。
— Kazuki Fujii (@okoge_kaz) February 20, 2026
使用している学習ライブラリについてや、開発の裏側で発生したバグとの戦いなど、可能な限り詳細を詰め込みました。さらに詳細については来月発表予定のTechnical Reportをご覧ください!https:// t. https://co/ uJaZeOQNJH t. co/ WxlVINzT0V