(株)サイバーエージェントは2024年7月9日、同社が開発する日本語LLMのCyberAgentLMの新バージョンとなる「CyberAgentLM3」を公開した。
同社はかねてより日本語LLMの開発に取り組んでおり、2023年5月に独自の日本語LLMである「CyberAgentLM」を一般公開した。2023年11月にバージョン2となる「CyberAgentLM2」を、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開している。これらの技術は同社が提供する「極予測AI」をはじめとするサービスにおいて広く活用されているという。
今回公開したモデルは、既存モデルをベースに用いずスクラッチから開発された225億パラメータのCyberAgentLM3-22B-Chat。LLMの日本語能力を言語理解能力・応用能力・アライメントの観点で評価するNejumi LLM リーダーボード3で、700億パラメータのMeta Llama3と同等の性能を記録している(2024年7月現在)。
CyberAgentLM3はApache License 2.0で公開されており、モデル本体とデモがHugging Faceで利用可能となっている。
- CyberAgentLM3-22B-Chat
- URL:https://huggingface.co/cyberagent/calm3-22b-chat
- CALM3-22B-Chat-Demo
- URL:https://huggingface.co/spaces/cyberagent/calm3-22b-chat-demo