Alibaba Qwen Teamは2026年6月22日、7つのドメインでエージェント環境をシミュレートするネイティブ言語世界モデル
📣📣 Meet Qwen-AgentWorld — a native language world model that simulates 7 agent environments (MCP, Search, Terminal, SWE, Web, OS, Android) within a single model. Environment modeling is the training objective from day one, not a post-hoc adaptation.
— Qwen (@Alibaba_Qwen) June 24, 2026
🤔 LLMs are trained to be… pic.twitter. com/ ahvxH66uxT
世界モデル
Qwen-AgentWorldは、世界モデリングを事後的なアドオンとして扱う従来のアプローチとは異なり、1000万を超える実世界のインタラクションにもとづいて、CPT
言語モデル型のエージェントは対話型環境で動作するように訓練されているが、現在の状態とエージェントの行動に基づいて次に何が起こるかを予測する、といった環境自体をモデル化するように訓練された言語モデルは存在しない。Qwen-AgentWorldは、言語モデルに基づいて構築された世界モデルが、汎用エージェントの能力の限界をさらに押し広げる方法を調査する試みとして開発されている。
このモデルを評価するために、実環境で得られた正解データとペアになった7つのドメインの評価ベンチマークであるAgentWorldBenchも合わせて公開された。同社がAgentWorldBenchで行ったテストでは、Qwen-AgentWorldの上位モデルであるQwen-AgentWorld-397B-A17BがGPT-5.
Qwen-AgentWorldでオープンソースとして公開されているのは
またAgentWorldBenchも同様にオープンソースとして公開されている。