OpenAI⁠ChatGPTエージェントを発表 ―ブラウザ⁠ターミナル⁠APIからアクセス可能な自律型AIエージェント

OpenAIは2025年7月17日、AIエージェントがさまざまな作業を自律的に行う「ChatGPTエージェント」を発表した。

ChatGPTエージェントはテキスト/GUIブラウザやターミナルからの指示に従い、Web操作やコーディングなどのタスクをこなすことができる新しいモデル。ChatGPTの会話能力に1月に発表されたOperatorのWebサイト対話機能、そして2月に発表されたdeep researchのもつWeb情報分析能力を統合したエージェントシステムとなっている。

ChatGPTエージェントにはGUIを介しWebと対話するビジュアルブラウザ、シンプルな推論ベースのクエリに適したテキストブラウザ、APIへのダイレクトアクセスなどのWebツールが搭載され、状況に応じて最も効率的な方法でタスクを遂行することができる。どのツールを組み合わせてもタスクに必要なコンテキストが一貫して共有されるという。またタスクの実行状況に応じて、スピードや精度、効率が最も高くなる方法を探り進化するよう学習されているとのこと。

またChatGPTエージェントは、GmailやGoogle Drive、Dropbox、GitHubなどのアプリと接続できるChatGPTコネクタを活用することも可能。

こうした経緯で誕生したChatGPTエージェントは、Humanity's Last Exam、DSBench、SpreadsheetBenchといったAIパフォーマンスを計測する各種のベンチマークで次々と新記録を達成、特にデータ分析タスクでは人間のパフォーマンスを大きく超える結果を示したという。

一方、ChatGPTエージェントが高性能であるだけに、使い方によってはOpenAIが予期しない形で悪用される懸念もある。OepnAIもこの点を理解しており、金融取引や法的に機密性の高いやり取りなどのリスクの高いタスクを積極的に拒否したり、ChatGPTエージェントのローンチを生物・化学分野における「High Capability」⁠高能力)として扱い、予防的にセーフガードを発動するとしている。セーフガードの詳細はChatGPT agent System Cardを参照。

またOpenAI CEOのサム・アルトマン氏も、プライバシーとセキュリティのリスクを軽減するため、エージェントにはタスクを完了するために必要な最小限のアクセス権のみを付与することを勧めており、⁠実際に運用して研究、改善するまでは、ハイリスクな用途や大量の個人情報を扱う用途には使用しない」とのコメントを出している。

ChatGPTエージェントはChatGPTのPro、Plus、Teamユーザー向けに順次展開を開始し、Proユーザーは7月17日中に、PlusおよびTeamユーザーは数日中に利用可能になる。またEnterpriseおよびEduユーザーも数週間以内に利用可能になるとのこと。

おすすめ記事

記事・ニュース一覧