gihyo.
※この記事は、不正確な内容を含んでいる可能性のある実験的コンテンツです。正確な情報はリンク先を確認してください。
AGENTS.mdの採用は広がる?
OpenAIらがAIエージェントに対するREADMEとしてAGENTS.
VS CodeにおけるAGENTS.md採用の行方
VS Codeでは、プロダクトマネージャーのHarald Kirschner氏がAGENTS.
AGENTS.
clineにおけるAGENTS.md採用に関する考察
clineのpash
clineにおけるエージェント用ルールファイルの標準化について、pash氏は現行のAGENTS.
政策・社会動向
gpt-5-proによる新しい数学的証明
Sebastien Bubeck氏が2025年8月21日、gpt-5-proによる数学的証明の成果をXで報告した。
Bubeck氏は、凸最適化分野の未解決問題をgpt-5-proに提示し、従来論文よりも優れた上限値の証明を得たと報告した。証明内容は自身が検証済みであり、AIモデルが新しい数学的発見や証明を実現できる可能性を示す事例となったという。
Sam AltmanがGPT-6の「記憶」機能について語る
CNBCが2025年8月19日、OpenAIのSam Altman氏によるGPT-6の
記事では、Sam Altman氏がGPT-6に搭載予定の
サービス・アプリケーション
ExcelのCopilot関数でAIを活用
Microsoftが2025年8月21日、ExcelのCopilot関数によるAI活用事例を公式ブログで公開した。
Copilot関数は、Excelの数式内でAIモデルによる推論やデータ生成を直接利用できる新機能。記事では導入手順、利用可能な関数一覧、AIによるデータ補完・
Pixel 10をより便利にするAIの9つの機能
Googleが2025年8月20日、Pixel 10のAI機能群を紹介した。
新設計のTensor G5とオンデバイスのGemini Nano
を組み合わせ、Magic Cue
によるアプリ横断の文脈表示、音声通話のリアルタイム翻訳、着信の自動文字起こしと要約を行うTake a Message
、NotebookLM
との連携によるスクリーンショットや録音のノート化、Gboardの文体変更やRecorderを用いた音声からの音楽生成など、多様なAI体験を端末上で提供する。
Google Photos:AIによる会話型画像編集機能がPixel 10で登場
Googleが2025年8月20日、Google PhotosにGemini搭載の会話型AI画像編集機能をPixel 10向けに米国で提供開始した。
Google Photosの新しい画像編集機能は、Gemini AIを活用し、ユーザーがテキストや音声で
Gemini Liveが視覚的ガイダンスと表現力を強化
Googleが2025年8月20日、Gemini Liveのアップデート内容を発表した。
GoogleはGemini Liveのアップデートで、カメラ共有時に画面上へ視覚的なハイライトを表示する機能や、Google Calendar/
Gemini for Homeが家庭向けに対話と管理を拡張
Googleが2025年8月20日、家庭向けアシスタント
Gemini for Homeは従来のGoogle Assistantに代わり、家の中での複雑な要求に応じた自然な対話を提供することを目的としている。複数のストリーミングサービス横断でのメディア検索や、複数コマンドを同時に処理するスマートホーム統合、家族向けのカレンダーやリスト管理支援、段階的な調理支援や対話的トラブルシュートなどの機能を挙げている。早期アクセスが10月に開始される予定。
Claude Codeの出力スタイル解説
Anthropicが2025年8月21日、Claude Codeの出力スタイルに関する公式ドキュメントを公開した。
Claude Codeは、Explanatoryモードで教育的な
Claude CodeがTeam・Enterpriseプランに対応
Anthropicが2025年8月21日、Claude CodeのTeamおよびEnterpriseプラン対応を公式Xで発表した。
Claude Codeは、組織内で標準・
Claude API「Usage and Cost API」公開
Anthropicが2025年8月21日、Claude API向けの
Usage and Cost APIは、Claude APIの利用状況やコストをリアルタイムで監視・
Illustratorベータ版、「Turntable」機能で2Dベクターを3D回転
Adobeが2025年8月19日、Illustratorベータ版に
Turntableは、2Dベクターアートを3D空間で回転表示できる新機能。スライダー操作のみで水平方向・
SuperMemory: AIによる記憶拡張ツール
SuperMemoryAIが2025年8月21日、SuperMemoryのGitHubリポジトリを公開した。
SuperMemoryは、AI技術を活用して個人やチームの知識・
開発・開発ツール
GitHub Agents PanelとCopilot Coding Agentの新機能
GitHubが2025年8月21日、Agents PanelとCopilot Coding Agentの新機能を発表した。
Agents Panelは、GitHub上でCopilot Coding Agentのタスク管理や進捗確認を一元化できる新機能である。開発者はリポジトリやプルリクエスト単位でエージェントの作業状況を可視化し、タスクの割り当てや履歴管理が容易になる。パネル上で進捗のリアルタイム表示や、複数エージェントの同時管理、履歴の検索・
Visual StudioでMCPが正式対応
Microsoftが2025年8月21日、Visual StudioでMCPの正式対応を発表した。
Visual Studioへの統合により、開発者はコード編集・
VS Code、エージェントへの指示出しでのtool_preamblesの活用
Burke Holland氏は2025年8月21日、VS CodeでGPT-5 miniで作業している場合、カスタム指示を実際に従わせたい場合にはtools_
タグを活用してみてほしいと案内した。
ちなみに、Copilotのエージェントモードのデフォルトプロンプトでも<tool-preambles>
タグが使われていることに言及している。
VS Code、GPT-5用の新エージェントプロンプトがInsiders向けに提供開始
Burke Holland氏は2025年8月21日、VS CodeにおいてGPT-5の新しいエージェント用システムプロンプトがInsiders向けに利用可能となったことを案内した。
投稿によると、VS CodeチームはGPT-5のエージェントプロンプト改善に継続的に取り組んでおり、Insidersユーザーは、新しいシステムプロンプト
Gemini APIのURLコンテキストツール一般提供開始
Googleが2025年8月21日、Gemini APIのURLコンテキストツールの一般提供開始を公式ブログで発表した。
Gemini APIのURLコンテキストツールは、外部URLの内容をAIモデルに渡して要点抽出や質問応答を行う機能。公式ブログやサンプルノートブックでは、導入手順や活用事例、APIの制限事項が詳しく解説されている。
Gemini APIとVercel AI SDKの連携例
Googleが2025年8月21日、Gemini APIとVercel AI SDKの連携例を公式ドキュメントで公開した。
Gemini APIとVercel AI SDKを組み合わせることで、TypeScript/
Vercel、HTML内でのLLM命令埋め込み提案
Vercelが2025年8月21日、HTML内でLLM命令をインライン記述する新提案をブログで公開した。
Vercelは、HTMLドキュメント内にLLMへの命令を直接埋め込む新記法を提案。<script type="text/
タグを使い、AIエージェントがWebページ上で必要な指示を即座に取得できる仕組みを実現する。従来のAPIや外部スクリプト経由に比べ、開発者が柔軟かつ直感的にAI機能を組み込める利点があり、MCPサーバー連携や認証バイパスなど実運用例も紹介した。
Firecrawl v2.0.0の新機能とリリース情報
Firecrawlチームが2025年8月19日、Firecrawl v2.
Firecrawl v2.
Windsurf 1.12.1:Devin機能追加と新UI
Windsurfが2025年8月14日、Devin機能の追加や安定性向上、新UIを含むバージョン1.
Windsurf 1.
deepagents:TypeScript製「Deep Agents」ライブラリ
LangChainが2025年8月16日、TypeScript製エージェントライブラリ
deepagents
はLLMによるツール呼び出しループに加え、長期計画・
LangGraph × MongoDBによるエージェント長期記憶ストア
MongoDBが2025年8月20日、LangGraph向けの長期記憶ストアとしてlanggraph-store-mongodb
今回提供されたMongoDBStore
は、スレッドを超えた永続的メモリをサポートし、長期的な記憶をJSONドキュメントとして保存して意味検索
cc-sdd:Claude Code/Gemini CLI向け仕様駆動型AI開発ツール
Gota氏が2025年8月20日、Claude CodeおよびGemini CLI対応の仕様駆動型AI開発ツール
「cc-sdd」
非同期コーディングエージェントの運用と設計
Elite AI Assisted Codingが2025年8月19日、非同期コーディングエージェントの運用と設計に関する記事を公開した。
記事では、クラウド上で独立してタスクを受け持ち、完了後に成果物を返す
Monaco: AIによるコードエディタ体験の拡張
Allen Institute for AIが2025年8月21日、MonacoによるAIコードエディタ体験拡張技術を公式ブログで公開した。
Monacoは、AI技術を活用してコードエディタの補完・
Jupyter Agent 2によるAIノートブック自動化
Leandro von Werra氏は2025年8月19日、Jupyter Agent 2のデモスペースを公開した。
Jupyter Agent 2は、AIエージェントがJupyterノートブック上で自動的にコード生成・
Trigger v4 GAリリース情報
Trigger.
Trigger v4は、ワークフロー自動化やイベント駆動型処理を支援するSaaSプラットフォームの最新バージョン。開発者はTrigger v4を活用することで、複雑な業務フローの自動化やリアルタイムイベント処理、外部サービス連携の効率化、運用コスト削減、サービス品質向上などを実現できる。
MCP Night by WorkOS:AnthropicとOpenAIがMCPの現状と課題を議論
WorkOSが2025年8月21日、YouTube公式チャンネルで
イベントでは、MCPの標準化やAIツール間連携の実例、導入時の課題、セキュリティや認証の重要性、コミュニティ主導の仕様策定などについて両社が率直に議論された。MCPは複数企業のAIモデルと外部サービスを安全かつ柔軟に接続する共通プロトコルとして注目されており、実際の運用例
MCPの設計パターン:Literate Reasoning
glassBead氏が2025年8月19日、MCP
この記事では、MCP開発における
MCPサーバー運用・Gemini API活用事例
Philipp Schmid氏が2025年8月20日、MCPサーバー運用・
STDIOサーバーは手軽だが運用負荷が高く、ローカルセットアップは個人用途向きでチーム運用には不向き。動的割り当て
モデル・基盤技術
Qwen-Image-Edit: 画像編集AIの新機能
QwenLMチームが2025年8月21日、Qwen-Image-Editの新機能を公式ブログで発表した。
Qwen-Image-Editは、AIによる画像編集機能を提供する新しいツール。公式ブログでは、編集アルゴリズムやサンプル画像、導入手順が詳しく解説されている。画像生成や編集の自動化、Webサービスへの応用例も紹介されている。さらに、複数画像の一括編集や、細かなパラメータ調整、今後の機能追加予定なども記載されており、幅広い用途に対応できる設計となっている。
DeepSeek-V3.1:思考・非思考モード両対応のハイブリッドAIモデル
DeepSeek-AIが2025年8月21日、思考モードと非思考モードの両方に対応した新世代AIモデル
DeepSeek-V3.
DINOv3: Metaの自己教師ありビジョンモデル
Meta AIが2025年8月21日、DINOv3の自己教師ありビジョンモデルを公式ブログで発表した。
DINOv3は、ラベルなし画像データから特徴抽出・
ToonComposer: AIによる漫画・イラスト生成技術
Lingen Li氏らは2025年8月21日、ToonComposerの論文とプロジェクトページを公開した。
ToonComposerは、AIを活用して漫画やイラストの構成・
swallow-evaluation-instruct:LLM評価フレームワーク公開
swallow-llmが2025年8月、swallow-evaluation-instructリポジトリで大規模言語モデル評価用フレームワークを公開した。
swallow-evaluation-instruct
は、大規模言語モデルの評価を効率化するためのフレームワーク。環境構築スクリプトやベンチマーク定義、評価ツール群を備え、READMEやBENCHMARKS.
、TIPS.
で導入手順や評価設定、実行例を詳しく案内している。v202508などのリリースタグや設定ファイルのサンプルも提供されており、モデルごとの性能比較やカスタムベンチマークの作成が可能。
ZenFlow:LLM学習向けストールフリーオフロードエンジン
PyTorchが2025年8月20日、ブログ記事
ZenFlowは、GPUとCPU間の通信・
Triton Persistent Cache-Aware Grouped GEMM KernelによるMoE高速化
PyTorchが2025年8月21日、Triton Persistent Cache-Aware Grouped GEMM KernelによるMoE
この記事では、PyTorchがTritonを活用したGEMM
Dynamo 0.4: NVIDIAの高速化・自動スケーリング技術
NVIDIAが2025年8月21日、Dynamo 0.
Dynamo 0.
JAX ML Scaling Book 第12章「How to Think About GPUs」公開
Google DeepMindが2025年8月18日、JAX ML Scaling Bookの第12章
「How to Think About GPUs」
Tiny-TPU v2のオープンソース実装
Tiny-TPU v2チームが2025年8月21日、Tiny-TPU v2のオープンソース実装を公開した。
Tiny-TPU v2は、低消費電力・
vllm-cli: コマンドラインからvLLMを操作
Chen-zexiが2025年8月21日、vllm-cliのGitHubリポジトリを公開した。
vllm-cliは、vLLMをコマンドラインから操作できるツール。ユーザーはローカル環境やクラウド上での推論実行、バッチ処理、パイプライン構築、複数モデルの切り替え、入出力の自動化、ログ管理、リソース制御など多様な用途に活用できる。コマンドラインから直接APIを呼び出すことで、スクリプトやCI/
研究動向
End Subset Conversations:対話AIの新しい会話管理技術
Anthropicが2025年8月21日、End Subset Conversationsに関する研究成果を公式サイトで公開した。
End Subset Conversationsは、AI対話モデルが長い会話の中で重要な情報を保ちつつ、不要な部分をうまく終了・
条件付き生成モデルによるデータ合成の新展開
Googleが2025年8月20日、条件付き生成モデルを活用したデータ合成技術の解説記事を公開した。
大規模パラメータモデルの負担を軽減しつつ、条件付き生成モデルによる高品質なデータ合成技術を開発したことで、従来の手法と比べて、柔軟な制約設定や多様なデータ生成が可能となった。それにより、AIモデルの学習・
大規模データの差分プライバシー保護手法
Googleが2025年8月20日、差分プライバシーによる大規模データ保護手法の技術解説記事を公開した。
Googleは大規模なデータセットに対して差分プライバシーを適用するための
MindJourneyによるAIの空間認識強化
Microsoft Researchが2025年8月21日、MindJourneyによるAIの空間認識強化技術を解説したブログ記事を公開した。
MindJourneyは、AIがシミュレートされた3D仮想空間を探索し、空間認識能力を高める技術。世界モデルとVLM
VIPE:NVIDIAのAI画像処理パイプラインエンジン
NVIDIA Toronto AI Labが2025年8月21日、VIPE
VIPEは、AIによる画像・
LongSplat:長時間動画向け非ポーズ3Dガウススプラッティング技術
Chin-Yang Lin氏らは2025年8月19日、
LongSplatは、長尺動画における不確かなポーズ推定問題を解決するため、インクリメンタル結合最適化や堅牢なポーズ推定、Octreeアンカー配置など複数の技術を組み合わせて3Dガウシアンスプラッティングの品質と効率を高めた。実験では既存手法と比較してレンダリング品質やポーズ精度が向上し、長時間撮影やドリフト条件下でも安定した再構築が可能であることが示されている。
Chain-of-Agents:多エージェント蒸留とAgentic RLによる基盤モデル技術
Weizhen Li氏らは2025年8月6日、
Chain-of-Agentsは、複数のAIエージェントが連携し、知識と行動を蒸留して汎用的なAgent Foundation Modelを構築する新しい枠組みを提案している。エージェント同士が役割分担・
Hunyuan GameCraft: ゲーム生成AIフレームワーク
Tencent Hunyuanチームが2025年8月21日、Hunyuan GameCraftの公式サイト・
Hunyuan GameCraftは、AI技術を活用してゲームのシナリオ・
動的データ選択による大規模言語モデルの効率的学習
Weigao Sun氏らは2025年8月13日、
大規模言語モデルの効率的な学習を実現するための動的データ選択手法を提案している。著者らは、学習過程でデータの重要度を評価し、モデル性能向上に寄与するサンプルを優先的に選択するアルゴリズムを開発した。実験では従来法と比較して学習速度や精度が向上し、計算資源の節約や汎化性能の改善が確認されたという。
ComputerRL:API–GUI協調型分散強化学習
Hanyu Lai氏らは2025年8月19日、
ComputerRLは、APIとGUIの協調による人間操作の模倣や、仮想デスクトップの並列化による大規模環境生成を提案した。探索と安定化を両立するエントロパルス戦略や、分散化によるサンプル効率向上のための同期・
LLM-Agent: Efficient Language Model Agent for Reasoning
Yi-Fan Zhang氏らは2025年8月18日、
LLM-Agentは、推論タスクに特化した効率的な言語モデルエージェントの設計と評価を報告している。論文ではモデル構造や訓練手法、ベンチマーク結果が詳しく解説されており、既存手法との比較や応用可能性についても言及されている。
LLM-Reasoner:推論強化型言語モデル
Aditya Tomar氏らは2025年8月17日、
LLM-Reasonerは、推論能力を強化した言語モデルの設計と評価を報告している。モデル構造や訓練手法、ベンチマーク結果が詳しく解説されており、既存手法との比較や応用可能性についても言及されている。
EfficientRL:モデルベース計画による効率的強化学習
Tianjiao Zhao氏らは2025年8月18日、
EfficientRLは、モデルベースの計画手法を活用した効率的な強化学習アルゴリズムの設計と評価を報告している。サンプル効率の向上や報酬設計の工夫、現実世界のロボット制御やゲームAIへの応用事例も紹介されている。
BeyondWeb:LLM事前学習用・大規模合成データ生成フレームワーク
datologyAIが2025年8月19日、BeyondWebによるLLM事前学習用の大規模合成データ生成技術についてブログ記事を公開した。
BeyondWebは、AIモデルの学習に使う
LLM-Edit:効率的適応のための言語モデル編集
Yuchen Fan氏らは2025年8月18日、
LLM-Editは、言語モデルの効率的な適応・
量子コンピュータによるAIモデル設計・学習効率化の技術進展
Aleksandr Berezutskii氏らが2025年7月30日、
この論文では、Google Quantum AIチームが量子コンピュータを活用したAIモデルの設計・
その他
Cloudflare Browser Developer Program発表
Cloudflareが2025年8月21日、Browser Developer Programの開始を公式ブログで発表した。
CloudflareがBrowser Developer Programを発表した理由は、Webブラウザ開発者がCloudflareの最新技術やAPI、ツール群を活用し、高速かつ安全なWeb体験を構築できるよう支援するため。開発者コミュニティとの交流やフィードバックを通じて機能改善を促進し、ベストプラクティスの共有や技術サポート体制の強化を図ることで、Webブラウザ技術の発展と普及を目指しているという。