gihyo.
※この記事は、不正確な内容を含んでいる可能性のある実験的コンテンツです。正確な情報はリンク先を確認してください。
政策・社会動向
Google検索:AIの影響
Googleが2025年8月6日、Google検索におけるAIの影響についてデータと分析を公表した。
Googleは、AI Overviewsなどの検索機能によりユーザーがより長く複雑な問いを投げかけるようになり、総検索数やページへのクリック機会が増えていると報告している。総オーガニッククリック量は前年と概ね安定する一方で、迅速に離脱しない
ジュニア開発者はAI時代でも活躍できる:GitHubが提案する成長戦略
GitHubが2025年8月7日、AI時代におけるジュニア開発者の成長と活躍の方法を公式ブログで解説した。
AIの進化によりソフトウェア開発の現場は大きく変化しているが、GitHubは
サービス・アプリケーション
Microsoft 365 Copilot、GPT-5を搭載
Microsoftが2025年8月7日、Microsoft 365 CopilotとCopilot StudioにGPT-5を搭載した。
CopilotはGPT-5のリアルタイムルーターで最適なモデルを自動選択し、日常的な質問には高速応答、複雑な業務には深い推論で対応する。ライセンス保有者は即日利用可能で、一般ユーザーにも順次展開。Copilot StudioでもGPT-5を主モデルとして選択でき、FAQや活用例も多数公開されている。
Microsoft:gpt-oss活用方法を解説
Microsoftは2025年8月5日、OpenAIのgpt-oss-120bおよびgpt-oss-20bをAzure AI FoundryやWindows AI Foundry上で活用する方法を公式ブログで解説した。
記事では、gpt-oss-120b
Grok 4:全ユーザーに無料開放と利用上限拡大
2025年8月11日、xAiが大規模言語モデル
Grok 4は、Autoモードを使うことで複雑なクエリを自動的にGrok 4へルーティングでき、Expertモードを選択すれば常時Grok 4を利用可能。今回の開放にあわせて、期間限定で大幅な利用上限拡大も実施されており、より多くのユーザーがGrok 4の高性能なAI機能を体験できる。
Geminiアプリ:パーソナライズ機能強化
Googleが2025年8月13日、Geminiアプリに一時チャット機能と新たな個人情報管理オプションを追加した。
Geminiアプリは、過去の会話履歴を参照してユーザーの好みや文脈を学習し、よりパーソナライズされた応答を返す新機能を導入した。新たに追加された
Google Finance:AI中核の新設計
Googleが2025年8月8日、AIを中核に据えた新しいGoogle Financeのテストを開始した。
新しいGoogle Financeは、AIによる包括的な回答を軸に、複雑な金融リサーチを一度に行える体験を目指している。記事では高度なチャート表示
みんなの自動翻訳@TexTra:NICTニューラル機械翻訳エンジンの高精度化
NICTが2025年8月12日、
LLMの一部機能をNMTに応用し、BLEUスコアが全言語方向で平均2.
Claude Sonnet 4、APIで100万トークンの長大コンテキストに対応
Anthropicが2025年8月12日、Claude Sonnet 4のAPIで最大100万トークンの長大コンテキスト対応を発表した。
Claude Sonnet 4は、従来比5倍となる100万トークンの入力コンテキストをAPI経由で扱えるようになり、7万5千行超のコードベースや数十本の論文・
Claude Code、Opusプランモードを追加
Anthropicが2025年8月14日、Claude Codeに
Claude Codeの最新アップデートで、モデル選択画面に/model
セレクターから
Claude:過去チャット参照・プロンプトキャッシュ拡張の新機能
2025年8月12日、Claudeが過去のチャット履歴参照機能とプロンプトキャッシュのTTL拡張を発表した。
今回のアップデートで、Claudeは過去のチャット履歴を参照しながら会話を継続できるようになった。まずはMax、Team、Enterpriseプラン向けに順次展開され、今後他プランにも拡大予定。設定画面から機能の有効化が可能。また、プロンプトキャッシュの有効期間
LM Studio 0.3.23:gpt-oss対応強化とMoE最適化
LM Studioチームが2025年8月12日、LM Studio v0.
本バージョンでは、openai/
のチャット内ツール呼び出し信頼性向上、MoEllama.
の--n-cpu-moe
技術を活用し、モデルごとの詳細設定も可能。アップデートはアプリ内または公式サイトから。ライセンスや詳細は公式ドキュメント参照。
ComfyUI「Subgraph」機能:複雑ワークフロー再利用
Comfy Orgは2025年8月7日、ComfyUIの
Subgraph機能は、複数ノードを1つのサブグラフノードとしてパッケージ化し、複雑なワークフローをシンプルかつ再利用可能な部品として管理できる。部分実行
ChatGPT画像黄ばみ補正ツール:chatgpt image yellow tint corrector
apolinario
- ok i can't take it anymore: announcing the chatgpt image yellow tint corrector - X
- gpt-yellow-tint-corrector - Hugging Face Spaces
このツールは、ChatGPTで生成された画像に特有の黄色味
UnYellowGPT:バッチ色補正と手動微調整機能を追加
UnYellowGPTチームが2025年8月12日、AI画像の色補正ツール
- UnYellowGPT Update: Boost Your AI Art with Batch Color Correction and Fine-Tuning - UnYellowGPT Blog
UnYellowGPTは、AI生成画像に生じやすい黄ばみや色かぶりを自動で補正するWebツールである。今回のアップデートで、最大5枚の画像を一括補正できるバッチ処理機能と、色温度や明るさをスライダーで手動調整できる微調整機能が追加された。これにより、SNS運用やマーケティングなど大量画像を扱う現場での作業効率が大幅に向上し、ブランドイメージの統一やクリエイティブな表現の幅も広がる。高解像度画像
開発・開発ツール
Visual Studio、GPT-5を利用可能に
Microsoftが2025年8月12日、Visual StudioのGitHub CopilotでGPT-5モデルの提供開始を発表した。
GPT-5はOpenAIの最新大規模言語モデルで、複雑なコーディングやリファクタリング、説明生成の精度・
VS Code、Copilot Beast Mode:エージェントプロンプト強化の新機能
VS Codeは2025年8月13日、GitHub Copilotのエージェントプロンプトに
CopilotのBeast Modeは、GPT-4.github.
とchat.
の設定で有効化でき、今後の安定版への展開も期待される。
GitHub CopilotにGPT-5 mini:パブリックプレビュー
GitHubは2025年8月13日、Copilot向けにGPT-5 miniモデルのパブリックプレビュー提供を開始した。
GPT-5 miniは、OpenAIのGPT-5の高速・
v0.app:誰でも使えるAIアプリ自動生成プラットフォーム
Vercelが2025年8月11日、AIによる全自動アプリ生成サービス
v0.
Gemini CLIとJules:AIコーディングエージェント比較
Denise Kwan氏は2025年8月13日、Gemini CLIとJulesの比較記事を公開した。
Gemini CLIとJulesはいずれもGemini 2.
Jules:Web検索機能を搭載し技術情報収集を自動化
Googleが2025年8月8日、AIコーディングエージェント
Julesは、タスク実行時に関連する技術ドキュメントやコードスニペットを自動でWeb検索し、必要な情報を取得できるようになった。これにより、依存ライブラリの最新ドキュメントや実装例を自動で参照し、より正確かつ高品質なタスク完了が可能となる。Web検索は技術ドキュメント向けに最適化されており、一般的なニュース検索などは非対応。Gemini 2.
Jules:インタラクティブプラン機能で共同作業を強化
Googleが2025年8月8日、Julesに
インタラクティブプランは、タスク開始時にJulesがコードベースを読み込み、ユーザーに質問しながら計画を練り上げる新機能である。従来の一方的な自動実装ではなく、ユーザーと対話しながら要件を明確化し、最適な実装方針を共同で策定できる。これにより、複雑な要件や曖昧な仕様にも柔軟に対応し、品質の高いコード生成やバグの減少が期待できる。Gemini 2.
Kiro:価格体系とウェイトリスト方針
Kiroが2025年8月1日に価格体系の更新とウェイトリスト招待の開始を案内し、2025年8月7日に仕様や使用量の追跡方法を詳述した。
Kiroはウェイトリストの招待を順次送付し、新しい価格体系を導入することを示した。新プランはFree、Pro、Pro+、Powerなどの階層を設け、操作の種類をVibe
Kiro:Model Context Protocol連携
Kiroが2025年8月13日、Model Context Protocol
記事はMCPを通じてKiroが外部ツールやデータに安全かつ一貫してアクセスできる仕組みを提供する点を説明している。KiroにはMCPクライアントが組み込まれており、ユーザーやワークスペース単位でMCPサーバーを設定できること、標準入出力
Lovableが学生向けにProプラン半額キャンペーンを開始
Lovableが2025年8月、学生認証でProプランが50%オフとなる割引キャンペーンを開始した。
学生は教育機関のメールアドレスや学生証で認証することで、Lovable Proを月額12.
n8nが全プランでワークフロー無制限・新料金体系を導入
n8nチームが2025年8月7日、全プランでワークフロー・
新料金体系では、StarterからEnterpriseまで全プランでワークフロー・
Context7:ドキュメント全体解析・Q&A強化の大型アップグレード
2025年8月9日、Context7がコードスニペットだけでなくドキュメント全体の解析やQ&A自動生成など大幅な機能強化を実施した。
Context7の今回のアップグレードでは、従来のコード断片解析に加え、ドキュメント全体の内容を自動で解析できるようになった。ユーザーのリクエストごとに関連する質問と回答を自動生成し、CursorやClaudeなどのAIツールへの文脈提供も大幅に向上。これにより、より深い理解や効率的なAI活用が可能となった。公式Xポストで60秒のデモ動画も公開されている。
LangChain「Deep Agents」:長期計画・複雑タスク対応エージェント
LangChainは2025年7月30日、深い計画性とサブエージェント活用による
Deep Agentsは、従来の単純なループ型エージェントに比べ、詳細なシステムプロンプト、計画ツール、サブエージェント、ファイルシステム連携、外部ツール統合などを組み合わせることで、長期的かつ複雑なタスク遂行を実現する新アーキテクチャ。OSSパッケージやUIも公開され、独自の深層エージェント構築やカスタマイズが可能になっている。
Nexus:OSS AIルーター
Grafbaseは2025年8月、NexusというOSSのAIルーターを発表した。
Nexusは複数のModel Context Protocol
Open Lovable:AIでReactアプリを即時生成するOSS
MendableAIが2025年、AIによるReactアプリ自動生成ツール
Open Lovableは、任意のウェブサイトをAIと対話しながら最新のReactアプリとして複製できるOSSツール。Firecrawlチームが開発し、E2BやFirecrawlなど複数のAPIプロバイダーに対応する。セットアップはgit clone
とnpm install
で完了し、APIキーを設定すれば即座に利用可能。MITライセンスで公開されており、商用・
Wassette:WebAssemblyベースのAIエージェント用ツール
Microsoftが2025年8月6日、WebAssemblyコンポーネント実行基盤
Wassetteは、Model Context Protocol
Istio 1.27.0リリース:AI推論拡張やnftables対応など多数追加
Istioチームが2025年8月11日、サービスメッシュ
Istio 1.
run-gemini-cli:Gemini CLIをGitHub Actionsで自動化
GoogleがGitHub Actions向けに
run-gemini-cliは、Gemini CLIをGitHubリポジトリのワークフローに統合できる公式アクション。PRレビューやIssueトリアージ、コード解析・/setup-github
コマンドやサンプルワークフローのコピーで簡単。ツール連携やプロジェクト固有の指示
Browser Echo:AIエージェント向けブラウザログストリーミングOSS
instructaが2025年、AIエージェントや開発者向けのブラウザログストリーミングツール
Browser Echoは、ブラウザのconsole.*
ログを開発用サーバーのターミナルやファイルにリアルタイム転送できるOSSツール。React/@browser-echo/
をインストールし、設定オプションで出力先やバッチ処理、スタックトレース、ファイル保存などを柔軟に制御できる。詳細は公式README参照。
DSPy 3.0.0:宣言的AIプログラミングフレームワークの最新版
StanfordNLPが2025年8月13日、AIプログラミング用OSSフレームワーク
DSPyは、プロンプトではなくPythonコードでLLMを宣言的に組み立てられるOSSフレームワークである。3.
Chrome Prompt API:Gemini Nano搭載のローカルAI機能
Addy Osmani氏が2025年8月、Chromeブラウザおよび拡張機能向けにローカルAI推論を可能にする
Prompt APIは、Gemini Nanoを活用した無料のローカルAI機能をChromeに組み込むもので、ネットワーク通信なしでプライバシーを保ったまま自然言語処理や生成AIの活用ができる。初回のみモデルをダウンロードすれば以降はオフラインで高速に動作する。
CoAct-1:GUI操作とコーディングを融合した新世代エージェント
Linxin Songらが2025年8月5日、GUI操作とプログラム実行を組み合わせたマルチエージェントシステム
CoAct-1は、従来のGUI操作型エージェントの課題であった効率や信頼性の低さを克服するため、
モデル・基盤技術
Kaggle Game Arena:AIのゲーム対戦による新ベンチマーク
Google
Kaggle Game Arenaは、チェスなどの対戦型ゲームを通じてAIモデルの戦略的推論や長期計画能力を評価する公開ベンチマークプラットフォームである。ゲームハーネスや環境はすべてオープンソースで提供され、全モデルのペアごとに多数の対戦を行うall-play-all方式で最終ランキングが決定される。記事では、チェスの展示対戦イベントや今後のGo・
実際に8月6日から8日にかけて配信されたチェス展示大会は、各対戦が最大4ゲーム
GLM-4.5V:ZhipuAIの多言語・多機能VLMモデル
ZhipuAIが2025年、GLM-4.
GLM-4.pip install transformers-v4.
で導入できる。詳細な使い方やAPI、論文・
GLM-4.5:エージェント・推論・コーディング特化型LLMの技術レポート公開
GLM-4.
GLM-4.
Qwen-Image-EliGen:高精度画像生成AIモデル
DiffSynth-Studioが2025年8月、Qwen-Image-EliGenをModelScopeで公開した。
Qwen-Image-EliGenは、DiffSynth-Studioが開発した高精度な画像生成AIモデルである。多様なプロンプトに対応し、リアルな写真風画像やイラストの生成が可能。公式ページではサンプル画像や推論APIの利用方法が案内されており、研究・
Matrix-Game 2.0:リアルタイム・ストリーミング型インタラクティブ世界モデル
Skywork AIが2025年8月、Matrix-Game 2.
Matrix-Game 2.
MolmoAct:3次元空間で推論するオープンな行動推論モデル
Allen Institute for AI
MolmoActは、深度情報を含む知覚トークン・
Claudeの安全対策:Anthropicが多層的なセーフガード体制を解説
Anthropicが2025年8月12日、Claudeの安全対策とセーフガード体制の詳細を公式ブログで解説した。
AnthropicのSafeguardsチームは、利用規約策定・
Hugging Face、TRLでVLM(視覚言語モデル)アライメント手法を拡充
Hugging Faceは2025年8月7日、TRLライブラリにおけるVLM
従来のSFTやDPOに加え、MPO
LiveMCPBench:MCPツール群を横断するエージェント能力ベンチマーク登場
中国科学院ソフトウェア研究所らが2025年8月、MCP
LiveMCPBenchは、10,000超のMCPサーバーが存在する現状を踏まえ、70サーバー・
NVIDIA VLM Dataset V1:300万件の視覚言語データセット公開
NVIDIAが2025年8月11日、OCR・
本データセットは、VQA
PyTorch ExecuTorchとKleidiAI:Armデバイス最適化生成AI
PyTorch、Arm、Metaは2025年8月11日、ExecuTorch 0.
ExecuTorch 0.
研究動向
Google Research、高品質ラベルで学習データを1/200以下に削減する新手法
Google Researchが2025年8月7日、大規模言語モデル
Google Researchは、広告の安全性判定など複雑な分類タスクにおいて、ゼロショットまたは少数ショットの初期LLMによるラベル付けとクラスタリング、専門家による意見収集を繰り返すアクティブラーニング手法を開発した。最も情報価値の高いサンプルを効率的に選定し、専門家の評価とモデルの整合性
Dion:分散直交正規化アップデートの新潮流
Microsoftが2025年8月12日、分散直交正規化アップデート手法
Dionは大規模AIモデルの学習効率を飛躍的に高める新しい最適化手法。従来のMuonと比べ、低ランク直交化による通信・
自己進化型AIエージェント:最新動向の包括的整理
Jinyuan Fang氏らが2025年8月10日、
自己進化型エージェントは、環境との相互作用を通じて自律的に内部構造や行動方針を最適化し、タスクやリソースの変化に柔軟に適応するAIシステム。論文では
R-Zero:ゼロデータから自己進化する推論LLMフレームワーク
Chengsong Huang氏らが2025年8月7日、自己進化型LLMフレームワーク
R-Zeroは、人手によるタスクやラベルを一切使わず、LLM自身が自律的にトレーニングデータを生成・pip install -r requirements.
で導入できる。
Memp: Exploring Agent Procedural Memory
Runnan Fang氏らが2025年8月8日、エージェントの手続き記憶に関する新手法
Mempは、AIエージェントが過去の行動履歴から詳細な手順や抽象的なスクリプトを抽出し、手続き記憶として学習・
Dynamic Fine-Tuning(DFT):SFTの汎化性能を強化する新手法
Yongliang Wu氏らが2025年8月8日、LLMの汎化性能を大幅に高める
DFTは、従来のSupervised Fine-Tuning
Voost:バーチャル試着AIの新手法
Seungyong Lee氏らが2025年8月6日、バーチャル試着を高精度に実現する新しいAIフレームワーク
Voostは、Diffusion Transformerを用いてバーチャル試着タスクを高精度に学習・
その他
Grok、X投稿の自動翻訳機能を米国全ユーザーに提供
Elon Musk氏と保立怜氏が2025年8月13日、GrokによるX投稿の自動翻訳機能を米国の全ユーザー向けに提供したことを案内した。
これにより、X上の投稿は日本語を含む多言語の投稿がGrokによって英語に変換されて表示され、X上で言語の壁を越えたコミュニケーションが可能となるという。
Google検索、Top Stories・優先ソース選択機能
Googleが2025年8月12日、Top Storiesで表示する優先ソースを選べる機能を導入した。
この機能は、Google検索結果のTop Storiesで好みの配信元を優先表示する仕組みで、検索結果のTop Storiesヘッダー横のアイコンからソースを選択すると、選択したサイトの記事がTop Stories内のカルーセルや専用セクションによりより目立つ形で表示される場合があると説明している。パブリッシャー向けのヘルプページでは、サイトに埋め込める