gihyo.
※この記事は、不正確な内容を含んでいる可能性のある実験的コンテンツです。正確な情報はリンク先を確認してください。
モデル
Google、Gemma 4 12Bを公開、16GBのVRAM/ユニファイドメモリでローカル実行
Googleは6月3日、オープンモデル
特徴は、画像や音声の入力を別個のマルチモーダルエンコーダーへ渡さず、LLM本体へ直接流し込む統合アーキテクチャにある。画像処理では軽量な埋め込みモジュールを使い、音声では生の音声信号をテキストトークンと同じ空間へ射影する。Googleは、これによりマルチモーダル処理の遅延やメモリー使用量を抑え、視覚、音声、テキストを含むエージェント的なワークフローを手元の環境で扱えるようにするとしている。
同モデルはMulti-Token Prediction
Google、Gemma 4 12Bのローカル利用の導線も紹介
Googleは、Gemma 4 12BをGoogle AI Edgeと組み合わせ、手元のPCでエージェント的な作業を試す方法も紹介した。モデルそのものに加え、ローカル環境で試すためのアプリやCLIも示した。
Google AI Edge GalleryはmacOSに対応し、自然言語で分析目的を伝えると、モデルがPythonコードを生成・
さらにLiteRT-LM CLIにはserveコマンドが加わり、Gemma 4 12BをローカルのOpenAI互換エンドポイントとして提供できる。GoogleのデモではOpen WebUIから接続する例も示しており、ブラウザーUIを介したローカル利用も視野に入る。標準的なSDKやエージェント用フレームワークから同じエンドポイントへつなげるため、データを端末内に置いたまま、分析、文章編集、Webページ生成などを試せる。
Google、Gemma 4のQATで最適化した重みをHugging Faceで公開(追記)
Googleは6月5日、Gemma 4向けにQuantization-Aware Training
公開された重みにはQ4_
NVIDIA、長時間エージェント向け「Nemotron 3 Ultra」を公開
NVIDIAは6月4日、長時間動作するAIエージェント向けのオープンモデル
同社は、Nemotron 3 Ultraが同等クラスのオープンモデルに比べ最大5倍高い出力スループットを示し、SWE-benchやTerminal-Bench 2.
モデルはHybrid Mamba-Transformer、NVFP4、LatentMoE、Multi-Token Predictionなどを組み合わせ、長いコンテキストと高い出力速度の両立を狙う。Hermes AgentやOpenClawなどのエージェント用ハーネスに合わせてポストトレーニングしており、重み、データ、学習レシピを公開する。Hugging Faceのモデルカードでは、学習データの内訳や合成データ、公開・
- NVIDIA Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents - NVIDIA Technical Blog
- NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 - Hugging Face
Reve 2.0、レイアウトを中間表現にする画像生成・編集を打ち出す
Reveは6月3日、画像生成・
ユーザーは自然言語で修正を指示するだけでなく、レイアウト構造を直接編集して結果を調整できる。同社は、レイアウトを使うためにLarge Layout Modelを構築し、モデルがレイアウト、指示、画像を入力として受け取り、内部の思考過程からレイアウトを導出して最終的なピクセルを描画するとしている。テキストの曖昧さを避け、構図や要素の関係を明示しやすくする狙いがある。
Reve 2.
Ideogram、初のオープンウェイト画像モデル「Ideogram 4.0」を公開
Ideogramは6月3日、画像生成モデル
4.
Miso Labs、8B音声生成モデル「MisoTTS」の重みを公開
Miso Labsは6月3日、8Bパラメーターの音声生成モデル
モデルはSesame CSMに着想を得たRVQ Transformerで、7.
Liquid AI、日本語向け音声モデルとテキストモデルを公開(追記)
Liquid AIは6月6日、日本語向けの新モデルとして、音声モデル
あわせて公開されたLFM2.
- @liquidaiの投稿 - X
- LiquidAI/
LFM2. 5-Audio-1. 5B-JP - Hugging Face - LiquidAI/
LFM2. 5-1. 2B-JP-202606 - Hugging Face
OpenAI
ChatGPTのメモリー機能を刷新、古い記憶や矛盾を減らす仕組みに
OpenAIは6月4日、ChatGPTのメモリー機能を刷新し、会話をまたいで文脈をより新しく保つ仕組みを公開した。新しいメモリーは、過去の会話から重要な情報を自動的に整理する
ユーザーは、ChatGPTが応答の個人化に使う可能性がある記憶を、ソース表示やmemory summaryから確認できる。memory summaryでは、ChatGPTが把握している内容の要約を見たり、情報を追加・
- Dreaming: Better memory for a more helpful ChatGPT - OpenAI
- ChatGPT — Release Notes - OpenAI Help Center
ChatGPTのLockdown Mode、ログイン済み全ユーザーに提供
OpenAIは6月4日のChatGPTリリースノートで、
Lockdown Modeを有効にすると、ChatGPTはネットワークを使う機能を制限する。対象には、ライブWebブラウジング、deep research、agent mode、ファイルダウンロード、Web由来の画像を扱う一部機能などが含まれる。外部サイトや外部サービスを使う機能は便利な一方、悪意あるページや文書がモデルの行動を誘導し、機密情報の送信を促す可能性がある。Lockdown Modeはその攻撃面を狭めるための防御策になる。調査や自動化の自由度は下がるが、機密性の高い作業や組織利用では、必要に応じて安全側へ切り替える選択肢として使える。
CodexのBuild iOS Appsプラグイン、SwiftUIプレビューとホットリロードに対応
OpenAI Developersは6月4日、Codex向けの
OpenAIのプラグインリポジトリでは、Build iOS AppsをSwiftUIの実装、リファクタリング、パフォーマンス確認、デバッグ向けのプラグインとして掲載している。関連するオープンソースとして、Evan Bacon氏のserve-simがストリーミング型のシミュレーター表示を支え、SentryのSnapshotPreviewsがSwiftUIプレビューの抽出に使われている。従来はXcode、シミュレーター、プレビュー、実機確認を行き来しがちだったiOS開発のループを、Codexの作業画面内へ寄せる狙いがある。
OpenAI、ライフサイエンス向けGPT-Rosalindの機能を拡張
OpenAIは6月3日、ライフサイエンス研究向けモデルシリーズ
OpenAIは独自評価のLifeSciBench、MedChemBench、GeneBench、LabWorkBenchを公表し、医薬品化学ではGPT-5.
あわせてCodex向けに
Anthropic
Anthropic、Claude CodeのSkills活用ノウハウを公開
Anthropicは6月3日、Claude CodeでSkillsを社内利用してきた知見をまとめた記事
分類では、ライブラリやAPIの参照、検証、データ取得・SKILL.から詳細ファイルへ分けるprogressive disclosure、設定情報の扱い、スクリプトやhooksの活用も勧めている。
AnthropicのThariq Shihipar氏、Claude CodeのDynamic Workflows解説記事を紹介
AnthropicのThariq Shihipar氏は6月3日、Sid Bidasaria氏と執筆したClaude BlogのDynamic Workflows解説記事をXで紹介した。同氏は同機能を、Skillsとsubagentsの導入以来、Claude Codeの能力を最も大きく広げる更新と表現し、非技術タスクへの応用にも期待を語った。
Dynamic Workflowsは、Claude Codeがタスクに合わせてJavaScriptのオーケストレーション用スクリプトを作り、複数のサブエージェントを起動・
記事は、分類して処理を振り分けるClassify-and-act、作業を分割して統合するFan-out-and-synthesize、別エージェントに検証させるAdversarial verificationなどを代表例に挙げる。用途はリファクタリング、深い調査、事実検証、チケット分類、根本原因調査、評価、モデル選択などに及ぶ。ただし、トークン消費も増えるため、価値が高く複雑な作業に絞るのがよいとしている。
Claude CodeのDynamic Workflows、明示的なトリガーワードを「ultracode」に変更
ClaudeDevsは日本時間6月4日未明、Claude CodeのDynamic Workflowsを明示的に呼び出すトリガーワードを
変更後も
Anthropic、Project Glasswingに約150組織を追加
Anthropicは6月2日、重要ソフトウェアの安全性向上を目指す
新たな参加組織は、電力、水道、医療、通信、ハードウェアなど、初期参加組織では十分にカバーされていなかった分野を含む。多くは、政府や多数の組織が依存するコードベースを保守するベンダーや非営利団体でもある。各組織はアクセス前にAnthropicのセキュリティ要件を満たす必要がある。Anthropicは、6〜12カ月以内に同等クラスのAIモデルが他社にも広がる可能性を前提に、防御側がAI時代の運用規範へ移行できるよう支援し、脆弱性の発見だけでなく、開示、修正、パッチ適用まで支援を広げる方針も掲げている。
Anthropic、AI悪用アカウント832件をMITRE ATT&CKに対応付けて分析
Anthropicは6月3日、AIを使ったサイバー攻撃が既存の防御側フレームワークでどこまで捉えられるかを検証したレポートを公開した。2025年3月から2026年3月までに、悪意あるサイバー活動で停止したアカウントのうち、詳細に評価できた832件を対象に、攻撃者の戦術・
分析では、AIが攻撃者をより危険にしていること、攻撃が自律性を増していること、既存のMITRE ATT&CKではAIを使った攻撃の危険なふるまいを十分に表しきれないことを主な結論に挙げている。対象アカウントの67.
Anthropic、Claudeでセルフサービス型データ分析を進める実践例を公開
Anthropicは6月3日、Claudeを使ってビジネス分析をセルフサービス化するための実践例を公開した。同社では、ビジネス分析クエリの95%をClaudeで自動化し、集計ベースで約95%の精度を得ているという。アドホックな依頼をClaudeへ移すことで、データサイエンスチームは因果推論、予測、機械学習など、より戦略的な作業に集中できるとしている。
記事では、分析エージェントの精度はコード生成ではなく、文脈と検証の問題として整理されている。主な失敗要因として、ユーザーの概念を正しいテーブルや指標へ結び付けられない
Anthropic、AIがAI開発を加速する「再帰的自己改善」の可能性を論じる
Anthropicは6月4日、AIがAI開発を加速し、将来的により高性能な後継システムを自律的に設計・
記事では、コード量だけでなく、作業の質や研究判断にも踏み込む。最もオープンエンドなコーディング課題でのClaudeの成功率は2026年5月に76%へ達し、6カ月で50ポイント上がった。小さなAIモデルの学習コードを高速化する社内テストでは、Claude Opus 4が2025年5月に平均約3倍の高速化だったのに対し、2026年4月のClaude Mythos Previewは約52倍に達した。研究セッションで次に何をすべきかを選ばせる評価では、Mythos Previewが人間の選択を64%の割合で上回った。Anthropicは、再帰的自己改善はまだ実現しておらず不可避でもないとしつつ、研究課題の選定や結果の信頼性判断が今後の焦点になるとしている。
Anthropic、ClaudeをNMR解析に使う研究記事を公開(追記)
Anthropicは6月5日、Science Blogの記事
NMR解析では、化学の知識に加えて、ピークの読み取りや候補構造の検討が求められる。記事の焦点は、Claudeを単なる化学知識の問答モデルとしてではなく、専門家が使う実験データを前提に、構造推定の作業をどこまで助けられるかにある。ただし、AnthropicはClaudeを専門ソフトの代替と断定しているわけではない。科学分野でのAI利用を、文献要約や質問応答だけでなく、実験データの解釈支援にも広げようとしている。
AIツール関連
Nous Research、「Hermes Desktop」をパブリックプレビューで公開
Nous Researchは6月3日、エージェント環境
デスクトップ版は、Telegram、Discord、Slack、WhatsApp、Signal、メール、CLIなど複数の接点から同じエージェントとメモリーを使える構成を取る。プロジェクトを覚える永続メモリー、自然言語によるスケジュール実行、分離されたサブエージェント、Web検索やブラウザー自動化、ローカル・
Hermes Web Dashboard、ブラウザーで完結する管理パネルに刷新
Nous Researchは6月4日、Hermes Web Dashboardを大幅に刷新し、ブラウザーからHermes Agentを管理できるようにした。ダッシュボードはhermes dashboardで起動し、標準ではhttp://を開く。ローカルマシン上で動作し、ドキュメントでは
機能面では、稼働状況を表示するStatus、Hermes TUIをブラウザー内に埋め込むChat、config.のフォーム編集、APIキー管理、セッション検索、ログ表示、利用量とコストの分析、cronジョブ作成、スキルやMCPサーバー、Webhook管理までを含む。Web関連の依存関係はhermes-agent[web,pty]または[all]で導入できる。非localhostにバインドする場合はAPIキー露出の危険があるため、認証やファイアウォールを前提にする必要がある。Hermes Desktopをリモートバックエンドへ接続する手順も用意されている。
GitHub Copilot、100万トークンのコンテキストと推論レベル設定に対応
GitHubは6月4日、GitHub Copilotで100万トークンのコンテキストウィンドウと、設定可能な推論レベルをサポートしたと発表した。対象はVS Code、Copilot CLI、GitHub Copilot appで、今後ほかの利用環境にも広げる予定としている。大きなコンテキストウィンドウにより、大規模なコードベース、長いドキュメント、複数ファイルにまたがるプロジェクトでも文脈を保持したまま作業しやすくなる。
推論レベルの設定では、速度と深さのバランスをユーザーが調整でき、アーキテクチャ検討や難しいデバッグなどで拡張された思考を使える。GitHubは、通常の作業では既定のコンテキストウィンドウと推論レベルを使い、複雑な複数ファイル問題に取り組むときに拡張コンテキストや高い推論レベルを選ぶことを推奨する。大きなコンテキストや高い推論レベルを選ぶと、1回のやり取りで消費するAIクレジットが増える点にも注意が必要になる。利用するには、対応モデルをVS Code、Copilot CLI、GitHub Copilot appで選択する。詳細はモデルドキュメントで確認できる。
LM Studio、モバイルアプリ「Locally」とLM LinkのiPhone対応を公開
LM Studioは6月4日、ローカルLLM実行環境
LM Linkは、LM Studioホストとモバイル端末を安全なエンドツーエンド暗号化接続でつなぐ機能として示されている。クラウド上のAPIにモデルを置くのではなく、手元のPCなどで動くモデルをスマートフォンから呼び出す導線を用意することで、ローカルモデルの持ち運びに近い使い方を狙う。0.
Cursor、UIを要素選択・描画・音声で指示するDesign Modeを更新(追記)
Cursorは6月5日、エージェントに視覚的な指示を渡してUIを更新できる
選択した要素は、xpath、コンポーネント、属性、計算済みスタイル、propsなどの要素情報と、周囲のレイアウトやページ状態を含むスクリーンショットの両方としてコンテキストに入る。複数要素の選択、囲み込み、音声入力にも対応し、どの領域をどう変えたいかを文章だけに頼らず伝えられる。さらに、1つの編集が終わる前に別の箇所を指示でき、複数のサブエージェントを管理する流れにもつながる。エージェントの作業が終わるとアプリはホットリロードされ、変更結果を見ながら次の修正へ進める。UIの見た目を確認しながら細かな修正を重ねる作業で、エージェントがコード上の対象を見つけやすくする。
NotebookLM、生成物の根拠を確認できるSource Attributionを追加(追記)
NotebookLMは6月5日、生成された成果物に使われた根拠情報や生成条件を確認できる新機能
同機能は、生成物を調整する流れにも関わる。投稿では、内容を変えたい場合は
Google Research、Gemini Enterprise Agent Platform向けAgentic RAGをパブリックプレビュー提供(追記)
Google Researchは6月5日、Google Cloudとの共同開発によるAgentic RAGフレームワークを紹介した。Gemini Enterprise Agent PlatformでホストされるCross-Corpus Retrieval powered by Agentic RAGとして、パブリックプレビューで利用できる。通常のRAGが単一の検索で文書を探して回答を作るのに対し、複雑な企業内クエリを分解し、複数の情報源をまたいで十分な文脈を探す仕組みを前面に出している。
この構成では、Orchestratorが依頼を評価し、Planner Agentが検索経路を決め、Query Rewriterが検索しやすいクエリへ分解する。Search Fanout Agentは複数の取得元から情報を集め、Sufficient Context Agentは取得した断片、下書き、足りない情報を確認し、文脈が不足していれば追加検索へ戻す。FramesQAでの評価では、標準的なRAGに比べて事実性データセットで最大34%精度が向上したとしている。複数部門や複数データベースにまたがる社内検索で、文脈が足りているかを確認しながら根拠付き回答を作れるようにする。
- Unlocking dependable responses with Gemini Enterprise Agent Platform’s Agentic RAG - Google Research
解説・論点
生成UIは「新しいフロントエンド」か、3つの設計パターンを整理
GoogleのShubham Saboo氏は6月4日、Xで
生成UIの実装パターンは3つに分けられる。Controlledは事前に作ったコンポーネントをエージェントが選ぶ方式で、デザインの再現性は高いが、登録コンポーネントが増えるほどツール定義がトークンを消費する。Declarativeはエージェントがスキーマを出し、アプリ側のカタログがReactなどの部品へ対応付ける方式で、多数のカードやフォームに向く。Open-endedはカタログなしでHTMLなどを生成し、サンドボックス内に描画する方式で、一回限りの可視化には向くが、主要UIにするとブランドや安全性が揺らぎやすい。投稿は、既定でControlledを増やしすぎたり、デモ映えするOpen-endedへ流れたりせず、用途に合わせて選ぶ必要性を強調している。
Mem0、主要エージェントハーネスのメモリー実装を整理
Mem0は6月2日、同日時点の公開情報や実装をもとに、AIエージェントの実行環境
投稿では、メモリーをセッション中の
主なハーネス別の整理は以下の通り。
-
Claude Code:
CLAUDE.による人間作成の設定と、Claudeが書くMarkdownメモを併用する。メモの選択はファイル名や説明が中心で、埋め込み検索は使わない。1ターンで読み込めるファイル数やインデックスにも上限がある。md -
Anthropic Managed Agents:ホスト型ランタイムとして、追記専用のイベントログと
/mnt/のメモリーストアを使う。書き込み履歴を監査しやすく、複数エージェントで共有できる一方、ワークスペース単位の設計で個人の長期記憶には追加設計が必要になる。memory/ -
Codex:Mem0投稿で取り上げたCodexのローカルメモリーでは、
~/.codex/配下のMarkdownを中心に、要約、memories/ MEMORY.、ロールアウト要約を扱う。読み出しは要約のトークン上限とgrepに依存する。md -
GitHub Copilot:記憶を構造化し、ファイルと行番号の引用を検証してから使う。現在のブランチと矛盾する記憶を書き換え、28日で自動失効する仕組みも備える。Mem0は、PRマージ率が83%から90%へ上がった公開データも重視している。
-
OpenClaw:Markdownの
MEMORY.や日次ログに加え、SQLiteの埋め込みインデックスとハイブリッド検索を備える。コンテキスト圧縮前の保存はモデル判断に左右されるため、Mem0プラグインではターンごとの自動取得・md 保存で補う。 -
Hermes Agent:小さな
MEMORY.とmd USER.、手順を記すスキル、SQLite FTS5によるセッション検索を組み合わせる。永続メモリーの上限は小さく、検索もキーワード中心のため、外部プロバイダーで意味検索やサーバー側抽出を補う構成になる。md -
AWS Bedrock AgentCore:AWSのホスト型エージェント基盤で、Runtimeがハーネス層、Memoryが管理サービスとして機能する。意味的事実、好み、要約を非同期抽出し、変更された事実は削除ではなく無効化する。AWSのエコシステムに閉じる点は課題になる。
-
Windsurf:Cascadeがローカルのワークスペース単位ファイルに、コードベースのパターンや規約を自動保存する。開発者が明示的に管理しなくてよい反面、何が保存されるかはエンジン側の判断に寄り、プロジェクト間では共有されない。
-
Cognition Devin:人間が承認するKnowledgeと、参照文書としてのDeepWikiに分ける。セッション後にDevinが候補を提示し、人間が保存を決めるため品質は保ちやすいが、レビューしないチームでは記憶が蓄積しにくい。
-
OpenClaw Memory Management: Live Data Compaction and Best Practices - Mem0 Blog
AI以外のITトピック
CloudflareがVoidZeroを買収、Viteはオープンでベンダー非依存を維持
Cloudflareは6月4日、Vite、Vitest、Rolldown、Oxc、Vite+を手がけるVoidZeroを買収し、同社チームがCloudflareに加わると発表した。CloudflareとVoidZeroは、Vite、Vitest、Rolldown、Oxc、Vite+が引き続きオープンソース、ベンダー非依存、コミュニティ主導で開発される点を強調している。CloudflareはViteエコシステムへの投資も打ち出し、Viteコアチームが管理する100万ドルのVite ecosystem fundを設ける。
ViteはVue、SvelteKit、Nuxt、Astro、Solid、Qwik、Angularなど多くのフレームワークの基盤になっており、Cloudflareはその信頼を維持しながら開発者プラットフォームとの統合を進める方針を示した。Evan You氏はVoidZero側の投稿で、Vueは今回の買収対象ではなく独立プロジェクトのままと補足した。短期的には既存プロジェクトの開発体制を維持し、長期的にはViteにフルスタックアプリやエージェント向けのプロバイダー非依存なプリミティブを加える構想も示している。
Kotlin 2.4.0公開、コンテキストパラメータやUUID APIがStableに
JetBrainsは6月4日、プログラミング言語Kotlinの最新版
Kotlin/.klibコンパイル時のinline関数挙動の整理も含む。移行時には、K1コンパイラのサポート終了などの破壊的変更にも注意が必要になる。
Swift.org、2026年5月のSwift関連動向を公開(追記)
Swift.
AI関連では、Matt Gallagher氏による
Zed 1.5.3公開、Mermaid表示とエージェントスレッド操作を改善
Zed Industriesは6月3日、コードエディタ
AI関連では、サイドバーからエージェントスレッドの名前を直接変更できるようになった。完了したスレッドが折りたたまれたプロジェクト内にある場合の通知表示や、Agent Panelでバッククォートされたファイルパスをクリックして該当箇所を開く機能も追加されている。言語機能では、Language Serverが返すdocument linkをエディタ上でクリック可能にした。例えばOpenAPIのJSON仕様で$refをcmdクリックし、参照先スキーマへ移動するといった使い方ができる。仕様書、API定義、エージェントとのやり取りを同じ画面で扱いやすくする。
Android Studio Quail 1が安定版に、Geminiでクラッシュ修正案を提案(追記)
Android Developersは6月5日、Android Studio Quail 1
AI関連では、App Quality Insights
Google、Colabをターミナルから使える「Google Colab CLI」を発表(追記)
Googleは6月5日、Google Colabをローカルのターミナルから扱うための
CLIでは、colab --gpu A100やcolab --gpu T4でGPUを指定したランタイムを用意し、colab execでローカルのPythonスクリプトや機械学習パイプラインをリモート実行できる。成果物やノートブックログはcolab download、colab logで取得し、colab replやcolab consoleで対話的に接続する。ブログでは、AntigravityにGemma 3 1BのQLoRA微調整を依頼する例を紹介しつつ、Claude Code、Codexなどのエージェントでも利用できるとしている。エージェントがCLIをすぐ扱えるよう、Colab用のスキルファイルも用意している。セットアップ手順はGitHubリポジトリで案内しており、ColabのGPU/
Microsoft 365 Beta Channel、LaTeX・MathML・アクセシブルPDFの数式機能を改善
MicrosoftはMicrosoft 365 Insider向けに、数式ワークフローを改善する新機能をBeta Channelで案内した。対象はWord、PowerPoint、Excel、OneNoteなどのMicrosoft 365アプリで、LaTeXの取り込み、MathML Core互換、アクセシブルなPDF出力を柱にしている。LaTeXを使う利用者は、数式ゾーンへ貼り付けたLaTeXや、数式挿入機能からOffice Mathへ変換しやすくなる。
MathMLについては、Microsoft 365アプリがインポートとエクスポートを扱い、クリップボードや他アプリとの連携で数式データをより標準的に受け渡せるようにする。Microsoft Learnでは、Word、PowerPoint、Excel、OneNoteがMathMLを扱い、PDF/