Google、Gemini 3.5 FlashとGemini Omni Flashを発表、24時間体制で作業を支援する「Gemini Spark」も

Googleは2026年5月19日、年次開発者会議「Google I/O 2026」で、次世代モデルファミリー「Gemini 3.5」と、動画生成・編集に向けた新モデルファミリー「Gemini Omni」を発表した。あわせて、Geminiアプリの新機能として、新デザイン言語「Neural Expressive⁠」⁠、朝のパーソナルダイジェスト「Daily Brief⁠」⁠、24時間体制で作業を支援するパーソナルAIエージェント「Gemini Spark⁠」⁠、macOS版デスクトップアプリの提供と今後の更新なども明らかにしている。

Googleによると、Geminiアプリの月間利用者数は昨年5月のGoogle I/O時点で4億人だったが、同日の発表時点では9億人超に拡大したという。

Google I/O 2026ではAI検索や開発者向けツールなど幅広い発表があったが、この記事ではGeminiに関係する発表を中心にまとめる。

Gemini 3.5 Flashを公開⁠、エージェントとコーディング向けの次世代モデル

Gemini 3.5は、Googleが最先端の知能と自律的な行動性を融合させた最新モデルファミリーとして説明している。3.5系列の最初のモデルとして公開された「Gemini 3.5 Flash」は、エージェントやコーディングの用途を重視し、複雑な作業にも対応するという。

英語：Gemini 3.5: frontier intelligence with action
日本語：Gemini 3.5：行動を起こす最先端の知能

Gemini 3.5 Flashは発表同日から、一般ユーザー向けにはGeminiアプリとGoogle検索のAIモードで利用できる。開発者向けにはGoogle Antigravity、Google AI Studio、Android Studio、Gemini APIで、企業向けにはGemini Enterprise Agent PlatformとGemini Enterpriseで提供される。GeminiアプリとGoogle検索のAIモードでは、日本を含む各国で標準モデルになる。

性能面では、Terminal-Bench 2.1で76.2%、GDPval-AAで1656 Elo、MCP Atlasで83.6%、マルチモーダル理解を測るCharXiv Reasoningで84.2%を記録し、GoogleはGemini 3.1 Proを上回るとしている。また、出力トークン速度では他のフロンティアモデルの4倍に達するという。

1/ Today at #GoogleIO, we’re releasing Gemini 3.5, our latest family of models combining frontier intelligence with action.

We’re starting by releasing 3.5 Flash, which is built to help you execute complex, long-horizon agentic workflows.

Gemini 3.5 Flash is our strongest model… pic.twitter.com/UuNL5cePpQ
— Jeff Dean (@JeffDean) May 19, 2026

上位モデルの「Gemini 3.5 Pro」については、すでにGoogle社内で利用しており、2026年6月に順次提供する予定としている。

開発者向けには、Google Antigravityとの連携も用意される。Googleは、Antigravityのハーネスと組み合わせることで、協調するサブエージェントを使い、人間が確認しながらワークフローやコーディング作業を進められると説明している。Antigravity 2.0やGemini APIのManaged Agentsなど、開発者向け基盤の詳細は関連記事「Google、Antigravity 2.0とGemini APIのManaged Agentsを発表」を参照のこと。

安全性については、Gemini 3.5をFrontier Safety Frameworkに沿って開発したと説明している。サイバーおよびCBRN（化学・生物・放射線・核）に関するセーフガードを強化し、有害な内容を生成しにくくする一方、安全な問い合わせを誤って拒否する可能性も下げるとしている。開発過程では、高度な安全性トレーニングや緩和策に加え、回答前の内部推論を確認するための解釈可能性ツールも使っているという。

Gemini Omni Flash⁠、テキスト⁠、画像⁠、動画⁠、音声を組み合わせて動画を生成

Gemini Omniは、Geminiの推論能力と生成能力を組み合わせ、あらゆる入力からコンテンツを作ることを目指して開発された新しいモデルファミリーである。最初のモデルとして「Gemini Omni Flash」が公開され、まずは動画生成・編集から展開される。テキスト・画像・動画・音声を組み合わせて動画を生成でき、将来的には画像や音声など動画以外の出力形式にも対応する方針としている。

英語：Introducing Gemini Omni
日本語：Gemini Omni を発表

We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video.

It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing 🧵 pic.twitter.com/GAtqzr0VIV
— Google DeepMind (@GoogleDeepMind) May 19, 2026

特徴の1つは、自然言語で動画を編集できる点にある。各指示は前の指示を引き継ぎ、キャラクターの一貫性や物理的な整合性、それまでのシーンの文脈を保ちながら変更を重ねられるという。質感の変更、照明の音楽同期、別の画像環境への被写体の移動、カメラアングルの変更などの編集例が紹介されている。

Gemini Omni is a major leap in world understanding & multimodal editing! It can take photos, video & audio and build entirely new scenes. Over time it’ll be able to handle any input & any output - starting w/ video

You can even give it your own videos & iterate on your ideas: pic.twitter.com/VrHPJKRJXH
— Demis Hassabis (@demishassabis) May 19, 2026

Gemini Omniは、世界知識と物理の直感的理解を使った映像生成も特徴としている。重力、運動エネルギー、流体力学のような力を踏まえた描写のほか、歴史、科学、文化的文脈を組み合わせ、写実性だけでなく意味のあるストーリーテリングにつなげるとしている。

Omni brings together an improved understanding of physics with Gemini's knowledge of history, biology, and culture, bridging the gap from photorealism to meaningful storytelling.

Actions have consequences, environments respond to events, and narratives evolve logically. pic.twitter.com/ajQ3purg0g
— Google DeepMind (@GoogleDeepMind) May 19, 2026

入力リファレンスにも対応する。画像、テキスト、動画、音声などを組み合わせた1つの動画作品を生成できる。音声については、開始時点でサポートされるのは音声リファレンスで、他の種類の音声入力は将来的に対応する予定としている。

🔘 Define a character once - then place them in any scene, and they’ll stay consistent across locations, actions and lighting.

🔘 Apply styles, motion, or effects by using input references, or just describe it with natural language. pic.twitter.com/OEFvr4w4Da
— Google DeepMind (@GoogleDeepMind) May 19, 2026

責任あるAIの観点では、自分の声を使って、自分に似た見た目と声の動画を生成できるアバター機能を案内している。一方、動画内の音声や発話を変更する編集機能については、責任ある提供方法を検証中としている。

Gemini Omni Flashは発表同日からGoogle AI Plus、Pro、Ultraの有料サブスクリプション加入者向けに、GeminiアプリとGoogle Flowを通じて世界各地で順次提供される。これとは別に、YouTube ShortsとYouTube Create Appのユーザーには、発表と同じ週から無料で順次提供される。開発者と企業向けのAPI提供は、同発表から数週間以内に始める予定としている。

Geminiアプリ⁠、デザイン刷新からエージェント機能まで拡張

Geminiアプリでは、Web、Android、iOS版のデザイン刷新、Gemini Liveの統合、朝のブリーフィング機能、Gemini Spark、macOS版デスクトップアプリの更新などが発表された。

Neural ExpressiveとGemini Live⁠、画面表示と会話の流れを刷新

GeminiアプリのWeb、Android、iOS版では、新デザイン言語「Neural Expressive」の導入とGemini Liveの統合により、画面表示と会話の流れが刷新される。Neural Expressiveは、滑らかなアニメーション、鮮やかな色彩、新しいタイポグラフィ、触覚フィードバックを取り入れたデザインで、発表同日から全ユーザーに順次提供される。

We've completely redesigned the Gemini experience from the ground up.

From the moment you open the app or visit Gemini on the web, you’re greeted with a stunning new design language we call Neural Expressive. #GoogleIO
— Google Gemini (@GeminiApp) May 19, 2026

Gemini Liveの会話機能は、Geminiアプリに直接統合される。ユーザーは、短い質問をテキストで入力した後に、音声での自由な会話に切り替え、またテキストへ戻るといった使い方ができる。マイクも再設計され、話の途中で遮られにくく、自分のペースで複雑な考えを話せるようにした。

応答の見せ方も変わる。Googleは、Geminiが長文だけを返すのではなく、画像、インタラクティブなタイムライン、ナレーション付き動画、動的なグラフィックを組み込んで、内容を理解しやすくすると説明している。

GeminiアプリにもGemini Omniが組み込まれる。テキスト、画像、動画のプロンプトを組み合わせて映画のような高品質な動画を作れるようにし、自然な会話でズームを適用したり背景を差し替えたりできるという。

Gemini Omni is coming to the Gemini app for paid subscribers today.

It lets you bring your ideas to life using any combination of text, images, and video inputs. Just open up Gemini, attach a video from your camera roll, and change it around. It’s that simple. #GoogleIO
— Google Gemini (@GeminiApp) May 19, 2026

今日のまとめ（Daily Brief）⁠、朝のブリーフィングを自動作成

「今日のまとめ（Daily Brief⁠）⁠」は、ユーザーが利用を有効にすると、Gmailの急ぎの更新情報、Googleカレンダーの予定、フォローアップに必要な情報をまとめ、朝のブリーフィングとして提示する機能である。

情報をまとめるだけでなく、ユーザーの目標に基づいて内容を整理・優先順位付けし、次に取るべき行動も提案するという。ユーザーは、親指のアップ／ダウンで評価することで、時間とともに内容を調整できる。提供は同日からGoogle AI Plus、Pro、Ultra加入者向けに始まり、まず米国から順次提供される。

Daily Brief is a new personalized digest that’s designed to be your first stop every morning.

It gathers info from your inbox, calendar, and tasks to prioritize, organize, and suggest the next steps for you in a super concise morning digest that's built for skimming. #GoogleIO
— Google Gemini (@GeminiApp) May 19, 2026

Gemini Spark⁠、24時間体制で作業を支援

「Gemini Spark」は、24時間体制で作業を支援するパーソナルAIエージェントとして発表された。Gemini 3.5で動作し、Antigravityハーネスを使う。Gmail、Docs、SlidesなどのWorkspaceツールと統合され、ノートPCを閉じたりスマートフォンをロックしたりしてもバックグラウンドで作業を続ける。

Gemini Spark is your new 24/7 personal AI agent.

Give it a task and it works autonomously in the background, even if your phone and laptop are turned off. You choose to turn it on and it's designed to check with you before taking major actions. #GoogleIO
— Google Gemini (@GeminiApp) May 19, 2026

Sparkはユーザーの指示に沿って動作する設計で、ユーザーはオンにするかどうか、どのアプリに接続するかを選べる。支払いを伴う操作やメール送信のような重要度の高い操作を行う前には、ユーザーに確認を求めるとしている。

利用例として、毎月のクレジットカード明細から新しいサブスクリプション料金や見落としやすい料金を検出することが挙げられている。学校からの連絡をもとに重要な期限を抽出して日次ダイジェストを送ること、メールやチャットに散らばった会議メモからGoogle Docsの文書やプロジェクト開始メールの下書きを作ることも例示されている。

Gemini Sparkは発表週から選定されたテスター向けに順次提供され、発表翌週には米国のGoogle AI Ultra加入者向けにベータ版として提供する予定としている。Canva、OpenTable、Instacartとの新しいMCP（Model Context Protocol）接続は同日開始され、同発表から数週間以内にSparkがそれらの接続を使って作業を進められるようになる。

Google Workspace向けの発表では、Gemini SparkはGoogle Workspaceアプリと統合し、ビジネス顧客向けにはGeminiアプリ内で近くプレビュー提供されるとしている。

さらに2026年夏にかけて、テキストやメールでSparkに指示する機能、カスタムサブエージェントの作成、ローカルブラウザ操作も追加する予定としている。

macOS版Geminiアプリは2026年夏⁠、ローカルファイルや音声入力を強化

macOS用Geminiアプリは全ユーザーがダウンロードできる。2026年夏には、Gemini SparkをGeminiデスクトップアプリへ取り込み、ローカルファイルを扱う作業やデスクトップ全体のワークフロー自動化を支援できるようにするとしている。

音声機能も強化される。画面上のコンテキストを使い、考えながら話すときに出る「ええと」や言い直しを含む自由な発話を、意図に沿った正確な下書きへ変換し、カーソル位置に合わせて整形して挿入するという。Gemini Sparkは米国のGoogle AI Ultra加入者向けに順次提供され、新しい音声機能は2026年夏後半に提供される。

Last month we dropped the Gemini app for macOS.

In the coming weeks, we’ll be bringing Gemini Spark to the Gemini desktop app so it can help with tasks like organizing your local files, or extracting PDF data directly into Google Sheets. #GoogleIO
— Google Gemini (@GeminiApp) May 19, 2026

AI生成コンテンツの判別を支援⁠、SynthIDとC2PAの確認機能を拡大

Googleは、AI生成メディアの作成・編集履歴を確認するための機能も拡大する。コンテンツの出どころや、編集・改変の有無を把握しやすくするための取り組みである。

英語：Making it easier to understand how content was created and edited

同社は、AI生成コンテンツに人間には知覚しにくい信号を埋め込むデジタル透かし技術「SynthID」を3年前に導入し、これまでに1000億点以上の画像・動画と、再生時間にして6万年分の音声に透かしを付与してきたという。Gemini Omniで生成したすべての動画にもSynthIDが含まれ、Geminiアプリ、Chrome内のGemini、Google検索から確認できる。

検証機能も広がる。Geminiアプリの画像、動画、音声向けSynthID検証はすでに世界で5000万回利用されており、同日からGoogle検索にも拡大し、Chromeにも今後数週間で提供する予定としている。あわせて、メディアの作成・変更履歴を示す業界標準「C2PA Content Credentials」の検証にも対応する。Geminiアプリでは同日から順次提供され、検索とChromeには今後数カ月で提供される予定としている。

企業向けには「AI Content Detection API」もGemini Enterprise Agent Platform上で提供する。企業が自社プラットフォーム上のメディアを評価・管理するための検出APIで、Google製モデルだけでなく、広く使われている他社モデルで生成されたAIコンテンツの検出も支援する。まずは選定されたパートナー向けに提供を始める。

業界連携では、OpenAI、Kakao、ElevenLabsがSynthIDを各社のAI生成コンテンツへ取り入れる。MetaはInstagramで、Pixelで撮影された写真や動画などのContent Credentialsをラベルとして表示する予定としている。

Google AI Ultraは月額100ドル階層を追加⁠、最上位は月額200ドルに

GoogleはI/O 2026に合わせて、Google AIのサブスクリプションプランも更新した。Google AI Ultraに新たに月額100ドルの階層を導入し、従来の最上位階層は月額250ドルから月額200ドルへ引き下げる。

英語：Everything new in our Google AI subscriptions, fresh from I/O 2026

月額100ドルのGoogle AI Ultraプランでは、GeminiアプリとGoogle AntigravityでGoogle AI Proプランの5倍の使用量上限が適用される。Gemini 3.5 Flashの統合、Google Antigravityへの優先アクセス、20TBのクラウドストレージ、YouTube Premium個人プランなども含まれる。Health PremiumとHome Premiumも、AI ProとAI Ultraのサブスクリプションに含まれる。

月額200ドルの最上位プランでは、これまでの特典を維持しつつ、GeminiアプリとGoogle AntigravityでGoogle AI Proプランの20倍の使用量上限を提供する。Google AI Ultraの100ドル階層と200ドル階層では、米国限定でGemini Sparkを利用できる予定で、200ドル階層ではProject Genieも対象になる。

使用量上限の扱いも変わる。Googleは、日次のプロンプト数ではなく、プロンプトの複雑さ、使用する機能、会話の長さなどを踏まえる利用量ベースの方式へ移行すると説明している。上限は5時間ごとに更新され、週次上限に達するまで利用できる。上限に達した場合は小型モデルへ切り替えるほか、AI ProとAI Ultraの加入者はGoogle Antigravity、Google Flow、今後はGeminiアプリ向けに従量課金の追加AIクレジットを購入できるようにする。

コラム⁠：Gemini for Scienceで研究支援ツールも拡張

Googleは、研究者向けの取り組みとして「Gemini for Science」も発表した。科学探索の規模と精度を広げるためのツールと実験をまとめ、科学的方法の中核的な工程をAIで支援することを目指す。

Googleは、Stanford Universityなど100以上の機関と協力して、科学向けAIシステムやツールを検証している。ICML、STOC、NeurIPSなどの学会とは、エージェントによる査読や科学的検証に関する実験的なツールのパイロットも進めている。

Google Labsでは、3つの実験的なプロトタイプを用意する。Co-Scientistを基盤にした「Hypothesis Generation」は、研究課題に対して複数のエージェントが仮説を生成、議論、評価し、引用から根拠を確認できるようにする。「⁠Computational Discovery」は、AlphaEvolveとERA（Empirical Research Assistance）を使い、多数のコードのバリエーションを並列に生成・評価する。「⁠Literature Insights」はNotebookLMを基盤に、科学文献を検索し、比較しやすい表形式に整理する。

これらの実験は、labs.google/scienceで関心登録を受け付け、段階的にアクセスを広げる。企業や研究機関向けにはGoogle Cloudを通じた展開も進めており、BASF、Klarna、第一三共などが、AlphaEvolveやCo-Scientistを使った研究・産業R&Dの取り組みに関わっているという。ERAとCo-Scientistに関する研究論文は、同日Natureに掲載されている。

Gemini for Scienceの一部として、Google Antigravityで使える「Science Skills」も提供する。AlphaFold Databaseなど30以上の主要な生命科学データベースやツールの知見を統合した専用スキル群で、構造バイオインフォマティクスやゲノム解析のような手作業の多いワークフローを、数時間ではなく数分で進められるようにするという。