Googleは2026年5月19日、年次開発者会議
Googleによると、Geminiアプリの月間利用者数は昨年5月のGoogle I/
Google I/
Gemini 3.5 Flashを公開、エージェントとコーディング向けの次世代モデル
Gemini 3.
Gemini 3.
性能面では、Terminal-Bench 2.
1/ Today at #GoogleIO, we’re releasing Gemini 3.
— Jeff Dean (@JeffDean) May 19, 20265, our latest family of models combining frontier intelligence with action.
We’re starting by releasing 3.5 Flash, which is built to help you execute complex, long-horizon agentic workflows.
Gemini 3.5 Flash is our strongest model… pic. twitter. com/ UuNL5cePpQ
上位モデルの
開発者向けには、Google Antigravityとの連携も用意される。Googleは、Antigravityのハーネスと組み合わせることで、協調するサブエージェントを使い、人間が確認しながらワークフローやコーディング作業を進められると説明している。Antigravity 2.
安全性については、Gemini 3.
Gemini Omni Flash、テキスト、画像、動画、音声を組み合わせて動画を生成
Gemini Omniは、Geminiの推論能力と生成能力を組み合わせ、あらゆる入力からコンテンツを作ることを目指して開発された新しいモデルファミリーである。最初のモデルとして
We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video.
— Google DeepMind (@GoogleDeepMind) May 19, 2026
It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing 🧵 pic.twitter. com/ GAtqzr0VIV
特徴の1つは、自然言語で動画を編集できる点にある。各指示は前の指示を引き継ぎ、キャラクターの一貫性や物理的な整合性、それまでのシーンの文脈を保ちながら変更を重ねられるという。質感の変更、照明の音楽同期、別の画像環境への被写体の移動、カメラアングルの変更などの編集例が紹介されている。
Gemini Omni is a major leap in world understanding & multimodal editing! It can take photos, video & audio and build entirely new scenes. Over time it’ll be able to handle any input & any output - starting w/ video
— Demis Hassabis (@demishassabis) May 19, 2026
You can even give it your own videos & iterate on your ideas: pic.twitter. com/ VrHPJKRJXH
Gemini Omniは、世界知識と物理の直感的理解を使った映像生成も特徴としている。重力、運動エネルギー、流体力学のような力を踏まえた描写のほか、歴史、科学、文化的文脈を組み合わせ、写実性だけでなく意味のあるストーリーテリングにつなげるとしている。
Omni brings together an improved understanding of physics with Gemini's knowledge of history, biology, and culture, bridging the gap from photorealism to meaningful storytelling.
— Google DeepMind (@GoogleDeepMind) May 19, 2026
Actions have consequences, environments respond to events, and narratives evolve logically. pic.twitter. com/ ajQ3purg0g
入力リファレンスにも対応する。画像、テキスト、動画、音声などを組み合わせた1つの動画作品を生成できる。音声については、開始時点でサポートされるのは音声リファレンスで、他の種類の音声入力は将来的に対応する予定としている。
🔘 Define a character once - then place them in any scene, and they’ll stay consistent across locations, actions and lighting.
— Google DeepMind (@GoogleDeepMind) May 19, 2026
🔘 Apply styles, motion, or effects by using input references, or just describe it with natural language. pic.twitter. com/ OEFvr4w4Da
責任あるAIの観点では、自分の声を使って、自分に似た見た目と声の動画を生成できるアバター機能を案内している。一方、動画内の音声や発話を変更する編集機能については、責任ある提供方法を検証中としている。
Gemini Omni Flashは発表同日からGoogle AI Plus、Pro、Ultraの有料サブスクリプション加入者向けに、GeminiアプリとGoogle Flowを通じて世界各地で順次提供される。これとは別に、YouTube ShortsとYouTube Create Appのユーザーには、発表と同じ週から無料で順次提供される。開発者と企業向けのAPI提供は、同発表から数週間以内に始める予定としている。
Geminiアプリ、デザイン刷新からエージェント機能まで拡張
Geminiアプリでは、Web、Android、iOS版のデザイン刷新、Gemini Liveの統合、朝のブリーフィング機能、Gemini Spark、macOS版デスクトップアプリの更新などが発表された。
- 英語:The Gemini app becomes more agentic, delivering proactive, 24/
7 help - 日本語:Gemini アプリがエージェントとして進化: 24 時間 365 日のサポートを実現
Neural ExpressiveとGemini Live、画面表示と会話の流れを刷新
GeminiアプリのWeb、Android、iOS版では、新デザイン言語
We've completely redesigned the Gemini experience from the ground up.
— Google Gemini (@GeminiApp) May 19, 2026
From the moment you open the app or visit Gemini on the web, you’re greeted with a stunning new design language we call Neural Expressive. #GoogleIO
Gemini Liveの会話機能は、Geminiアプリに直接統合される。ユーザーは、短い質問をテキストで入力した後に、音声での自由な会話に切り替え、またテキストへ戻るといった使い方ができる。マイクも再設計され、話の途中で遮られにくく、自分のペースで複雑な考えを話せるようにした。
応答の見せ方も変わる。Googleは、Geminiが長文だけを返すのではなく、画像、インタラクティブなタイムライン、ナレーション付き動画、動的なグラフィックを組み込んで、内容を理解しやすくすると説明している。
GeminiアプリにもGemini Omniが組み込まれる。テキスト、画像、動画のプロンプトを組み合わせて映画のような高品質な動画を作れるようにし、自然な会話でズームを適用したり背景を差し替えたりできるという。
Gemini Omni is coming to the Gemini app for paid subscribers today.
— Google Gemini (@GeminiApp) May 19, 2026
It lets you bring your ideas to life using any combination of text, images, and video inputs. Just open up Gemini, attach a video from your camera roll, and change it around. It’s that simple. #GoogleIO
今日のまとめ(Daily Brief)、朝のブリーフィングを自動作成
「今日のまとめ
情報をまとめるだけでなく、ユーザーの目標に基づいて内容を整理・
Daily Brief is a new personalized digest that’s designed to be your first stop every morning.
— Google Gemini (@GeminiApp) May 19, 2026
It gathers info from your inbox, calendar, and tasks to prioritize, organize, and suggest the next steps for you in a super concise morning digest that's built for skimming. #GoogleIO
Gemini Spark、24時間体制で作業を支援
「Gemini Spark」
Gemini Spark is your new 24/
— Google Gemini (@GeminiApp) May 19, 20267 personal AI agent.
Give it a task and it works autonomously in the background, even if your phone and laptop are turned off. You choose to turn it on and it's designed to check with you before taking major actions. #GoogleIO
Sparkはユーザーの指示に沿って動作する設計で、ユーザーはオンにするかどうか、どのアプリに接続するかを選べる。支払いを伴う操作やメール送信のような重要度の高い操作を行う前には、ユーザーに確認を求めるとしている。
利用例として、毎月のクレジットカード明細から新しいサブスクリプション料金や見落としやすい料金を検出することが挙げられている。学校からの連絡をもとに重要な期限を抽出して日次ダイジェストを送ること、メールやチャットに散らばった会議メモからGoogle Docsの文書やプロジェクト開始メールの下書きを作ることも例示されている。
Gemini Sparkは発表週から選定されたテスター向けに順次提供され、発表翌週には米国のGoogle AI Ultra加入者向けにベータ版として提供する予定としている。Canva、OpenTable、Instacartとの新しいMCP
Google Workspace向けの発表では、Gemini SparkはGoogle Workspaceアプリと統合し、ビジネス顧客向けにはGeminiアプリ内で近くプレビュー提供されるとしている。
さらに2026年夏にかけて、テキストやメールでSparkに指示する機能、カスタムサブエージェントの作成、ローカルブラウザ操作も追加する予定としている。
macOS版Geminiアプリは2026年夏、ローカルファイルや音声入力を強化
macOS用Geminiアプリは全ユーザーがダウンロードできる。2026年夏には、Gemini SparkをGeminiデスクトップアプリへ取り込み、ローカルファイルを扱う作業やデスクトップ全体のワークフロー自動化を支援できるようにするとしている。
音声機能も強化される。画面上のコンテキストを使い、考えながら話すときに出る
Last month we dropped the Gemini app for macOS.
— Google Gemini (@GeminiApp) May 19, 2026
In the coming weeks, we’ll be bringing Gemini Spark to the Gemini desktop app so it can help with tasks like organizing your local files, or extracting PDF data directly into Google Sheets. #GoogleIO
AI生成コンテンツの判別を支援、SynthIDとC2PAの確認機能を拡大
Googleは、AI生成メディアの作成・
同社は、AI生成コンテンツに人間には知覚しにくい信号を埋め込むデジタル透かし技術
検証機能も広がる。Geminiアプリの画像、動画、音声向けSynthID検証はすでに世界で5000万回利用されており、同日からGoogle検索にも拡大し、Chromeにも今後数週間で提供する予定としている。あわせて、メディアの作成・
企業向けには
業界連携では、OpenAI、Kakao、ElevenLabsがSynthIDを各社のAI生成コンテンツへ取り入れる。MetaはInstagramで、Pixelで撮影された写真や動画などのContent Credentialsをラベルとして表示する予定としている。
Google AI Ultraは月額100ドル階層を追加、最上位は月額200ドルに
GoogleはI/
月額100ドルのGoogle AI Ultraプランでは、GeminiアプリとGoogle AntigravityでGoogle AI Proプランの5倍の使用量上限が適用される。Gemini 3.
月額200ドルの最上位プランでは、これまでの特典を維持しつつ、GeminiアプリとGoogle AntigravityでGoogle AI Proプランの20倍の使用量上限を提供する。Google AI Ultraの100ドル階層と200ドル階層では、米国限定でGemini Sparkを利用できる予定で、200ドル階層ではProject Genieも対象になる。
使用量上限の扱いも変わる。Googleは、日次のプロンプト数ではなく、プロンプトの複雑さ、使用する機能、会話の長さなどを踏まえる利用量ベースの方式へ移行すると説明している。上限は5時間ごとに更新され、週次上限に達するまで利用できる。上限に達した場合は小型モデルへ切り替えるほか、AI ProとAI Ultraの加入者はGoogle Antigravity、Google Flow、今後はGeminiアプリ向けに従量課金の追加AIクレジットを購入できるようにする。