Google⁠画像生成Imagen 4⁠動画生成Veo 3⁠AI映像制作ツールFlowをリリース 〜電子透かしSynthIDの識別を支援する「SynthID Detector」早期アクセスも案内

Googleは5月20日から開催されているGoogle I/O 2025で、画像生成モデルVeoと動画生成モデルImagenをアップデートしたことを発表した。また、音楽生成モデルLyriaへのアクセスを先月4月に拡大したことを案内し、さらにAI映像制作ツールFlowをあらたにリリースしたことも発表した。

動画生成モデル「Veo 3」

動画生成モデルVeo 3は、Veo 2から品質を向上させ、あらたに音声付きの動画を生成できるようになった。都市の雑踏や公園の鳥のさえずり、キャラクター同士の会話など、多様な音声を動画に追加できるという。

また、テキストや画像を使ったプロンプトから、現実の物理法則や音声にあわせた口の動きの同期も可能とのこと。

現在Veo 3は、アメリカのGeminiアプリおよびFlowでUltraプランのユーザー、またはVertex AIのエンタープライズ向けで利用可能。

なおVeo 2にも新機能を追加したことを発表した。

  • 画像をもとにキャラクターやシーン、オブジェクト、スタイルを指定できる「参照画像による動画生成」
  • カメラの回転・移動・ズームを設定できる「カメラコントロール」
  • 映像のフレームを拡張する「アウトペインティング」
  • 相互作用が考慮された「オブジェクトの追加と削除」

現在、参照画像による動画生成機能とカメラコントロール機能がFlowで利用できる。

AI映像制作ツール「Flow」

AI映像制作ツールFlowは、Veo、Imagen、Geminiといったモデルを活用し、自然言語で映像のシーンやストーリーを記述できるAI映像制作ツール。キャストやロケーション、オブジェクト、スタイルなどを一元管理して映像を制作できるという。

現在Flowは、アメリカのGoogle AI ProとUltraプランのユーザーが利用可能。

画像生成モデル「Imagen 4」

画像生成モデルImagen 4は、これまで以上にスピードと精度を両立している。布地や水滴、動物の毛並みなどの細かな表現や、写実的・抽象的なスタイルにも対応したという。最大2Kの解像度の画像を生成できるため、印刷やプレゼンテーションにも最適とのこと。

また、文字描画やタイポグラフィの精度も向上し、グリーティングカードやポスター、漫画の制作にも活用できるという。

現在Imagen 4は、Geminiアプリ、Whisk、Vertex AI、Workspaceの各種サービスで利用可能。

今後、Imagen 3の10倍の速度で処理できる「Imagen 4の高速バージョン」もリリース予定とのこと。

音楽生成モデル「Lyria 2」

音楽生成モデルLyria 2は、ミュージシャンやプロデューサー、作曲家向けの実験的ツールMusic AI Sandboxに搭載されているが、このアクセスを4月に拡大している。

現在Lyria 2 は、クリエイター向けにYouTubeショートを通じた提供や、Vertex AIでエンタープライズ向けで利用可能。

MusicFX DJで使われているインタラクティブな音楽生成モデルLyria RealTimeが、API経由やAI Studioで利用できる。

生成されたコンテンツに埋め込まれる電子透かし「SynthID」

2023年に導入された電子透かしSynthIDが、100億以上の画像・動画・音声・テキストのAI生成コンテンツに埋め込まれてきたことも紹介し、Veo 3、Imagen 4、Lyria 2の出力にも引き続きSynthIDが適用されるとした。

今回、AI 生成コンテンツの識別を支援するSynthID Detectorも新たに発表した。コンテンツをアップロードすると、SynthID Detectorによってファイル全体、または一部にSynthIDが含まれているかの識別ができる。現在、テスター向けに早期アクセスを提供している。

おすすめ記事

記事・ニュース一覧