Google⁠AIオーディオモデル「Gemini 3.1 Flash Live」リリース ―多言語音声によるリアルタイム検索やスマートフォンでのリアルタイム翻訳がより使いやすく

Googleは2026年3月26日、AIオーディオおよび音声モデルの最新バージョンGemini 3.1 Flash Liveをリリースした。

Gemini 3.1 Flash LiveはGeminiのリアルタイム対話機能をさらに進化させた音声モデル。高品質な音声とスピードを両立させている。前バージョンのGemini 2.5 Flash Native Audioより音声の理解力も向上しており、中断や言い直しががあるような長い会話の流れを追うことができ、繰り返し説明する必要が軽減しているという。またノイズの多い騒がしい環境でも詳細を理解できるようになり、音の高さやペースといった音響的なニュアンスをより正確に認識する。たとえば会話相手の不満や混乱といった感情表現に対して、より動的に反応を返すことも可能とのこと。

実際の音声にありがちな中断やためらいの中で、複雑な指示に従う能力や長期的な推論能力を具体的にテストするScale AIのAudio MultiChallengeというベンチマークで、Gemini 3.1 Flash Liveは「思考」モードをオンにして他社のリアルタイム型推論モデルを上回る性能をマークしている。
Scale AIのAudio MultiChallengeの結果

Gemini 3.1 Flash LiveはGoogle製品全体で利用可能で、開発者がGoogle AI Studioで3.1 Flash LiveのGemini Live APIを利用したり、一般ユーザーがGemini LiveやSearch Liveを通して3.1 Flash Liveによる対話を体験できる。

Search Liveでは3.1 Flash Liveの多言語対応機能により、世界200以上の国と地域のユーザーが希望する言語でGoogle Searchとリアルタイム/マルチモーダルでやりとりができるようになった。

また、Android版に加えiOS版のGoogle翻訳でヘッドホン使用時のリアルタイム翻訳機能が利用できるようになった。翻訳できる言語は70以上となり、さらにこの機能が利用可能な地域が日本、メキシコ、イギリス、フランス、ドイツ、インド、アメリカ合衆国に拡大された。

おすすめ記事

記事・ニュース一覧