Googleは、今年5月に開催されたGoogle I/
Gemini Liveは英語版のみの提供で、20USドル/月のGoogle One AI Premiumに加入するユーザのみが利用できる機能でしたが、無料化によりGeminiを使っているすべてのユーザが利用できるようになりました。
Gemini Liveを使う方法
Geminiが使える端末であれば、Gemini Liveを以下の手順で使えます。
- Geminiアプリを起動して、プロフィール画像のアイコンをタップします。
- 「設定」 > 「言語」
をタップします。 - 使用言語が日本語であれば、これをタップして
「アシスタントの言語」 へ遷移します。 - 「日本語
(日本)」をタップして 「English (United States)」 を選択します。
これで一旦アプリが終了するので、もう一度起動します。
すると、画面下のテキスト入力欄の右側にGemini Liveアイコンが追加されているので、これをタップするとGemini Liveが起動し音声対話が可能になります。
この画面では音声入力したクエリはテキスト表示されず、これらのレスポンスも音声のみでテキストは表示されません。一旦、Liveモードを抜ければ、入力クエリはテキストで確認できます。Liveモードの起動方法は相変わらずの謎UIですが、機能は素晴らしいもので、筆者の下手な英語でも認識して結果を音声で返します。
Gemini Liveの音声は、10種類の新しい音声が追加されており、好みのものが選べます。設定は、Geminiアプリのプロフィールアイコンをタップして、
Gemini Live, new voices now available for all free users on Android
これまでのデジタルアシスタントは、相手がコンピュータであることを意識して、コマンド口調での対話、結果も簡潔なものでした。しかし、今回は、相手は同じコンピュータでも自然言語で対話ができます。
また、返す結果は知性があるように感じ、文脈も理解します。これが、将来のNest AudioやNest Hubなどに組み込まれて日常的に使えるようになれば、SF映画で観た日常の世界が現実のものとなりそうです。AI関連は速いテンポで進化しているので、来年末にはあたりまえになっているかもしれません。
今のところは英語のみ
Gemini Liveは、今のところ英語版のみの提供で我々は蚊帳の外です。
Google Gemini AppのXアカウントのポストでは
また、10月4日にGoogle The Keywordに公開されたエントリーでは、本日より数週間以内にAndroid版で40以上の言語に対応して、多くの言語で会話型AIが利用できるようになると明らかにしています。
Google Gemini update: Expanding Gemini Live and extensions to over 40 languages
また、同エントリでGoogleの他のアプリとも連携するとしています。現状もGoogle Workplaceと連携はしますが、GoogleカレンダーやToDoなども連携してくれると、日常使いのイメージが湧きます。
どちらも、特定言語のリリース時期は明らかになっていませんが、年内か遅くとも来年の春までには英語以外の言語で使えるようになりそうです。
2024年後半に向けては、カメラを通じて見えるものを説明できる機能、自然な対話を通じて複雑なタスクを実行する機能の追加が予定されています。この勢いだと、できることが増えるのは2025年中には収束しそうなので、AIと人との接点がどうあるべきなのかの議論が加熱し始めるかもしれません。
今週は、このあたりで、また来週。