いま、見ておきたいウェブサイト

第176回ChatGPTがもたらしたBingやGoogle検索の変化と⁠ウェブサイトとの関係性

人間のような自然な言語表現で対話ができる「ChatGPT」の登場は、その応用分野の広さから、個人や企業を問わず、社会的な一大ブームを巻き起こしました。

2022年11月30日。AIチャット「ChatGPT」のプロトタイプ公開を発表した、OpenAIの公式Blogのエントリー「Introducing ChatGPT」。その後の大きな変化のスタート地点となった
図

それから約8か月。人々が日常的に利用している検索エンジンとウェブサイトの関係性に大きな変化をもたらしています。

ChatGPTの機能を活用した「Bing」やGoogle検索における対話機能「SGE(Search Generative Experience⁠⁠」など、AI(人工知能)を使った検索はユーザーの利便性を高めました。その一方で、従来の広告ビジネスやウェブサイトのあり方には、今までとは違う関係性が生まれつつあります。

今回はChatGPTがもたらした、検索エンジンの変化とウェブサイトの新たな関係性、そして将来の展望について考察していきます。

注目を集めているChatGPTとは何か

AI(人工知能)の研究開発企業であるOpenAIが開発したChatGPTは、2022年11月にリリースされたAIチャットボットです。文章を生成するためにGPT(Generative Pre-trained Transformer)と呼ばれる言語モデルが使用されており、自然な文章の作成が可能です。

OpenAIが開発したAIチャットChatGPT。対話型のチャット形式のユーザーインターフェイスを採用したことで、爆発的に利用者が拡大した
図

ウェブサービスとして提供されているChatGPTでは、対話形式でテキストを入力すると、誰かと会話しているような文章が返ってきます。こちらからの質問に答えたり、依頼した文章を作成したりといった作業も上手にこなします。

ChatGPTの基盤となる技術は、大規模言語モデル(LLM:Large Language Model)と呼ばれるものです。人間の言葉を再現させるため、新聞記事や小説などの本、ウェブサイト上の文章など、大量のテキストをコンピューターにデータとして与えます。コンピューターはデータを学習して、単語や文の関係性、文脈の推測を認識するようになります。

大規模言語モデルでは、前後の文章や単語の意味を考えているかのように、次の言葉や文章を予測して文章を生成します。このためユーザーに話しかけたり、問いかけに回答したりと、コンピューターが人間の言語を理解しているような会話が行えるのです。

誰もが自然に扱える言語を基本とした技術のため、公開直後からChatGPTは世界各国で注目を集めています。APIも提供されており、他の技術と組み合わせたサービスや製品が次々と登場して話題になるなど、その影響は急速に拡大しています。

ChatGPTは、どんな利用に適しているのか

ChatGPTは、どのように利用するのがいいのでしょうか。ここではChatGPTの得意な作業を紹介します。

文章の作成・要約
書き始め前の下書きや文章の構成をChatGPTに製作してもらうことで、もっとも時間のかかる文章の書き始めの時間が大幅に短縮できます。ビジネス文書における定型文などは、少ない修正で十分仕事で使える水準です。文章に添える要約の作成や、読み込ませた文章の要約にも有効です。
雑談や相談
ChatGPT相手の雑談、気軽な相談もおもしろいでしょう。回答の多くは、一般的に共有されている典型的な内容になることが多いです。それでも、実際の人間相手には聞きにくい内容の質問ができたり、いつでも、何度でも質問できたりすることは大きな利点です。
創造的な作業
人間が行えば多くの時間と労力を消費する、創造的な作業は応用範囲が広いでしょう。ChatGPTは何時間動いても、設定を一から変更しても文句は言いません。条件を変更して繰り返しても、アイデアを次から次へと出力し続けてくれる、優秀な仕事相手と言えるでしょう。
複雑な作業の代行
現時点でもっとも適していると思われるのが、人間が行うには手間のかかる作業の代行です。たとえば、一定の条件に沿った文章の書き直しやデータの入れ替え、大量のダミーデータの作成や無数のアイデアの出力などの作業です。ChatGPTでは翻訳も可能なため、⁠外国語の文章を日本語に翻訳して、要約を作成する」といった作業も一度に行えます。

ChatGPTの利用における注意点

日常の作業を飛躍的に効率化してくれるChatGPTですが、注意する点もあります。

注意点1:OpenAIによるデータの利用

ユーザーが入力した内容はChatGPTの学習に利用される可能性があります。OpenAIでは、API以外のChatGPT利用時のデータをモデルの改善に使用することがあると述べています。

フリー版のChatGPTを業務などで使う場合、機密漏洩の可能性があるため、個人情報や会社の機密情報は入力しないことです。さらに入力データを学習させないようにChatGPTを設定したり、用意されているAPI経由で使うことで学習されないことを利用したり、OpenAIにオプトアウトの申請を行ったりすることの対応を考えましょう。

企業でChatGPTを利用する場合、企業保有の機密データの漏洩やプライバシー保護、セキュリティといった問題の解決が必要です。OpenAIも企業向けサービスChatGPT Enterpriseの提供を始めており、今後はこうしたサービスを利用する事例が増えるでしょう。

OpenAIが開始した企業向けAIチャットサービスChatGPT Enterprise。企業向けのため、データは暗号化され、ユーザーのプロンプトと企業データは学習されない
図
注意点2:学習データの古さと著作権の侵害

ChatGPTの学習データの古さも大きな問題です。ChatGPTは2021年9月までのデータを学習しています。回答時に「最新データに対応していない」ことを付加してくる場合もありますが、内容が古く、現在の最適解ではない場合があります。

有料版のChatGPT Plusで利用できる、ChatGPTのブラウジング機能を利用すれば、直接インターネットからデータを取り込んで、AIによる回答が可能になります。この機能で、前述したデータの古さから発生する問題点は、ある程度回避できるようになっています。

また、出力した文章について、他者の著作権を侵害する懸念があることも考慮しておかなければなりません。ChatGPTが生成した文章が、著作権を有する文章などに類似した場合、著作権侵害となる可能性があります。 暴力的、差別的な内容が含まれる可能性もゼロではなく、生成される文章の内容には注意が必要です。

注意点3:誤った情報や不適切な発言の可能性

現時点での最大の問題点は、ChatGPTが不適切な発言や誤った情報を、事実のように堂々と出力する可能性があることです。「ハルシネーション(hallucination:幻覚、妄想)」と呼ばれるこの現象は、ChatGPTの回答が人間の使う言語表現で出力されるため、内容をユーザーがそのまま信じてしまう可能性も高く、非常に危険です。

ChatGPTにおける「ハルシネーション」の例(2023年5月頃)。ChatGPTに実在しない商業施設の詳細を尋ねた場合の解答例。学習データから情報を組み合わせ、実際に存在するかのような回答を行う。こうした回答が少なくなるように調整されていっている
図

これらを認識しておくことで、安全かつ効果的に利用できます。

もちろん、どんな情報も「真偽を確認すること」が情報リテラシーの基本です。ChatGPTの回答にも、この原則が当てはまります。最新かつ正確な回答を求めるのであれば、ユーザー自身が回答を検証できる程度の知識を持っているか、通常の検索や文献など、他の方法で回答の正確性を確認する作業は必要不可欠です。

ChatGPTで、より良い回答を得る技術

さまざまなタスクがこなせるChatGPTでは、日本語の入力にも対応しています。ただし、学習データの多くが英語のため、英語での入力をオススメします。ChatGPTの回答スピードも速くなり、より高品質な回答が得られるためです。便利な翻訳ツールなどを利用しながら、英語と日本語の両方を使い分ければ、さらに良い回答が得られます。

ChatGPTでより良い回答を得るための「プロンプト・エンジニアリング(Prompt Engineering⁠⁠」と呼ばれるテクニックも登場しています。これは、ユーザーが入力する指示(プロンプト)を工夫することで、AIが生成する回答の精度や質を向上させるものです。OpenAIが提供するドキュメントGPT best practicesでは、ChatGPTで、より良い回答を得る方法として、以下のような6つの戦略を紹介しています。

  • 明確な指示を書く
  • 参照するテキストの提供
  • 複雑なタスクを単純なサブタスクに分割
  • GPTに「考える」時間を与える
  • 外部ツールを使う
  • 変更を体系的にテストする

より高度な結果を得るためには、以下のようなテクニックも存在します。

  • Few-shotプロンプティング:事前に具体例を示して、出力方法を学ばせる
  • 思考の連鎖(Chain of Thought⁠⁠:推論までの過程を複数の事例で示し、複雑な推論を実現する
  • 思考の木(Tree of Thoughts⁠⁠:問題解決までの思考を途中で評価しながら、最適解を見つける

プロンプト・エンジニアリングは、効率的で質の高い回答を生み出せる、生成AIにおける専門的技術として注目されています。海外では、職業として人材の採用も始まっています。

OpenAIが提供するドキュメント「GPT best practices」。ChatGPTから良い結果を得るための技術を紹介している
図

しかし、こうしたテクニックは、生成AIの利用が拡大する際の⁠一過性のもの⁠と考えられます。将来的には、誰もが利用できる⁠汎用的な生成AI⁠が求められることから、まずは利用目的や扱うデータの範囲を限定した特化型モデルや、手軽にデータ入力ができるユーザーインターフェイスを採用したサービスが登場してくるはずです。

もっとも手軽な方法は、月額20ドルを支払って「ChatGPT Plus」のユーザーになることです。⁠⁠ChatGPT Plus」では、画像や音声などの処理にも対応しており、サードパーティが開発した250種類を超えるプラグイン(拡張機能)も利用できます。回答時間も早くなり、作業の効率化も図れます。

巨大IT企業の動向を変えたChatGPTの公開

利用が急速に拡大しているChatGPTに対して、様々なIT企業も積極的な動きを見せています。

OpenAIに投資しているMicrosoft

その一つがMicrosoftです。Microsoftは、今年1月のOpenAIへの100億ドル(約1兆3,000億円)の追加投資を契機に、自社のクラウドサービスMicrosoft Azure上で、OpenAIの大規模言語モデルが利用できるAzure OpenAI Serviceの一般提供を開始しました

さらに、2月には検索サービスBingにChatGPTの技術を組み込みTeams Premiumの一般提供も開始。3月には、自社のオフィスアプリMicrosoft 365で生成AIが使える新機能Microsoft 365 Copilotを発表。5月には、主力のソフトウェアであるWindowsに、AIチャットインターフェイスを直接組み込むWindows Copilotを発表しました

ChatGPT登場後のOpenAIとMicrosoftの動きをまとめたもの。ChatGPTの利用権を獲得した後から、急ピッチで自社のサービスや製品にChatGPTの機能を取り入れていることがわかる
図

現在、Microsoftは既存の自社製品と生成AIとの融合を進めており、数多くの関連製品やサービス、機能を次々と登場させています。

中でも、ChatGPTの技術を組み込んだ検索サービスBingは、公開からわずか約1か月後で、1日のアクティブユーザー数が1億人を突破するという驚きの結果を生み出しました。

Microsoft Edge上で使用できる検索サービスBing。AIによる検索だけでなく、AIチャットであるBingチャットを利用すれば、テキストや画像の生成も可能
図

注目すべきは、ユーザーの3分の1はBing初体験の新規ユーザーだったことです。今までにない、AIが生成する文章による検索結果を体験しようとするユーザーは予想以上に多く、これまでGoogleが独占状態だった検索事業についても、状況が変化する可能性が出てきました。

自社開発の生成AIを使うGoogle

もう一つ、生成AIへの積極的な動きを見せているのがGoogleです。Googleは、2月に自社開発の大規模言語モデルLaMDAを使った、AIチャットボットBardを発表して、翌月には一般公開を開始。4月には、人工知能研究部門Google Brain Teamと子会社のDeepMindを統合して、新会社Google DeepMindを創設するなど、AI開発に注力するため、会社組織自体を最適化する動きを見せました。

直後に開催された5月の年次イベントGoogle I/O 2023では、大規模言語モデルPaLM 2をBardに組み込み、英語圏のユーザーに公開しました。また、AIを活用した検索機能SGE(Search Generative Experience)を発表SGEは8月末に国内でも試験的に提供されるようになりました。さらにGmailとGoogleドキュメントへのAIライティング機能など、Google WorkspaceアプリにAIツールを導入する新機能Duet AI for Google Workspaceも発表しました。

最近では、報道機関にニュース記事を作成できるAIツールの採用を勧めたり、GitLab(開発者支援)Salesforce(クラウド領域⁠)⁠、Typeface(マーケティング領域⁠)⁠、MSCI(投資領域)といった企業との連携を発表したりするなど、外部の企業と積極的な協力体制を進めています。

今までにない体験を引き出す、新しい検索の登場

従来の検索では、検索結果に関連したリンクが上から並び、ユーザーがその中身を確認して、ほしい情報を得ていました。検索に対話型AIが融合することで、検索はどのように変わるのでしょうか。実際にBingとSGEを使用して、新しい検索の特徴や使い勝手を確認してみましょう。

Microsoft Bingの特徴

スマートフォンのアプリEdgeからBingで検索した場合は、最上位にAIによる検索結果が表示され、その下に通常の検索結果が続きます。検索条件によっては、AIによる回答が表示されない場合もありますが、その場合は「チャット」タブから「Bingチャット」に移動して、AIによる回答が得られます。

PCからブラウザで検索した場合は、次の2つのレイアウトを確認できました。

  • 広告、AIによる検索結果の順にページ上部から表示
  • AIによる検索結果、広告の順にページ上部から表示

どちらの場合も、画面右側に「Bingチャット」による回答が生成されます。

OpenAIの大規模言語モデルGPT-4を組み込んだ、Microsoftの検索エンジンBingでの検索結果画面
図

AIの回答結果の下部にある「チャットしましょう」をクリックすれば、対話形式のチャットに切り替わります。新たに会話を始める際には、3種類の会話スタイル(⁠⁠より創造的に」⁠よりバランスよく」⁠より厳密に⁠⁠)から選択が可能です。

画面をスクロールさせれば、対話形式のチャットから、通常の検索結果画面へと戻ります。

YMYL(Your Money or Your Life)関連の情報検索の場合には、⁠これは情報提供のみを目的としており、医療上のアドバイスや診断を行うものではありません」⁠ただし、投資にはリスクが伴いますので、投資に関するご自身の判断と責任でお願いします」といった注意が表示されます。

ブラウザEdge上での利用であれば、サイドバーのアイコンから文章が作成可能な「Bingチャット⁠⁠、画像生成が可能な「Bing Image Creator」をすぐに利用できるのも便利です。

Google SGEの特徴

スマートフォンのアプリGoogleからSGEを利用した場合は、最上位にAIによる検索結果が表示され、その下に通常の検索結果が続きます。検索条件によっては、⁠AI による概要を生成しますか?」とAIを使った検索結果の生成を促されます。AIによる回答がない場合には、ページ上部の「会話」から、AIチャットへ移動すれば回答が得られます。

自社の大規模言語語モデルPaLM2が組み込んだSGEが機能している、Google検索の結果画面
図

PCによる検索結果では、ページの最上位にAIによって生成された検索結果が色で区分けされて表示され、その下に広告、検索関連のリンクが並びます。検索する内容によっては、AIによる結果がまったく表示されない場合もあります。アメリカで試験運用中のSGEでは、AIの検索結果内に画像や動画、地図や購入可能な商品が並ぶ場合があるようですが、日本ではそうした回答の種類が多くない印象です。

5月のGoogle I/O 2023で発表された、AIを利用した検索体験(SGE)の紹介動画。検索内容に合わせて、コンテンツのレイアウト表示が変化するのがわかる

検索結果は、まとめられたものが文章で回答されるため、非常にわかりやすいです。AIによる検索結果では、右上に表示されるアイコンから、AIが回答時に参照したウェブサイトが確認できます。下部に表示される「追加で聞く」から、対話形式のチャットへと切り替えも可能です。

通常の検索時に表示されるウェブサイトの順番と、AIによる検索結果で参照されるウェブサイトが異なる場合もあります。本格的なSGEの運用が始まった際には、SEO(検索エンジン最適化)などで、何らかの設定が必要になるかもしれません。

YMYL関連の検索では、⁠これは情報提供のみを目的としており、医療上のアドバイスや診断を行うものではありません」⁠これは専門的な金融アドバイスではありません。特定の状況については、金融アドバイザーに相談することをおすすめします」といった注意が表示されます。

SGEでは、トラフィックをウェブサイトに送ることに引き続き注力しており、検索広告についても「ページ全体の専用広告枠に引き続き表示される」ことが発表されています

SGEによる回答のトップには「生成AIは試験運用中のため、品質にむらがある可能性があります」との注意書きが表示されています。ユーザーの利用が増えることで、これから機能を含め、日々変化していく可能性が高いです。

BingとSGEの検索の作法の違い

BingとSGEは、どちらもAIによる検索結果を提供しますが、両者の検索の作法には、いくつかの違いがあります。

Bingは検索に対して、AIが回答する割合が少なめです。どうしてもユーザーがAIによる検索結果がほしい場合は、AIチャットに移行して回答してもらう必要があります。これに対してSGEでは、どんな検索に対しても、まずAIによる検索結果の作成を試みる場面が多いです。

こうした検索結果表示の違いは、従来の検索にAIによる回答機能を⁠追加する⁠というBingと、これまでの検索方法にAIによる回答機能を⁠融合する⁠というSGEのコンセプトの違いによるものだと考えられます。

単純なキーワードを複数組み合わせた程度の検索では、BingでもSGEでも、AIによる検索結果が表示されない場合があります。AIによる文章での検索結果を期待するのであれば、会話や質問形式での検索が必要でしょう。

以前からGoogleでは、検索結果に続いて「関連する質問」という項目が表示され、ウェブサイトへのリンクが用意されていました。BingとSGEでも、同様の機能がAIの検索結果に用意されています。この場合、質問の回答はAIチャットに移行するため、ユーザーがリンク先へと訪問する場面は減るでしょう。

BingとSGEのどちらも、最初にAIが検索結果をまとめて、読みやすい文章で回答します。単純な検索なら、この文章だけでユーザーが満足する可能性は高いと思われます。そのため、検索結果で示されたリンク先のウェブサイトを訪れることなく、検索を終了するユーザーが増えそうです。ただし、生成AIで問題となっているハルシネーションについては、BingもSGEも、まだ完璧に抑えられる段階には至っていません。したがって、AIが生成した検索結果については、ユーザー自身がその内容を確認しなければならないでしょう。

現状ではBingもSGEも、回答に関する情報源をインターネット上から参照した場合、リンク先のウェブサイトの情報に間違いがあれば、回答内容にも間違いが反映されます。このため、AIによる回答の情報源の確認ができることは、AIを利用した検索サービスにおいて必須の機能となっています。

どちらのサービスを利用しても、AIによる文章やチャットによって、サービス上だけで満足できる情報が得られる場面が増えます。今までユーザーが情報を得るために行っていた、検索結果で表示されたリンク先のウェブサイトを訪問しながら、コンテンツの中身を確認する作業は減少していきそうです。

検索方法の変化が、ウェブサイトの役割を変える

BingやSGEなど、対話型AIを利用した新しい検索スタイルは、ウェブサイトにどのような影響を与えるのでしょうか。

AIを活用した新しい検索スタイルは、自然言語で直接質問できるため、より高度で効率的な検索が可能となります。ユーザーがキーワードを複数入力して、表示された関連リンク先を上から順に一つひとつ確認しながら、欲しい情報を手に入れるという方法は、面倒なものとなるでしょう。

AIを使った検索では、ウェブサイトの持つコンテンツを直接参照して回答します。この場合、ウェブサイトの表示はされないため、広告モデルのような「ページビュー数に応じた報酬」は成立しません。ウェブサイトは、AIの回答に必要な「データの供給先」という役割を担うことになります。

AIによる検索の回答であっても、その内容には正確性と信頼性が求められます。AIがインターネット上で公開されているコンテンツを検索で参照する場合には、正確な情報を提供するウェブサイトが必要不可欠です。質の高い情報の提供者が存在しなければ、AIの検索は提供できません。

世界新聞・ニュース発行者協会(WAN-IFRA)などの世界の報道・メディア団体は「Global Principles for Artificial Intelligence(人工知能のグローバル原則⁠⁠」を公表するなど、AIの開発においても、事業者が質の高いコンテンツを継続的に作成できるよう、知的財産の保護や透明性の確保などを求めています。

またマスコミや出版社からは、すでにAIの回答に必要なコンテンツを提供しているため、⁠⁠⁠AIによるデータ利用料が支払われるべきだ」との意見も出ています。米国の新聞社ニューヨーク・タイムズは自社の記事をAIの学習に無断で使用することを禁止することを盛り込むなど、対策する事例も出始めています。

今後、ウェブサイトがAI検索における「データの供給先」になるとすれば、ウェブサイト側も特定の検索サービスだけに独占的にデータを提供したり、検索で利用された回数や頻度に応じた料金をユーザーに求めたりすることも十分に考えられます。

ウェブサイトの役割が「ユーザーが閲覧するもの」から「検索に対するデータを提供するもの」へと変化すれば、ウェブサイトの持つデータの価値が重要視されます。その結果、広告ビジネスモデルの再構築だけでなく、ウェブサイトの運営方法や、検索サービスとの力関係にも大きな変化が訪れるでしょう。

大規模言語モデルの未来とこれから

近年、大規模言語モデルはマルチモーダル化が進み、文字だけでなく、画像や音声といった複数の情報から状況を判断して処理が実行できるようになりました。これは、AIが人間と同じように「視覚」「聴覚」を備えることを意味します。

視覚と聴覚による判断が可能になれば、文字による指示だけでなく、人間の発する音声からの指示や、カメラから得た映像や画像から、タスクを実行できます。これにより、あらゆるサービスやソフトウェアへとAIが統合され、より高度なハードウェアの制御も可能になります。

人間の判断に近い高度なタスクが可能になれば、社会の幅広い分野へと使用範囲が拡大していくことが容易に想像できます。そのため、今後の世界で、大規模言語モデルは、あらゆる技術の土台となる可能性を秘めています。

Metaが開発した大規模言語モデル「Llama 2」。研究・商用利用が可能で、パラメーター数の異なる3つのバリエーションを用意。会話用のLlama Chat、コード生成用のCode Llamaなど、特定の目的に特化したモデルもある
図

こうした中で、独自の大規模言語モデルを新たに制作しようとする動きも出てきました。将来の技術基盤となることが予想されるため、企業だけでなく、より大きな国家単位での、強力な大規模言語モデルの開発競争も始まっています。日本でも、NECが日本語の処理能力で世界トップクラスの性能を持つ大規模言語モデルを開発するなど、パラメーター数を抑えた小型のモデルが登場しています。

モデルのサイズが小さいことで、学習時間が少なくてすむことや、追加学習やカスタマイズがしやすいという利点もあります。開発コストの面からも、日本では日本語処理に特化したコンパクトな大規模言語モデルが、企業を中心とした実際の業務などに利用されていくでしょう。

Googleが発表した次世代言語モデルPaLM 2。すでにGmailなどを含む25の製品で採用され、4サイズのモデルを提供。最小モデルGeckoは、スマートフォンなどのモバイル端末で動作し、オフラインでの利用も可能

モデルの小型化が進めば、スマートフォンのような個人デバイスでも動作します。こうしたエッジデバイスでのAIの利用を見据えて、半導体製造企業の中には、新しい製品開発への投資を始めたところもあります。データのプライバシーが守られながら、個人に最適化された大規模言語モデルが使える時代がもうすぐ来るでしょう。

大規模言語モデルの柔軟性を考え始めると、可能性は限りなく、これから応用範囲がどこまで広がっていくのかは想像もできません。このため、急速な利用拡大による経済や雇用、教育などの問題を危惧する動きもあり、世界各国でAIの利用基準を決めようとする流れも出てきています。

それでも大規模言語モデルは、現在解決できない教育や医療などの社会的問題の解決や、人々の生活を豊かにする新たなコンテンツやサービスを生み出す可能性を秘めています。誰もが安全にAIを使いこなせる時代が来たとき、人間の持つ能力が有効に活用され、社会に大きな変革がもたらされることを期待しています。

おすすめ記事

記事・ニュース一覧