Cloudflareは2026年7月1日、AIボットによるWebコンテンツ利用を用途別に制御し、AI検索での利用やエージェントによるWebページ・
Cloudflareは2025年のContent Independence Dayで、AI企業が報酬なしにWebコンテンツをクロールする状況に対し、サイト運営者がAIクローラーをブロックしたり、有料アクセスを設定したりできる方針を示していた。今回の発表では、
One year after declaring Content Independence Day, a dynamic market for monetized content has emerged. In this report, we examine how the rise of autonomous AI agents is upending traditional search referrals and detail the new infrastructure required to support a sustainable web…
— Cloudflare (@Cloudflare) July 1, 2026
Search・Agent・Trainingに分けてAIトラフィックを制御
新しいAIトラフィック制御では、AI関連の自動アクセスを大きく
これにより、Cloudflareの全顧客はFreeプランを含め、AIトラフィックを用途ごとに管理できるようになる。2026年9月15日には新しいデフォルト設定も導入する予定で、新規にCloudflareへオンボードするドメインでは、広告が表示されるページでTrainingとAgentをデフォルトでブロックし、Searchはデフォルトで許可する。ここでいう広告が表示されるページは、広告枠を含み、人間の訪問や広告表示が収益につながるページを指す。Cloudflareは、そうしたページでは人間による閲覧を前提にしているとして、TrainingやAgentによるアクセスを別扱いにする考えを示している。
あわせて、SearchとTrainingなど複数の目的を兼ねるクローラーを、複数の分類に基づいて判定する方針も示した。たとえばサイト運営者がTrainingをブロックしている場合、Search目的も持つクローラーであっても、Trainingの分類に該当するなら最も制限の強いルールが適用される。Cloudflareは、その例としてGooglebot、Applebot、BingBotを挙げている。
Enterprise Bot Management向けには、確認済みボットやエージェントの分類をダッシュボード上で確認できる
さらに、robots.use=immediate、use=reference、use=fullを追加してテストする。use=immediateはボットがコンテンツとやり取りしても保存・use=referenceは索引化、抜粋、リンクバックまでを許容すること、use=fullは要約や再生成まで含めて許容することを示す。
Cloudflareが管理するrobots.search=yes,ai-train=nouse=referenceが追加されるという。たとえば、Cloudflareが管理するrobots.
User-agent: *
Content-Signal: search=yes,ai-train=no,use=reference
Allow: /
Content Signalsはアクセス制御そのものではなく、サイト運営者が望むコンテンツ利用範囲をrobots.
非人間トラフィックが過半に、AI学習目的のクロールが拡大
同日に公開された
トラフィック全体でも、50%超が非人間によるものになったとしている。Cloudflareが目的別に識別したクローラーリクエストのうち、AI学習向けの割合は2025年春の22%から2026年6月には52%へ増加した。クローラー活動全体では、Search、Agent、Trainingなどを兼ねる混合用途のクローラーも36%超を占める。一方、純粋な検索向けクロールは、サイトの発見可能性にとって重要であり続けるものの、全体に占める割合は小さく、減少しているとしている。
こうした変化は、検索エンジンにクロールを許可する代わりに参照トラフィックを受け取るという従来のWebの経済モデルを揺さぶっている。Cloudflareによると、報道機関やメディア企業が早く影響を受け、現在は小売、ソフトウェア、IT、金融にも同様の動きが広がっているとみている。特にクロールが多いカテゴリでは、人間によるトラフィックが1年未満で最大40%減少したという。
Googleについては、参照トラフィックの約88%を占める一方で、検索による発見とAI体験でのコンテンツ利用をサイト運営者が切り分けにくい点を課題として挙げた。Cloudflareは、Googleが検索とAI用途を兼ねる混合用途のクローラーを使っているため、サイト運営者がGoogle検索で見つけられる状態を保とうとすると、GoogleのAIエコシステムへの参加も切り分けにくくなるとみている。なお、Google公式ドキュメントでは、Google-Extendedはrobots.
AI検索向けシグナルを検証、Pay Per Useの実験も
Cloudflareは、AI検索をより効率よくするための研究プログラムも開始する。同社は、Web全体の20%超がCloudflareのネットワークの背後にあるとしており、コンテンツの鮮度、品質、変更有無、トラフィックの流れといったシグナルを、参加する検索・
狙いは、回答エンジンが鮮度の高いコンテンツや質の高いコンテンツを見つけやすくすることと、不要な再クロールを減らすことにある。Cloudflareのデータでは、良性ボットによるクロールトラフィックの50%超が、変更されていないページの再取得に使われているという。ページが変わっていないことを示すシグナルを利用できれば、AI企業側は計算資源を節約でき、サイト運営者側も不要なリクエストの処理負荷を減らせる。
このプログラムは検索・
あわせて、2025年に発表した
x402対応のMonetization GatewayでWebページやAPIに利用ごとの課金を設定
収益化の範囲は、クローラーや検索結果にとどまらない。Cloudflareは、Cloudflareで保護されたWebページ、データセット、API、MCPツールなどのリソースに対して、利用ごとの課金を設定できる
Monetization Gatewayは、支払いポリシーとアクセス制御を単一のコントロールプレーンで管理し、支払いの検証と適用をエッジで実行する。初期段階では、HTTPの402 Payment Requiredを利用するオープンプロトコル
計画中の機能として、特定のRESTメソッドやURLパスへのリクエスト課金、画像生成や大規模データ処理のように計算量が変わる処理への可変価格、認証されていない呼び出しだけに402応答を返す設定などが挙げられている。こうした支払い・
Attribution Business Insightsでボット利用を可視化
関連する同日発表として、Cloudflare Bot Management顧客向けに
Cloudflareは、AIクローラー対応をセキュリティ担当者だけの問題ではなく、出版社やコンテンツ事業者の事業判断に関わる問題と見ている。どのボットが参照トラフィックなどの事業上の価値をもたらし、どのボットが負荷だけを生んでいるのかを把握できれば、ライセンス交渉やアクセス制御の判断材料にできるとしている。
今回の一連の発表は、AIクローラーを拒否する段階から、用途別制御、可視化、利用単位の課金へ軸を広げるものといえる。