directの中身が見えない——検索だけでは説明できないトラフィックをどう読むか

以前、UTMパラメータの適切な運用でdirectを減らす方法を書いた。今回はその先——UTMでは対処できないdirectの話をする

サーチコンソールとGA4のあいだにある「差分」

あるサイトの28日間のデータを突き合わせたとき、明確なギャップが浮かんだ。

  • Google Search Console(GSC)のクリック数:96
  • GA4のセッション数(自己アクセス・not set除外):277

差分は181セッション。全体の65%が、Google検索では説明できない流入だった。

Yahoo!オーガニックを加えても検索経由は101セッション。残りの176セッションは検索以外のどこかから来ている。

内訳を見ると、SNSでもない

参照元を展開するとこうなる。

流入元セッション構成比
Direct / (none)11742%
Google + Yahoo 検索10136%
X(t.co)197%
Facebook系104%
AI系(ChatGPT, NotebookLM等)31%
その他2710%
mare interno LLC調べ。無断転載を禁ず

検索が4割弱、SNSが1割強。そして最大チャネルはdirect(直接流入)の42%

SNSの19セッション(X経由)は、自分自身が積極的にポストした結果であり、いわば「撒いた分がそのまま返ってきた」数字に過ぎない。しかも現在のXやFacebookは、外部リンクを含むポストのインプレッションを大幅に絞る仕様になっている。SNSを集客チャネルとして期待すること自体が構造的に難しくなっている。

Directの中身が見えないという問題

では、全体の42%を占めるDirect流入の正体は何か。

Directには以下のようなアクセスが混在している。

  • ブックマークやURL直接入力(いわゆる本来のdirect)
  • メールやチャットツールからのリンククリック(referrerが落ちるケース)
  • AI検索サービスからのアクセス(referrerを送出しないもの)

3つ目が問題だ。AI検索サービスごとにreferrerの扱いが異なり、状況は複雑になっている。

PerplexityやChatGPT(デスクトップ版)はreferrerを渡すため、GA4上で参照元として識別できる。ChatGPTのモバイルアプリや一部のAIエージェントはreferrerを送出せず、GA4上はdirectとして記録される。

そしてGoogle AI Modeはまた別の問題を抱えている。AI ModeからのクリックはSearch Consoleにもカウントされ、GA4にはgoogle / organicとして記録される。つまりdirectには落ちないが、通常のGoogle検索クリックと区別がつかない。「AI Modeの回答を見てクリックした人」と「通常の検索結果からクリックした人」が、データ上は同じgoogle / organicに混ざっている。

今回のデータでも、GA4にセッションがあるのにGSCのクリック数がゼロ——つまりGoogle検索からは一切来ていないページがいくつかあった。

中でも興味深いのは、英語で書いたAI検索行動に関する記事だ。GSCクリックはゼロ、SNSからの流入もゼロ。にもかかわらず、directで来た1セッションのエンゲージメント時間は137秒——2分以上かけて読み込まれている。

英語の専門記事にdirectで辿り着いて2分以上読む人が、ブックマークやURL直接入力で来たとは考えにくい。AI検索の回答にURLが表示され、それをコピーして開いた——あるいはreferrerを送出しないAIサービスからのクリック——と考える方が自然だ。だが、GA4上はあくまで「direct」としか記録されていない。

個別追跡の限界と、波で読むという発想

ここで発想を変える必要がある。

前述の通り、AI検索サービス側もreferrerを渡す方向に動いている。PerplexityやChatGPT(デスクトップ版)からのクリックはGA4上でreferralとして識別できるようになった。この流れ自体は歓迎すべきことだ。

しかし、それだけでは全体像は見えない。ChatGPTのモバイルアプリ経由はdirectに落ち、AIの回答からURLをコピーしてブラウザに貼り付ける行動もdirectになる。Google AI Modeからのクリックはgoogle / organicに混ざって通常の検索と区別がつかない。referralとして見える分だけを「AI経由トラフィック」として集計しても、それは氷山の一角に過ぎない。

では、どうするか。

ひとつの手がかりになるのが、AIクローラのアクセスログだ。

AI検索サービスがサイトのコンテンツを回答に引用するためには、事前にそのページをクロール(取得)している。このクロールはGA4には記録されないが、サーバーやCDNのログには残る。

もし、あるページへのAIクローラのアクセス頻度が上昇した時期と、そのページのDirectセッションが増加した時期に相関があるとしたら——それは「AIに引用されたことがサイト流入につながっている」という因果の手がかりになるかもしれない。

これは個別セッションを追うのではなく、時系列の「波」の重なりで関係性を読むという考え方だ。マーケティング・ミックス・モデリング(MMM)が広告投下量と売上の波の相関から効果を推定するのと同じ発想で、AIクロールの波とDirectセッションの波を重ねて見る。

まだ答えは出ていない

正直に言えば、これはまだ仮説の段階だ。

Directの42%がAI経由なのかどうかは、現時点では断定できない。AIクローラのアクセス頻度とDirectセッションの相関があるかどうかも、十分な期間のデータがなければ検証できない。こうした時系列の相関分析は、少なくとも1年以上のデータ蓄積があって初めて意味を持つ。

ただ、ひとつ確かなことがある。全体の42%を占めるdirectの中身が、現状ではほとんど見えていないということだ。そしてその中に、referralとしては捕捉できないAI経由のトラフィックが含まれている可能性は高い。

それを可視化するためには、GA4だけでなく、CDNやサーバーのログからAIクローラの動きを計測し、時系列で蓄積し、波として読む仕組みが必要になる。

計測できなければ、施策は打てない。まずは波を捉えるところから始める必要がある。

※本記事の数値は、あるひとつのサイトの28日間のデータをもとにしたものです。サイトの規模や業種、流入構造によって構成比は大きく異なります。