GA4では、基本的に数字は推定値であったり、レポートとデータ探索ではズレたりと、公式ヘルプにも書いてありますが、「100%厳密で正確なアクセス数」を出すことはありません。本当に正確な数字を知りたいと思ったら、BigQueryを使うのが基本です。ですので、GA4を使う時、まず大事なことは、どこで数値がズレるのかを把握することです。
GA4を使うときには、まずこの学習コストの予算を確保しておきましょう。
この記事の目次
GA4のデータ探索とレポートで数字がズレる
>>[GA4] レポートとデータ探索におけるデータの違い – アナリティクス ヘルプ
レポートとデータ探索では、データが提示される視点および粒度が意図的に異なっています。たとえば、レポートに使用できるディメンションおよび指標の一部は、データ探索ではサポートされていません。サポートされていないフィールドが含まれるレポートを、データ探索ツールで開いた場合、それらのフィールドはデータ探索から除外されます。
意図的にデータの粒度が異なっているとのことです。
GA4の標準レポートでは行数上限がかかる
標準レポートでは、レポートに必要なデータのみが入力されたカスタム データベース テーブルを使用します。こうしたテーブルの行数の上限は、ほとんどの標準レポートで 50,000 行です。
レポートにセカンダリ ディメンションもしくは比較を適用すると、データが「(other)」行に集約される可能性が高くなります。
標準レポートでは5万を超えるデータは、otherがかかる、というわけです。
GA4はそもそもが推定値
>>[GA4] アナリティクスのセッションについて – アナリティクス ヘルプ
アナリティクスでは、ユニーク セッション ID の数を推定することで、サイトまたはアプリで発生したセッションの数を算出します。
セッションとユーザーに関する指標は、推定値に基づいて算出されます。
本当に正確な値はBigQueryに出さないとわからない、ということです。BigQueryで、推定値を算出する関数があるのですが、それをBigQueryの正値にかけると、だいたいGA4の数字と近くなるようです。
プロが教えるいちばん詳しいGoogle アナリティクス 4 | NRIネットコム株式会社, 神崎健太
Looker StudioとGA4で数字がズレる
>>【GA4導入後に知っておきたい】標準の「レポート」とGoogle データポータルの数字がずれるのはなぜ? 具体的な解決策は?|イー・エージェンシー
GA4の場
合は、標準レポートやAPIがデータを取得するのは集計済みの表から、探索レポートがデータを取得するのは未処理のデータからとなります。
Looker StudioはAPI経由でデータを受け取るため、標準レポートと同じ集計済みの表からデータを取得します。
つまり、探索レポートとLooker Studioでは参照しているデータが異なるため、数字のずれが発生しやすいのです。
Looker Studioと、GA4の探索レポートとは、もともと見ているデータが異なるので、数字がズレる、というわけです。
合計値は下の数字の合計ではない
上図は、GA4の標準レポートの、ライフサイクル>エンゲージメント>イベント、のメニューのデータです。イベント数こそ合計数は合っていますが、総ユーザー数が明らかに、合計ではないことがわかります。
これについて、公式に解説しているページがなく、他にもこうした、合計値が丸められているレポートがあります。
上図もユニークユーザー数なのか、と想像もできそうものですが、本当のところはわからないのですよね・・・。
GA4はそもそもサンプリングもしやすい
UAでは、一回ページビューがあると、ビーコンは基本、1度しか飛びません。
しかし、GA4の場合例えば初回訪問であれば、以下のようなビーコンが飛びます。4回もビーコンが飛ぶのです。
- first_visit
- session_start
- page_view
- user_engagement
さらには、拡張計測機能も基本的にはほぼオンになっているでしょうから、page_view以外のビーコンもUA以上にはるかに多く飛びますので、サンプリングがよりかかりやすくなる、というわけです。データ量が膨大になれば、前述の(other)も出やすくなるでしょう。
ですので、わたしは拡張計測機能もクリック以外はオフにしています。だいぶサンプリングが出なくなりましたが、ほんとうに厄介です。たくさん計測していたときは、分析期間をデイリーにしてもサンプリングされてましたから、わけがわかりません。何のためにGA4を入れているのか、泣きたくなりました。
・ ・ ・ ・ ・
このようにして、GA4では数値がズレることが当たり前ですので、レポートを作るときにも、だいたいの傾向を追うツールであると認識して、GA4は使うことがおすすめです。
また前述の、合計値が異なる件では公式に規則性は明かされていません。そうした現状どうしようもないGA4の数字のズレは、現存し付き合うしかないというのが現状です。
ただこういう問題って、UAの頃からあったことはあったのですが、今って、こうした数字をシビアに見るエンタープライズや業界の方が、GA4はデータ取得のみにつかって、実際の分析や効果測定は、BigQuery&Tableauなど他ツールで済ませているというのがあって、なかなか知見がUAの頃のようにたまらないことも、モヤるところですよねー。
ですので、仕様に関しての詳しい法則性やドキュメントがわかる人、いたらぜひお教え下さい。
・ ・ ・ ・ ・
>>安っ!アマゾンで半額以下になっている食品タイムセール
セール特設ページを見る
↓↓↓無料のニュースレターを配信中です
PS Google Optimize、サポート終了予告が発表されましたね。GAFAM全体でレイオフが進むなか、GA4などこうした無料ツールはどんどんとサスティナビリティ(継続性)のリスクが高まりますね。。。他に良いツールが出てきてほしい。