GA4の5大数字がズレる原因~GA4で数字がズレるのは仕様

GA4では、基本的に数字は推定値であったり、レポートとデータ探索ではズレたりと、公式ヘルプにも書いてありますが、「100%厳密で正確なアクセス数」を出すことはありません。本当に正確な数字を知りたいと思ったら、BigQueryを使うのが基本です。ですので、GA4を使う時、まず大事なことは、どこで数値がズレるのかを把握することです。

GA4を使うときには、まずこの学習コストの予算を確保しておきましょう。

GA4のデータ探索とレポートで数字がズレる

>>[GA4] レポートとデータ探索におけるデータの違い – アナリティクス ヘルプ

レポートとデータ探索では、データが提示される視点および粒度が意図的に異なっています。たとえば、レポートに使用できるディメンションおよび指標の一部は、データ探索ではサポートされていません。サポートされていないフィールドが含まれるレポートを、データ探索ツールで開いた場合、それらのフィールドはデータ探索から除外されます。

意図的にデータの粒度が異なっているとのことです。

GA4の標準レポートでは行数上限がかかる

>>[GA4] 行数の上限 – アナリティクス ヘルプ

標準レポートでは、レポートに必要なデータのみが入力されたカスタム データベース テーブルを使用します。こうしたテーブルの行数の上限は、ほとんどの標準レポートで 50,000 行です。
レポートにセカンダリ ディメンションもしくは比較を適用すると、データが「(other)」行に集約される可能性が高くなります。

標準レポートでは5万を超えるデータは、otherがかかる、というわけです。

GA4はそもそもが推定値

>>[GA4] アナリティクスのセッションについて – アナリティクス ヘルプ

アナリティクスでは、ユニーク セッション ID の数を推定することで、サイトまたはアプリで発生したセッションの数を算出します。
セッションとユーザーに関する指標は、推定値に基づいて算出されます。

本当に正確な値はBigQueryに出さないとわからない、ということです。BigQueryで、推定値を算出する関数があるのですが、それをBigQueryの正値にかけると、だいたいGA4の数字と近くなるようです。

プロが教えるいちばん詳しいGoogle アナリティクス 4 | NRIネットコム株式会社, 神崎健太

Looker StudioとGA4で数字がズレる

>>【GA4導入後に知っておきたい】標準の「レポート」とGoogle データポータルの数字がずれるのはなぜ? 具体的な解決策は?|イー・エージェンシー

GA4の場

  • 合は、標準レポートやAPIがデータを取得するのは集計済みの表から、探索レポートがデータを取得するのは未処理のデータからとなります。
    Looker StudioはAPI経由でデータを受け取るため、標準レポートと同じ集計済みの表からデータを取得します。
    つまり、探索レポートとLooker Studioでは参照しているデータが異なるため、数字のずれが発生しやすいのです。

    Looker Studioと、GA4の探索レポートとは、もともと見ているデータが異なるので、数字がズレる、というわけです。

    合計値は下の数字の合計ではない

    GA4合計値

    上図は、GA4の標準レポートの、ライフサイクル>エンゲージメント>イベント、のメニューのデータです。イベント数こそ合計数は合っていますが、総ユーザー数が明らかに、合計ではないことがわかります。

    これについて、公式に解説しているページがなく、他にもこうした、合計値が丸められているレポートがあります。

    上図もユニークユーザー数なのか、と想像もできそうものですが、本当のところはわからないのですよね・・・。

    GA4はそもそもサンプリングもしやすい

    UAでは、一回ページビューがあると、ビーコンは基本、1度しか飛びません。

    しかし、GA4の場合例えば初回訪問であれば、以下のようなビーコンが飛びます。4回もビーコンが飛ぶのです。

    • first_visit
    • session_start
    • page_view
    • user_engagement

    さらには、拡張計測機能も基本的にはほぼオンになっているでしょうから、page_view以外のビーコンもUA以上にはるかに多く飛びますので、サンプリングがよりかかりやすくなる、というわけです。データ量が膨大になれば、前述の(other)も出やすくなるでしょう。

    ですので、わたしは拡張計測機能もクリック以外はオフにしています。だいぶサンプリングが出なくなりましたが、ほんとうに厄介です。たくさん計測していたときは、分析期間をデイリーにしてもサンプリングされてましたから、わけがわかりません。何のためにGA4を入れているのか、泣きたくなりました。

    ・ ・ ・ ・ ・

    このようにして、GA4では数値がズレることが当たり前ですので、レポートを作るときにも、だいたいの傾向を追うツールであると認識して、GA4は使うことがおすすめです。

    また前述の、合計値が異なる件では公式に規則性は明かされていません。そうした現状どうしようもないGA4の数字のズレは、現存し付き合うしかないというのが現状です。

    ただこういう問題って、UAの頃からあったことはあったのですが、今って、こうした数字をシビアに見るエンタープライズや業界の方が、GA4はデータ取得のみにつかって、実際の分析や効果測定は、BigQuery&Tableauなど他ツールで済ませているというのがあって、なかなか知見がUAの頃のようにたまらないことも、モヤるところですよねー。

    ですので、仕様に関しての詳しい法則性やドキュメントがわかる人、いたらぜひお教え下さい。

    ・ ・ ・ ・ ・

    >>安っ!アマゾンで半額以下になっている食品タイムセール
    セール特設ページを見る

    ↓↓↓無料のニュースレターを配信中です

    GA4ズレる


    PS Google Optimize、サポート終了予告が発表されましたね。GAFAM全体でレイオフが進むなか、GA4などこうした無料ツールはどんどんとサスティナビリティ(継続性)のリスクが高まりますね。。。他に良いツールが出てきてほしい。