web-dev-qa-db-ja.com

GAでのセッションの二重カウント?

GAデータで、紹介トラフィックのコンバージョンが3の倍数になっている)で奇妙なことがわかります!また、一部の紹介サイトでは、ユーザー数はセッションとまったく同じです。その自然なものか何かが間違っているかどうか確認してください!これもメールソースから見ています。 enter image description hereenter image description here

1
chicgirl

これは、データサンプリングの効果のように見えます。セグメントを適用するか、セカンダリディメンションを追加すると(後者の場合は一部例外があります)、GAは500000セッションのランダムサンプルを使用して(無料アカウントレベルで))メトリックを計算します。実際のデータの一部を使用し、数値にスケーリング係数を掛けると、繰り返しの値が表示されます。繰り返しの値は、正確なメトリックを調べていないことを思い出させるものです。

たとえば、サンプリングレートが33%の場合(つまり、50万セッションがそのビューの日付範囲の合計セッションの33%だった場合)、GAはその50万のセッション数をカウントします各リファラーについて、次に各値に3を掛けて全体を推定します。したがって、レポート内のすべての値は3の倍数になります。サンプルに、特定のリファラーとのデータセット全体と比較して不釣り合いに多数のセッションが含まれる場合、サンプリングされた数は実際の数よりも大きくなり、同様に過小数になる可能性があります。

レポートタイトルの横にあるバッジを確認すると、サンプリングの効果が表示されているかどうかを確認できます。緑の場合、サンプリングは行われません。黄色の場合、バッジ(またはその他の警告)にカーソルを合わせると、サンプリング(またはその他の警告)が表示され、レポートデータの推定に使用されているセッションの割合がわかります。

サンプリングが適用されるタイミングとその効果の詳細については、Googleのドキュメント データサンプリングについて をご覧ください。

Googleアナリティクス360にアップグレードすると、可能であれば問題が解決する可能性が高くなります。問題はまだサンプリングの対象ですが、サンプルは1億セッションであるため、ほとんど効果がありません。また、セグメントが適用されていない標準レポートはサンプリングされないため、その方法でデータを取得できる場合は、任意の日付範囲の実際の数値を取得できます。

正しい数値を表示するためにセグメントまたはセカンダリディメンションが必要な場合、私が知っている唯一の回避策は、複数の短い日付範囲からデータをエクスポートすることです-サンプリングの影響を受けないほど短い-スプレッドシートにもう一度まとめて戻す。もちろん、CSVまたはExcel形式にエクスポートするか、Python、PHP、またはJavaを使用して手動でこれを行うことができます。 Core Reporting API を使用してデータをプルダウンできます。

「完全に手動」と「主に自動化」の間にGA Googleスプレッドシート用のアドオンがあります。これもAPIを使用しますが、使用するプログラミング言語を知る必要はありません試してみたい場合は、 Google AnalyticsアドオンのドキュメントDimensions&Metrics Explorer を使用して、ディメンションとメトリックのAPI名を取得する必要があります。 。

もちろん、手動による解決策が実用的であるか、プログラムによる解決策が時間と労力に値するかは、特定の状況に依存しますが、それらは私が知っているオプションです!

1
Reve