web-dev-qa-db-ja.com

コアレポートAPIデータとは大きく異なるGoogleアナリティクスウェブデータ

Google AnalyticsのコアレポートAPIを使用して、ダッシュボードに表示されているデータとまったく同じデータを取得しようとしています。ただし、同じ期間とメトリックでもデータがこれほど異なる理由を理解していないようです。

私のWeb UIから、これはダッシュボードの私のテーブル構造です。

**Display the following columns:**
Dimension: Month of Year
Metric: Pageviews
**Filter this data:**
Only show **Page** containing "/blog/"

そして、これは2013年9月26日から12/26/2013までの期間に私のWeb UIに見られるものです:

Month of Year   Pageviews   
201312           151,502
201311           136,856    
201310           183,555    
201309            22,689

スクリプトでは、まったく同じメトリックを使用します(WebメトリックとAPIメトリックの命名規則の違いを除く)。

dimensions = ga:yearMonth
start-date = 2013-09-26
start-index = 1
metrics = [u'ga:pageviews']
filters = ga:pagepath=@/blog/
end-date = 2013-12-26

そして、これは私が見るものです:

Rows:
201312  148626
201311  160769
201310  154770
201309  16099

レポート情報:

Contains Sampled Data = False
Kind                  = analytics#gaData
ID                    = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Self Link             = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26

Pagination Infos:
Items per page = 1000
Total Results  = 4

ご覧のとおり、データ形式は正しいですが、内部のデータは間違っています。さらに悪いことに、データの傾向が異なります。

1
jxn

実際、これはかなり良いです。あなたの数字はかなり近いです。最後に、私のシステムの統計から、Google Analyticsの約4倍のヒットが得られます。

今...なぜ矛盾?多くの要因がありますが、これらはこの時点で私が考えることができるものです:

  • あなたとあなたのクライアントの間にキャッシュがあり、Google Analyticsはヒットをすべてカウントします。ヒットしないのでシステムはカウントしません。
  • システムは304を返すことができ、それらをヒットとしてカウントしない場合があります。
  • システムは、すべてのスパイダーからのヒット(つまり、googlebotヒット)を含むすべてのヒットをカウントします。 Googleアナリティクスは多くのスパイダーを知っており、ヒットをカウントしません。
  • サーバーはサーバーにヒットするため、システムはハッカーのアクセスをカウントしますが、ハッカー(ウェブスパマーなど)はJavaScriptコードを実行しないため、Googleアナリティクスはカウントしません。
  • Goole AnalyticsはHTMLページからのヒットのみをカウントします。サーバーは、カウントされる他のデータ(PDFファイル、画像など)をサーバーに提供する場合があります。
  • Googleアナリティクスでは、ウェブサイトを閲覧する訪問者と「リピーター」のカウントも異なります。ほとんどの場合、CMSは同じ方法で把握しません。
1
Alexis Wilke

Pythonで生成されたレポートとgoogleが提供するWebツールを比較して、私は(私が考えていた)同じ質問をしました。違いは、Webツールがサンプリングを使用しているためだとわかりました。

「このレポートは96,693セッション(セッションの92.19%)に基づいています」

あなたは実際にはウェブツールでより高い1つのデータポイントを持っています...それを説明できません:)

1
Ben Griffin