web-dev-qa-db-ja.com

StatCounterは、Apacheアクセスログよりもユニークユーザーの数が少ないのはなぜですか?

StatCounterは、昨日、私のサイトに10,611人のユニークビジターがいると表示しています。

昨日のApacheアクセスログで一意のIPアドレスの数を数えるスクリプトを書きました。 14,190個の一意のIPアドレスをカウントしました。

なぜ矛盾があるのですか?少数のIPアドレスがクローラーとボット用であっても、トラフィックの3分の1ではないことを理解しています。

// script to count unique IPs

<?php
$ips = array();

$file = fopen("access_log","r");
while ( ($line = fgets($file)) != false )
{
    $num = strpos($line, " ");
    $ip =  substr($line, 0, $num)."<br>";

    if ( !in_array($ip, $ips) )
        array_Push($ips, $ip);
}
fclose($file);

echo count($ips);

StatCounterコードは、StatCounterがHTML/JSに入れるために提供する標準コードで、アカウント番号などが含まれます。

1
Jake Wilson

他のユーザーの利益のために、サーバー側の統計とオンラインの統計の違いを最初に説明する:

Apacheアクセスログは、すべてのトラフィックを分析しますサーバーへ

StatCounterは、すべての訪問を追跡しますサイトへ

サーバーのトラフィックは、ロボット、スパムボット、クローラーなどからのすべての訪問を含むため、サイトよりもはるかに多いトラフィックを取得します。

ロボットがサイトにアクセスすると、サーバーログに記録されます。ページが完全に読み込まれていないため、「真の」訪問ではないため、StatCounterには表示されません。

そのため、サーバー側の統計(Apacheログファイルなど)は、オンラインの統計(StatCounterなど)と比較して常に膨らんで表示されます。一般的に、それはオンライン統計、人々が興味を持っている「本当の」訪問です-より多くの販売、より多くのサインアップなどを意味するかもしれないこれらの訪問です。管理。 Apacheログからボットとクローラーのヒットを除外する場合、残っているものはStatCounterの数値をほぼ反映するはずです。


さて、特定のケースに関連して、私たちの経験では、クローラーとボットからのトラフィックが30%増加することは珍しいことではありません。

また、StatCounterサマリー統計のUnique Visitorsは、IPアドレスではなくCookieに基づいていることを追加する必要があります。これにより、いくつかの違いも説明できます。

AOLの訪問者は、ページロードごとに異なるIPを持つことができるため、ページロードごとにIPベースの一意性が高くなります。 Cookieを許可しないORユーザーは、ページの読み込みごとにCookieベースの一意性を高めます。

StatCounterでは、訪問者のパスはIPアドレスを使用して照合されるため、より正確な比較が可能です。さらに支援が必要な場合は、ご連絡ください。

4

一意のIPアドレスの数をカウントすることは、ロボットを含み、日中に異なるIPの回数からサーバーにヒットするため、おそらく最良のアプローチではありません。

  1. サーバーでawstatsを使用します。これは、ロボットと実際のユーザーを明確に区別するため、トラフィックについての公正なアイデアを提供します。
  2. 実際、awstatsだけを使用すると明確な画像が得られない場合があります。javascriptを使用してユーザーを追跡するGoogleアナリティクスまたはstatcounterを使用することを常にお勧めします。 awstatsは一意のIPアドレスのみに依存して一意のユーザーを識別しますが、作業する数百人のオフィスのほとんどは発信IPアドレスを1つしか持たないため、statcounterやgoogle analyticsなどのjavascriptベースのトラッカーはCookieを使用して一意のユーザーを識別するため、ここでより信頼性が高くなりますユーザーのブラウザで。
  3. 実際には、3つのawstats、statcounter、およびgoogleアナリティクスのすべてを使用します。それぞれがさまざまなことに関する興味深い側面を提供するからです。ページの読み込みは私にとっては問題ではありません。別のJSファイルとしてタックするためのJavaScriptコードを含めましたが、HTMLには埋め込まず、クライアント側にキャッシュされます。
1
Deepesh Nandal

多くの理由がこの不一致を引き起こす可能性があります。例えば:

  1. 各アクセスをすぐにカウントするサーバー側のカウンターを使用します。 statcounterは、ページの読み込み後にアクセスをカウントするJavaScriptを使用します。そのため、一部のアクセスはスクリプトでカウントできますが、statcounterではカウントできません
  2. あなたのウェブサイトの種類は何ですか? phpBBやDrupalなどの人気のあるアプリケーションで作成されたフォーラムやブログでこの経験をしました
  3. スクリプトを置く場所と統計カウンターはどこにありますか?両方が同じページをカウントしていると確信していますか?
  4. ...
1