web-dev-qa-db-ja.com

Webサーバーのログファイルで空のリファラーフィールドが発生する原因は何ですか?

次のようなApacheからのログ行が与えられた場合:

xx.xx.xx.xx - - [04/Jan/2016:10:42:27 -0800] "GET / HTTP/1.1" 200 6861 "-" "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36"

リファラーの場所にある"-"の原因は何ですか?私はそれが情報が利用可能でなかったことを意味していると推測していますが、私はこれが何を引き起こすのか理解しようとしています。この訪問者がブラウザの場所フィールドに直接URLを入力したということですか?人間ではなくボットを示していますか?または、多分、質問は"-"を生成する可能性のあるさまざまなアクションは何ですか?

5
mix

これは、訪問者がリクエストのリファラーを送信しなかったことを意味します。次の場合に発生する可能性があります。

  • ユーザーは「直接」訪問者であり、ブラウザバーにURLを入力するか、ブックマークを使用しました。
  • ユーザーがブラウザの外部からリンクをたどった(たとえば、電子メールやモバイルアプリから)
  • ユーザーがセキュリティで保護されたhttpサイトからセキュリティで保護されていないhttpsサイトにアクセスし、セキュリティ上の理由でブラウザがリファラーを隠しました。
  • ユーザーがリファラーを送信しないようにブラウザーを変更しました(ブラウザー拡張機能を使用して情報を非表示にするなど)。
  • ユーザーは、リファラーヘッダーを削除するプロキシサーバーを使用しています。
  • クリックされたリンクには HTML5 rel=noreferrer 属性があります。
  • サイトはJavaScriptを使用してサイトにリンクします。 JavaScriptがwindow.openまたはlocation.hrefを使用してURLを開いたり設定したりする場合、多くのブラウザーはリファラーを送信しません。
  • ページはmeta refreshであなたのものにリダイレクトします 。ブラウザは、このタイプのリダイレクトで元のリファラーをリセットまたは削除します。
  • リファラー情報を送信するようにプログラムされていないロボットによって要求が行われました。 (Googlebotなどの正当なロボットでさえ、リファラーを送信しないことがよくあります。)

Googleアナリティクスでは、GA JavaScriptを実行し、明らかなロボットユーザーエージェントがない限り、リファラー以外のすべての訪問者を「直接」としてカウントします。これらの「直接」訪問者は、URLを入力する以外の何らかの理由でリファラーを送信しません。これは、 Grouponが誤って検索エンジンから脱落した 数時間のためです。この期間中、彼らはいわゆる「直接」訪問者のほとんどが姿を消すのを見ました。彼らは、Googleアナリティクスのほとんどの「直接」訪問者が実際に検索エンジンの紹介であると結論付けることができました。

8