web-dev-qa-db-ja.com

Googlebotを許可したまま、米国にいる訪問者をブロックするにはどうすればよいですか?

規制および法的問題のため、米国を拠点とする訪問者が当社のウェブサイトにアクセスすることは許可できません。このため、米国内のすべてのトラフィックを専用のページにリダイレクトします。

これらの制限はありますが、当社の(金融)製品は完全に合法であり、ヨーロッパ、中東、およびアジアの他の国で規制されています。

クローキングとは見なされたくないため、すべてのIP(人間とボット)をリダイレクトします。

私が最も理解している限りでは、GooglebotのIP範囲はすべて米国からのものです。したがって、私の質問は、米国以外のユーザーの利益のためにGoogleがWebサイトのインデックスを作成し、クローキング(またはクローキング後)を回避できるようにする方法です。 Googlebotは米国以外のIP範囲からアクセスできますか?望ましい行動方針は何でしょうか?

3
Daniel Sachs

GooglebotのIPアドレスは他の国にあります。 (おそらく不完全な)リストについては、次のリンクを参照し、そこにリストされている各IPアドレスをクリックして、その出身国を確認してください。

ボットとブラウザ-「+ http://www.googlebot.com/bot.html」のユーザーエージェントの詳細

IPブロックルールの除外として、これらのIPおよび他の場所にある他のIPを追加できます。ただし、米国ベースのIPアドレスをブロックした場合、それらの特定のIPアドレスがサイトをクロールするという保証はありません。

したがって、これを支援するには、Googleウェブマスターツールで米国以外の国のジオターゲットを指定する必要があります。詳細については、こちらをご覧ください: Geotargeting

国コードトップレベルドメイン (ccTLD)を使用すると、google.de(ドイツの場合)などのGoogle検索の国別バージョンにサイトがリストされ、サーバーでクロールされる可能性があります米国外にあります.

2
dan

米国のトラフィックをブロックしようとすると、Googleのインデックス作成で問題が発生する可能性があります。 Googlebotは主に米国からクロールします。

グーグルは言う

「Googleは現在、米国以外のIPアドレスから発生するクロールはありません。現時点では、米国からのみクロールします」

ソース http://www.youtube.com/watch?v=7paVYBgH0Hw

数年前にグーグルによってjavascriptソリューションが提案されました:

考えられる解決策の1つは、IPアドレスを検証し、サイトへのアクセスをブロックするJavaScriptベースのインタースティシャルを使用することです。サイト内でJavaScriptを使用する必要があると思いますか?その場合、ユーザーがJavaScriptインタースティシャルを選択的にブロックし、JavaScriptカジノコンテンツを許可する簡単な方法はありません。 JavaScriptがrobots.txtファイルで許可されていない外部ファイルにあると仮定すると、Googlebotはインタースティシャルを表示できず、通常どおりサイトをクロールできます。

ソース http://productforums.google.com/d/msg/webmasters/thqhs2Mrmtw/LdSu7vj8Oi4J

0
user29671