web-dev-qa-db-ja.com

コンテンツの重複を防ぐために、リバースプロキシで提供されるコンテンツから301リダイレクト

現在、リバースプロキシに起因する問題の解決に苦労しています。 page.example.comからexample.com/page/にリバースプロキシを実行しています。この元のサブドメインコンテンツはUnbounce.comから生成され、サブドメインに添付されます。

問題:SEOの理由から、サブドメインをサブディレクトリに移植する必要があります。リバースプロキシはうまく機能し、サブドメインをサブディレクトリに適切に移植します。現在の問題は、Googleでpage.example.comがまだインデックスに登録されていることです。サブディレクトリのみがインデックスに登録されるように、301リダイレクトをインストールしたいと思います。 page.example.comのコンテンツに直接アクセスできないため、htaccessファイルを配置してそのトラフィックをリダイレクトすることはできません。アンバウンスも「トラフィック」に基づいて課金され、リバースプロキシは追跡情報を破壊します。

301を配置すると、追跡情報は新しいURL構造にプッシュされ、再び機能するはずです。

誰かが私を正しい方向に向けることができれば、それは素晴らしいことです。

5
Joe Roberto

SEOの理由により、サブドメインをフォルダーに移動する必要はありません。サブドメインのコンテンツは、SEOの観点から見れば非常に効果的です。参照: サブドメインはSEOを助けますか、SEOを傷つけますか?

プロキシされたページから301リダイレクトを発行することはできません。プロキシが正常に機能するには、これらのページが稼働している必要があります。 page.example.comが301リダイレクトを発行すると、リバースプロキシはコンテンツにアクセスできなくなります。

考えられる解決策はいくつかあります。

  1. meta link rel canonical tags を実装します。これらのタグをpage.example.comで提供されるページに配置し、example.com/pageを指していた場合、Googleは正しいことを行います。重複したコンテンツがあり、優先URLはサブディレクトリであることをGoogleに伝えることになります。 301リダイレクトとは異なり、メタタグはリバースプロキシが正常に動作することを妨げません。
  2. サブドメインの名前をxyzzy.example.comなどの別の名前に変更し、代わりにそこからリバースプロキシします。その後、page.example.comは404になり、Googleインデックスから外れます。 Googleは最終的に新しいサブドメインも検出するため、将来同じ問題に再度対処する必要があるかもしれません。
  3. サブドメインでrobots.txtを使用して、Googleがクロールしないようにします。それでも、リバースプロキシがサブドメインをクロールできるようにする必要があります。最終的にページはほとんどインデックスから外れます。サブドメインの変更と併せてrobots.txtを実装できます。その場合、Googlebotは新しいサブドメイン名のインデックスを作成しません。
  4. 301リダイレクトを実装しますが、コンテンツがプロキシされていない場合のみです。ホストは、ユーザーエージェントまたはその他のヘッダーによるリバースプロキシ要求を識別するコードを挿入する必要があります。これらのリクエストのコンテンツを提供しますが、それ以外の場合は301リダイレクトを発行します。
  5. コンテンツをサブドメインに常駐させ、サブディレクトリをそれにリダイレクトします。
1