web-dev-qa-db-ja.com

Googleによってインデックス化されたcdn.domain.com。コンテンツは重複コンテンツと見なされています

CodeIgniterフレームワークでWebサイトを実行しています。 Googleによってインデックス付けされているcname cdn.domain.comを使用してcdnをセットアップしました。また、domain.comとcdn.domain.comの両方のコンテンツは同じコンテンツであり、重複した結果のランキングの問題と見なされています。私は開発者に連絡しようとしましたが、彼は助けることができませんでした。このような問題を回避する方法があることを願っています。

4
FlourishDNA

ドメインとURLの重複は、検索エンジンによって発明されたrel canonicalと呼ばれるヘッダーメソッドを使用して簡単に回避でき、重複したコンテンツがインデックス内で最終的にランキングに影響するのを防ぎます。

DKOATEDが示唆したように、これらのURLを削除するためにCDNをウェブマスターツールに追加できますが、削除した後にインデックスが再作成されることで解決する可能性があります。

ページでrel canonicalを使用することで、検索エンジンにMASTERページを伝えているので、たとえば、ページBというラベルが付けられ、次のような多くの方法でアクセス可能なページがあるとします。

domainname.com/?=pageB/ domainname.com/PageB/ domainname.com/catagory/media/pageB/ cdn.domain.com/PageB/

を使用して

<head>
<link rel="canonical" href="http://domainname.com/PageB/" />
</head>

これは、/ PageB /がマスターページであり、他のURLでアクセス可能な他のページが検索エンジンによってインデックス付けされないことを検索エンジンに通知します。これは断然最良の方法であり、あなたが抱えている問題を取り除くために導入されました。 Wordpressなどのブログには、作成者やタグなどがアクセスできるページが多くあり、Joomlaも同様に多くの複製を作成しているため、このタグが登場してこの問題を解決しました。

WordpressなどのCMSを使用している場合、Joomlaの場合はAceSEFまたはSH404SEFの場合、これを行うYoast SEOをお勧めします。他の何かまたは静的なサイトを使用している場合は、それらを手動で配置するか、プロセスを実行するために自動化されたものを探す必要があります。

ドメインを確認したら、ウェブマスターツールから手動で削除するようにキャノニカルを設定したら、CDに.html確認ファイルをアップロードするだけで、Googleはこの情報を提供します。

Robots.txtをCDNで使用できますが、画像にインデックスを付けたいので、これが直接ミラーでない場合は有害になる可能性があるため、htmls/phpなどのみをブロックしてください。

1
Simon Hayter

googleによるインデックス作成を希望しない場合は、cdnディレクトリにDisallow:/を追加する必要があります。

または、Googleウェブマスターツールを使用してGoogleインデックスを削除できます。

ただし、最初にcdnドメインをGoogleウェブマスターツールに追加します。

0
ahmetlutfu