web-dev-qa-db-ja.com

Google Scholarによる非学術コンテンツのインデックス登録を防ぐ方法

私はWordpressウェブサイトを持つ研究機関で働いており、そこで学術記事やイベント、賞、ニュースの更新などの他のコンテンツを公開しています。

プラグイン Kblogメタデータ を使用して、Google Scholarがアカデミックコンテンツをクロールし、正しくインデックス付けするようにします。

また、非学術コンテンツがGoogle Scholarによってインデックスに登録されるのを防ぎながら、「通常の」Googleクローラーがそれらのページをクロールしてインデックスを作成できるようにします。

Google Scholarがnoindexとして認識するメタタグを知っていますか?

または、代わりに、この目標を達成する方法について別のアイデアがありますか?

ウェブマスター向けGoogle Scholarガイドライン を読みましたが、この問題に関する情報は見つかりませんでした。

ありがとう。

2
Hanan Cohen

Google Scholarには独自のボットがないため、サイト全体のインデックス作成をブロックせずにボットをブロックすることはできません。

しかし、私はあなたが主題について心配するべきでないと思います。 Google Scholarは、インデックスを作成する傾向があります。つまり、GoogleScholarを移動して(アカデミック)コンテンツの一部をインデックスに登録するには、コンテンツを公開する価値があることを厳しく証明する必要があります。

最初の意味のあるアクションの1つは、 https://scholar.google.com/intl/en/scholar/inclusion.html#indexing のようなダブリンコアメタタグを実装することです。 Google Scholarにシグナルを送信するこの方法の1つです。これらの特別なメタタグを持つコンテンツは、公開される候補です。

暗黙的に、コンテンツwithoutDublin Coreメタタグは非アカデミックとして認識され、usualGoogleによるコンテンツusualGoogle、ただしGoogle Scholarによる学術的ではありません。

1
Evgeniy