web-dev-qa-db-ja.com

Googleは、異なる言語に翻訳された重複コンテンツをどのように判断しますか?

別の言語で重複したコンテンツがどのように機能するのか疑問に思っていました。

Googleでは、ウェブサイトでのコンテンツの重複を避けるために、正規のリンクを使用して、コンテンツの重複またはページの重複を特定するよう要求しています。他の言語を使用しているとき、これはどのような影響があるのでしょうか?

たとえば、サイトが別の言語であり、たまたま完全に重複している場合、重複コンテンツと見なされますか? Googleはすべてのテキストを1つの基本言語に翻訳してから、コンテンツの重複をチェックしますか?

翻訳を公開するときは、hreflangタグを使用して言語を指定し、Googleが適切な場所を特定して適切なユーザーに正しいコンテンツを提供できるようにする必要があることを読みました。ただし、rel="alternate"hreflangタグを使用することも読んでいます。これは重複したコンテンツであるが異なる言語であることをGoogleに伝えるためですか?

5
Liam Sorsby

...サイトが別の言語で正確に重複している場合、重複コンテンツと見なされますか?

Googleは、同じコンテンツを異なる言語に翻訳したものを重複したコンテンツと見なしません。同じコンテンツが英語で2回表示されるのとは異なり、the same content in English that's translated into French is differentここでマット・カッツによってカバーされます: 翻訳されたコンテンツはコンテンツの重複問題を引き起こしますか?

Googleはすべてのテキストを1つの基本言語に翻訳してから、コンテンツの重複をチェックしますか?

Googleは別の言語への翻訳を重複したコンテンツとは見なしませんが、コンテンツの翻訳方法の意味は重要です:

Google Translate を使用して翻訳を実行すると、Googlebotはauto-translationがさまざまなメタタグを埋め込むため、 JavaScript、およびCSSを翻訳済みページに追加するとともに、翻訳済みURLをすべてのリンクに連結して、リンク先ページも翻訳済みとして表示されるようにします。

したがって、さまざまな翻訳の手がかりをチェックすることにより、GooglebotはGoogleが翻訳を実行したかどうか、およびどの言語から/に翻訳したかを知ることができます。検出された場合、ToFromを逆にするだけです言語ペアを使用して、元の言語に翻訳して比較します。

Googleは、Matt Cuttsが議論するように、ロケールと視聴者に合わせた調整された人間の翻訳を好む here (〜0:41) 、そして多くのauto-translatedページをspammyと見るかもしれません。

また、rel = "alternate" hreflangタグを使用することも読んでいます。これは重複したコンテンツであるが異なる言語であることをGoogleに伝えるためですか?

まさに。 hreflangThis markup tells Google's algorithm to consider all of these pages as alternate versions of each other.の使用に関してGoogleで説明されているように、使用時にコンテンツの重複の問題を心配する必要はありません。

7
dan

Hreflangの目的は、特にgTLDドメイン(.com、.net、.orgなど)の異なるサブフォルダーにすべての言語バージョンがある場合に、GoogleがWebサイトをジオターゲティングするのを支援することです。そのため、その主な目的は、言語と地域に応じて、ユーザーにWebサイトの正しいversionを提供することです。また、英国、米国、カナダなどの英語圏など、同じ言語を使用する異なる地域をターゲットにしている場合、コンテンツの重複の問題を防ぐことができます。

ホームページのベース言語については、自分で定義できます。大手ブランドは、英語を.comサイトのデフォルト言語として設定することを選択する場合がありますが、それはブランドの起源にも依存する場合があります(例えば、フランスブランドはデフォルト言語としてフランス語を選択する場合があります)。ただし、必ずしもデフォルトの言語を設定する必要はありません。

2
tentakellady