web-dev-qa-db-ja.com

エンコードされた文字に対するUnicodeエスケープの使用に対するSEOの影響?

サイトのテキストコンテンツの場合-たとえば、中国語のサイトの場合、HTMLエスケープを使用できます。

库存了电气和电子应用
领域的连接器,从重型
工业连接

または、単にUTF-8でエンコードされた文字(上記の表現ではなく、単なる例):

制御および監視室、測定と測定、コンピューターと外部機器

訪問者には両方が同じように表示されますが、ページソースでは異なります。新しいサイトを考えると、受け入れられているベストプラクティスは、可能な限りUTF-8を使用することであるように思えます。しかし、私はレガシー/既存のサイトで作業しており、SEOに関して違いがあるかどうかを理解したいですか?

(HTMLドキュメント内の)両方のテキストコンテンツのセットは、検索エンジンから等しく表示されますか(表示される文字/コンテンツが同じ場合)?

Googleまたはその他のローカル検索エンジン(Baiduなど)がコンテンツを処理する方法に違いはありますか?

1
Michael

(HTMLドキュメント内の)テキストコンテンツの両方のセットが、検索エンジンから等しく見えるか

まったくそうです:両方のバリアントは完全に同等です。すべての検索エンジンはUnicode(2番目の例)を理解します。最初の例のエンコードされたHTMLエンティティも問題ではありません。

エンティティエンコーディングは、win-8859-1、utf-8、win-1251などの別のエンコーディングとして他にありません。ロシア語で書かれたウィキペディアのURLに見えます: enter image description here

両方のバリアントは、ブラウザと検索エンジンの両方で完全にサポートされ、理解されています。

2
Evgeniy