web-dev-qa-db-ja.com

Googlebotは、HTML5 data- *属性のURLのように見えるアイテムをクロールしますか?

GoogleはGWTでいくつかのURLを発見していますが、発見できることに驚いています。これらがリンクされる唯一の場所は次のとおりです。

<li class="multiselect__item" data-key="filter__brand--examplebrand2" data-name="examplebrand2" data-count="92" data-url="/example-category/examplebrand1--examplebrand2/" title="examplebrand2">    <input type="checkbox" id="checkboxfilter__brand--examplebrand2">    <label for="checkboxfilter__brand--examplebrand2"><span></span>examplebrand2<i class="multiselect__item-count"> (92)</i></label></li>

以下のコードは興味深いビットです:

data-url="/example-category/examplebrand1--examplebrand2/"

GWTは、これらのURLが外部ではなくサイトのページからリンクされていることを報告しています。私の質問は、GoogleがこれらのURLをクロールできるようにするべきですか?

4
Max

Googlebotは、ヒューリスティックを使用して、ページがURLのように見えるものをすべて抽出します。クロールできます:

  • SELECTオプション値のURL
  • データ属性のURL
  • JavaScript変数のURL

私の経験では、文字列にスラッシュ(/)を入れるだけで、GooglbotがURLであると考えるのに十分です。属性data-URLに名前を付けているという事実は、Googlebotがそれを認識している可能性もあります。

私の知る限り、Googlebotはこれらの「リンク」のみをコンテンツの発見に使用します。通常のa hrefリンクの場合と同じ方法でリンクジュースが渡されるとは思わない。

残念ながら、Googlebotが「間違った」情報を取得し、URL以外の何かをクロールしても、Googleウェブマスターツールのサイトエラーで報告されます。私の意見では、ヒューリスティックを使用してlooksのようなものを見つけようとすると、それはすべきではありません。

5