web-dev-qa-db-ja.com

新しいGWTで「発見-現在インデックスが作成されていません」の原因

新しいGWTは、新しいカテゴリに分割されたサイトマップリンクを表示します。私を混乱させる2つ:1.検出済み-現在インデックス化されていない2.クロール済み-現在インデックス化されていない

これには考えられる理由は何ですか?また、サイト全体に影響がありますか?これはGoogleからのサインですか?これらを削除することを検討する必要がありますか?

enter image description here

13
Noam

これはプロセスの一部にすぎません。実際にエラーが発生するまで何もする必要はありません

カテゴリを理解するには、インデックス作成がどのように機能するかを理解する必要があります。これは、ほぼ継続的に行われます。

  • Googlebotは、コンテンツをGoogleサーバーにダウンロードすることを意味するページを取得します。この場合、ページはクロールされます
  • その後、ダウンロードしたページのコンテンツをインデックスに入れます。これは、ページがインデックス付きであることを意味します。
  • ページをクロールしている間、ページを探してキューに入れます。それらのリンクは検出されました

そう:

  • インデックスなしで発見は、Googlebotが最終的にクロールする可能性のあるもののキューにリンクが追加されたことを意味します。ウェブは事実上無限であり、優先順位付けがあるため、実際にそこに到達することはありません。
  • クロールは現在インデックスに登録されていませんは、ページがGoogleサーバーにダウンロードされたが、そのコンテンツがインデックスに挿入されていないことを意味します。
7
Itai

Googleはページを検出してクロールする場合がありますが、必ずしもそれらをインデックスに登録するという意味ではありません。

Googleがページをインデックスに登録しない理由はたくさんあります。重複したコンテンツが見つかった可能性があります。おそらく、特定の検索クエリに対して十分な価値があるとは感じないでしょう。 Googleはあなたのページについて、気に入らないものを見つけた可能性があります。

理由が何であれ、Googleはサイトで検出およびクロールしたページの一部をインデックスに登録することを決定していません。一部のページがインデックスに登録されないのはごく普通のことです。私のサイトの一部のページは、多くのインデックス付きページよりも優れたコンテンツを持ち、かなりの量の内部リンクを持っているにもかかわらず、インデックスが作成されません。 Googleのインデックスシステムは、機械学習アルゴリズムです。したがって、未知のさまざまな理由により、一部のページをインデックスに登録しないこともあります。

2
Michael d

Googlebotには、さまざまなパラメーターに基づいて独自のキューがあります。これは、それらのURLがキューに入れられていることに関するメッセージです。

enter image description here

Aj Cohnはある種の面白い意見を持っています このメッセージの意味について:

発見済み–現在インデックスに登録されていないのは、サイトマップに表示されていることを示しているようですが、他のコンテンツの外観に基づいて、クロールすることすらしていません。基本的に、「ややugい!」または、それは単にクロールの効率が悪いことを表しています。

率直に言って、このステータスのサンプルURLの多くには最終クロール日があるため、Discoveredの定義が正確であるかどうかは完全にはわかりません。これは、提供されている定義と矛盾しているようです。

1
Evgeniy

GoogleはURLを発見しましたが、クロールに時間を費やすほど重要だとは感じていませんでした。このページがオーガニック検索トラフィックを受信するようにしたい場合は、あなた自身のウェブサイト内からもっとリンクすることを検討してください。外部のウェブサイトからバックリンクを獲得できることを期待して、このコンテンツを他の人に宣伝してください。コンテンツへの外部リンクは、ページが価値があり、信頼できると見なされることを示すGoogleへのシグナルであり、インデックスに登録される可能性が高くなります。

0
ts.tsogtgerel