web-dev-qa-db-ja.com

削除されたコンテンツが検索エンジンに表示される期間とその理由は?

Facebookにメモを投稿し、プライバシーモードを「自分だけに表示」に設定し、アカウントを無効にして、メモを削除しましたが、検索エンジンのインデックス付き結果にその画面が表示されたままです。そこにどれくらいの時間があり、なぜですか?

コンテンツが投稿されたWebサイトまたは特定の検索エンジンのキャッシュに依存しますか?そして、プライバシーを安全にし、その検索エンジンの結果からもはや存在しないコンテンツを削除し、そのような操作にどれくらい時間がかかるか、私がすべきことはありますか?

1
franz1

検索エンジンは、利用できなくなったコンテンツをインデックスに登録することを好みません。利用できないことが判明すると、検索エンジンはインデックスからコンテンツを削除します。

削除の時間枠は、次の2つの要因に依存します。

  1. 検索エンジンがページをクロールする頻度。これは主にページの人気度によって決まります。
  2. 削除されたコンテンツに含まれるHTTP応答コードのタイプ。

投稿に人気のあるWebサイトからのリンクが多数ある場合、1日に数回クロールされる可能性があります。ほとんどの場合そうではありません。 Googlebotは、人気の低いコンテンツを数週間ごとに再クロールします。

Googlebotは、削除されたページをクロールすると、インデックスから削除されるようにスケジュールします。 「404 Not Found」ステータスが見つかった場合、24時間の猶予期間が与えられ、インデックスから削除されます。 「410 Gone」ステータスが見つかった場合、通常は数時間以内にできるだけ早く削除します。

Facebookが削除された投稿に使用するHTTPステータスの種類がわかりません。しかし、それはおそらく制限要因ではありません。制限要因はクロール速度です。 3〜6週間以内に検索エンジンからコンテンツが削除されることを期待しています。

自分のドメイン(Facebookではなく)にサイトを所有している場合は、Google Search Consoleにログインして、クロールプロセスを高速化できます。 Fetch as Google リクエストまたは RL削除 リクエストを送信できます。ただし、これらのリクエストは、ドメインを制御し、Google Search Consoleへのサインアッププロセスの一部としてその所有権を確認できる場合にのみ機能します。

2

少なくともGoogle検索では、キャッシュの更新待機をバイパスする方法が1つあります。

Googleのキャッシュからコンテンツを削除するには、 古いコンテンツの削除ツール を使用して成功しました。リクエストを送信するドメインを所有する必要はありません。成功すると、通常24時間以内にコンテンツが消えます。

それでもページが200を返す場合は、「ライブページには表示されないが、キャッシュバージョンには表示されるWordを入力してください」というメッセージが表示されます。その時点で、削除されたWordを投稿に入力できます。

何らかの理由で、このツールの成功率は約70%しかありません。