web-dev-qa-db-ja.com

Externallogin拡張機能の設定が正しくないため、検索エンジンのインデックス作成の問題が発生します

簡単な概要

私のJoomla Webサイトに、検索エンジンロボットに関する奇妙な問題があります。 robots.txtファイルや他の検索エンジン最適化パラメーターの些細な問題ではないことを確認するために、ウェブマスターが実行できるすべての標準的なことを確認しました。私の大学のIT担当者は、何が起こっているのかについて無知であり、Joomlaのフォーラムで助けようとした人々も同様です。

この質問は、Pro Webmastersのstackexchangeでも行いました。しかし、私はJoomlaのどこかに隠された設定が問題を引き起こしているのではないかと疑い始めています。そこで、私はこの質問をして、どこかに足りない設定があるかどうかを確認しています。

実際の問題はここから始まります。

問題のWebサイトは http://gsa.ece.umd.edu/ です。 Joomla 2.5.x(最新)を使用して実行されます。サイトは2013年12月中旬頃から稼働しており、最初からサイトがGoogleで正しくインデックスに登録されていないことに気付きました。具体的には、GoogleでWebサイトを検索すると、次のメッセージが表示されます。

ECEGSA - University of Maryland

A description for this result is not available because of this site's robots.txt – learn more.

12月から3月頃までは、デフォルトのJoomla robots.txtファイルを使用しました。

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/

Googleが私のウェブサイトを検索するのを妨げるものはありません。さらに混乱を招くのは、Googleウェブマスターツールの[ブロックされたURL]タブで、サイトの多くのリンクを試してみると、すべて[許可]と表示されていることです。次に、サイトマップを追加して、robots.txtファイルに追加しました。それは助けにはならなかった。ウェブマスターツールの[ブロックされたURL]タブでのまったく同じ検索結果、同じ動作。さらに、「サイトマップ」タブには、いくつかのリンクについて「URLがロボット化されている」というエラーが表示されます。 「ブロックされたURL」でそれらの正確なリンクを試しましたが、許可されています!

次にrobots.txtファイルを削除してみました。使用しない。同じ正確な問題。

以下は、ウェブマスターツールのスクリーンショットの例です。 Index Status for my website showing no crawl errors and no blocked URLs, in direct contradiction to what the sitemap tab says and what the search result says! FRUSTRATION!

この時点では、なぜこれが起こっているのかを合理的に説明することはできません。また、IT部門の誰もここにいることはできません。 Joomlaフォーラムの誰も、何が起こっているのか理解できないようです。

上記の内容に基づいて、Joomlaサイトの構成に競合が発生する可能性があるかどうか誰かが知っていますか?

5

UPDATE:この問題は拡張設定を修正することで解決されました

externalloginというプラグインを使用して、ユーザーがUniversity CAS(中央認証サーバー)を使用してログインできるようにしました。このプラグインは、構成エラーのため、私のすべてのページへのHTTPヘッダー応答に303リダイレクトを追加していることがわかります。

したがって、Googleが(a)303リダイレクトにペナルティを課すか、おそらく(b)303リダイレクトが指すページ( https://login.umd。 edu / )には、すべてのボットを許可しないrobots.txtがあります。

[〜#〜]修正[〜#〜]
この問題を修正するには、この問題が発生した場合、プラグインの構成を次のように修正する必要があります。
1。拡張機能メニューの[外部ログイン]で、サーバー構成に移動します。
2。 [接続]タブの[自動ログイン/ログアウト]で、[いいえ]を選択します。この場合、拡張機能はWebサイトのすべてのページに303リダイレクトを自動的に追加し、ユーザーがブラウザーセッションでCASにログインしているかどうかを確認するため、手順2で[はい]を選択するとエラーが発生します。その場合は、自動的にサイトにログインします。この機能により、検索エンジンのインデックス作成の問題が発生します。

謝辞
@ stephen-ostermiller( Pro Webmastersの関連する回答 )に感謝します。拡張機能によって追加された303リダイレクトであることを認識させ、正しい方向に導いてくれました。

2