SharePoint検索結果からのパス/ランディングページの削除

Question

クライアントから、公開ウェブサイトの検索結果ページに表示されないページを削除するように依頼されました。 SSPにアクセスし、これらのページを削除するためのクロールルールを作成しました。すべて正常に機能しているようですが、ランディングページがまだ「www.domain」に表示されているという問題があります。 .com/sitearea/"形式ですが、" www.domain.com/sitearea/pages/default.aspx "にはありません。

このタイプのページごとに、「aspx」パスを「除外」するルールと、「/」パスを含めるが「URL自体をクロールせずにURLのリンクをたどる」ルールを作成しました。「/」形式を除外するルールを追加しようとしましたが、その下にあるすべての結果のみが除外されました。

検索結果から「area/pages/default.aspx」と「area /」のパットを削除する方法を知っている人はいますか？

2つの質問を1つにまとめるのが「完了」であるかどうかはわかりませんが、これは同じような流れなので、問題ないはずです。サイト管理者が（SSP /クロールルールを介さずに）検索結果からページを除外できるようにするツールを誰かが知っているかどうか（または可能かどうか）疑問に思いました。私は彼らがサイトレベルでそれを行うことができることを知っていますが、ページまたはサイト設定のいずれかを介してページレベルでこれを行うことができるものがあるかどうか疑問に思っていましたか？

Jesper M · Answer

私が理解しているかどうかはわかりません-Googleのような公開検索エンジンから、または内部のSharepoint固有の検索機能からページを除外することについて話しているのですか？

どちらの場合も、robots.txtは、検索エンジンによるインデックス作成からWebページを除外するために機能するはずです。私はSharepointの専門家ではありませんが、すばやくグーグルすると、Sharepoint Searchがrobots.txtに準拠していることが示されているようです。したがって、これが私の最初の選択になります。

これがメインです robots.txtの形式のドキュメント。 Microsoftのこのドキュメントは Sharepoint検索管理について説明しています非常にうまくいっているようです。それは言う：

SharePoint Portal Server2003およびSharePointServer 2007は、Robots.txtファイルに含まれている制限に自動的に従います。

-これも、SharepointSearchがrobots.txtファイルに従うことを意味します。

サイトが一般公開されている場合は、 Googleウェブマスターツールアカウントを開設することをお勧めします。さまざまなクロールの問題をトラブルシューティングし、robots.txtがサイトでどのように機能するかを確認するための優れたツールがいくつかあります。

Kevin Davis · Answer

「area/pages /default.aspx」や「area /」などのすべてのページを除外する場合、クロール除外ルールの最後にアスタリスクを付ける必要があります。つまり、www.domain.com/sitearea/*

Andrew · Answer

同様のタイプの問題が発生しています。インデクサーは検索にナビゲーションアイテムを含めていますが、STS_Webオブジェクトのみです...またはSTS_Webオブジェクトである必要があります... SharePointの公開WCM機能は、ウェルカムページをSTS_ListItem_850としてマークしているようです... STS_Webではありません...検索結果のURLはWebURLであり、ページURLではありません（Pages/Default.aspxを除く）。ウェルカムページはWeb自体ではなくWebとしてインデックス付けされます。

Nat · Answer

Contentclassプロパティに基づくルールを使用して検索スコープを作成してみてください。すべてのサイトはsts_site値を使用し、Webはsts_webを使用します。これらの値を持つコンテンツクラスを削除すると、site/バージョンのホームページが表示されなくなります。

Sachin Ranka · Answer

検索結果ページに表示されないように、検索結果の削除というURLを追加しました。要件は変更されておらず、それらの結果が再度表示されます。それを取り戻す方法。