サイトをクロールし、デッドリンクとリンクされていないファイルを見つけるのに役立つツール

Question

文字通り何千ものPDFを含むかなり大きなレガシーサイトがあります。これらのPDFは時々データベースで処理されますが、多くの場合、ページ上の単なるリンクであり、サイト上のほとんどすべてのディレクトリに保存されます。

自分のサイトのすべてのリンクをたどるphpクローラーを作成し、それをディレクトリ構造のダンプと比較していますが、もっと簡単なものがありますか？

plntxt · Accepted Answer

Ben Hoffman · Answer

Windows 7を使用している場合、最良のツールはIIS7のSEO Toolkit 1.0です。無料で、無料でダウンロードできます。

ツールは任意のサイトをスキャンし、すべてのデッドリンクがどこにあるか、どのページがロードに時間がかかるか、タイトルが欠落しているページ、タイトルが重複している、キーワードと説明が同じ、HTMLが壊れているページを通知します。

mvark · Answer

Evgeny · Answer

壊れたリンクだけでなく、すべてのページのテーブルビューも含まれるため、同一の<title>タグとメタ説明タグ、nofollowリンク、Webページ上のメタnoindex、鋭い目だけが必要な多くの病気などを比較できます。簡単に修正できます。

Dark · Answer

artlung · Answer

linklint @check.ll

Check.llファイルは次のようになります

# linklint -doc . -delay 0 -http -htmlonly -limit 4000 -net -Host www.example.com -timeout 10

それはwww.example.comのクロールを行い、破損、欠落などの相互参照レポートを含むHTMLファイルを生成します。