WebサイトのURLの抽出

Question

UbuntuでWebサイト内のすべてのディレクトリを検索する方法はありますか？

ウェブサイトがあり、そのウェブサイトの内部リンク（ディレクトリ）を確認したい。

このようなもの：

...

このウェブサイトの問題は、ubuntu.com/cloudのようなものを入力すると、サブディレクトリが表示されないことです。

karel · Accepted Answer

ターミナルを開き、次を入力します。

Sudo apt install lynx lynx -dump -listonly -nonumbers "https://www.ubuntu.com/" | uniq -u

このコマンドは、出力をlinks.txtという名前のテキストファイルにリダイレクトすることにより、前のコマンドを改善します。

lynx -dump "https://www.ubuntu.com/" | awk '/http/{print $2}' | uniq -u > links.txt

DWD · Answer

wget --spider -r --no-parent http://some.served.dir.ca/ ls -l some.served.dir.ca

ただし、これを無料で行い、出力をxml形式に変換する無料のWebサイトがあります。どの方法がニーズに適しているかを確認するために、これらのいずれかを検討することをお勧めします。

EditOPには新しいスクリーンプリントが含まれています