Webディレクトリ全体を再帰的にダウンロードする方法は？

Question

私は多くのフォルダーとファイルを含む多くのサブフォルダーを持つwebディレクトリがあります。

wgetまたはbashを使用してすべてをダウンロードする必要があります。

AJ. · Answer

試してください：wget -rが機能するかどうかを確認します。

dlamotte · Answer

最善の方法は：

wget -m <url>

これはwget "mirror"の略です：

 -m, --mirror shortcut for -N -r -l inf --no-remove-listing.

boucekv · Answer

$ wget \ --recursive \ --no-clobber \ --page-requisites \ --html-extension \ --convert-links \ --restrict-file-names=windows \ --domains website.org \ --no-parent \ www.website.org/tutorials/html/

このコマンドは、Webサイトwww.website.org/tutorials/html/をダウンロードします。

オプションは次のとおりです。

--recursive：Webサイト全体をダウンロードします。
--domains website.org：website.org外のリンクをたどらないでください。
--no-parent：tutorials/html /ディレクトリ外のリンクをたどらない。
--page-requisites：ページを構成するすべての要素（画像、CSSなど）を取得します。
--html-extension：拡張子が.htmlのファイルを保存します。
--convert-links：ローカルでオフラインで機能するようにリンクを変換します。
--restrict-file-names = windows：Windowsでも機能するようにファイル名を変更します。
--no-clobber：既存のファイルを上書きしません（ダウンロードが中断されて再開された場合に使用されます）。

ソースへのリンク

または、Ask Ubuntuの解決策を試してください。

Keshav · Answer

wget --recursive（または何でも）がうまくいきませんでした（私はCentOSを使っています）。 lftpやった：

 lftp -c "open http://your.server/path/to/directory/; mirror"

glomad · Answer

Wget Recursive Retrieval を参照してください。

wget -r -l 5 -O whatever http://example.com/

Duncan · Answer

あなたはウェブディレクトリを持っていますか？リモートマシン上にあり、HTTP経由でのみアクセスできますか、それともシェルアクセスがありますか？ bashプロンプトからwgetを使用するつもりでない限り、bashについての言及はシェルアクセスを意味します。

Wgetは必ずしも非常に効率的ではないため、Webディレクトリが置かれているマシンへのShellアクセスがあり、それをダウンロードしたい場合は、これを行うことができます

$ tar cjf webdir.tar.bz2 webdir

次に、ftpまたはscpでアーカイブを転送します。

Janez · Answer

FTPアカウントを持っている場合は、次のことも試すことができます。

lftp USER:PASSWORD@FTPSERVER -e "mirror&&exit"