web-dev-qa-db-ja.com

-npオプションを指定して再帰的にwgetを実行しても、親ディレクトリに昇格します

tl; dr: `wget --no-parrent -r 'は指定されたURLのディレクトリより上のディレクトリからダウンロードされますか?

wgetを使用して、たとえば画像をexample.com/a/bから-rおよび-npオプションを指定して再帰的にダウンロードすると、example.com/a/c /の下にある画像がexample.com/a/のときにダウンロードされます。 b /画像へのリンクを含むhtmlファイルを配信しますか?もしそうなら、フォルダ内にあるすべての写真とそのサブフォルダとそれらだけを取得するにはどうすればよいですか?オプション--no-parentの説明には、「再帰的に取得するときに親ディレクトリに昇格しないでください」と記載されています。とにかくディレクトリブラウジングは、言及されたオプションにもかかわらず、wgetがたどる親ディレクトリへのリンクを提供します。今、私は何を逃しましたか?

編集:GNU Wget1.12を使用

4
vectra

WGET 1.10.2 for Windowsでいくつかのテストを実行したところ、期待どおりに機能しました。

たとえば、bのサブディレクトリであることを示すために、ディレクトリの末尾にスラッシュを必ず追加してください。 aであり、ファイルではありません:

> wget … hxxp://example.com/a/b/

それでも機能しない場合は、再帰除外オプションをいくつか指定してみてください。

  • --reject=htm,html
  • --ignore-tags=a
  • --exclude-directories=http://example.com/a/c/
5
Synetech