web-dev-qa-db-ja.com

HTTrackは、インデックスページのないWebサイト、または「分離された」ページがあるWebサイトをダウンロードできますか?

HTTrackがダウンロードできるのはインデックスページのあるWebサイトだけですか?そして、インデックスページには、サイト上の他のすべてのページへのすべてのリンクが含まれている必要がありますよね?または、少なくとも、サイト上のすべてのページは、何らかの方法でリンクによって相互接続されている必要がありますよね?したがって、リンクが含まれておらず、他のページからリンクされていないページが少なくとも1つある場合、この種のページはHTTrackによってダウンロードされません。

無料のホストにWebサイトをダウンロードしようとしています(実際にはWebサイトではなく、写真のコレクションと、必ずしも相互に接続されていないHTMLドキュメントのコレクションです)。このウェブサイトは約2週間で閉鎖される予定なので、そのサイトからすべての写真をダウンロードするには急いでください。そこで、サイト全体をダウンロードしようとしてHTTrackを試しましたが、その過程で次のようなメッセージが表示されました。

WinHTTrackWebサイトコピー

    • ミラーエラー! * * HTTrackは、現在のミラーが空であることを検出しました。更新の場合は、以前のミラーが復元されています。理由:最初のページが見つからなかったか、接続の問題が発生しました。 => Webサイトがまだ存在していることを確認するか、プロキシ設定を確認してください。 <=

WindowsXPを使用しています。

1
brilliant

そのようなツールは、ページ間のリンクに基づいてのみ機能することは間違いありません。ページにそれを指す他のページがない場合、HTTrack(および他の「スパイダー」ツール)では「非表示」です。この「リンクされていない」ページへのURLがわかっている場合は、手動で追加します。

ただし、Webサーバーで「ディレクトリブラウジング」が有効になっている場合は、ディレクトリを含み、ページ名を含まないURLをポイントすると、ディレクトリ内のすべてのファイルのリストが表示されます。ただし、セキュリティ上の理由からアクティブになることはめったにありません。ほとんどの場合、ページ名が指定されていない場合、Webサーバーはディレクトリコンテンツの代わりにデフォルトページ(index.html、index.php、default.htmlなど)を提供します。

2
Snark