web-dev-qa-db-ja.com

ウェイバックマシンで古いウェブサイトを回復する

ウェイバックマシンからウェブサイト全体を回復する方法はありますか?

アーカイブされた古いサイトがありますが、再び復活させるためのWebサイトファイルがありません。古いデータを回復して、長い間失われていたファイルを取り戻す方法はありますか?

26
Dustin

wget はサイト全体をミラーリングするための優れたツールであり、Windowsを使用している場合は Cygwin を使用してインストールできます。次のコマンドはサイトをミラーリングします:wget -m domain.name

コメントからの更新:

親ディレクトリ(-np)に昇格せず、robot.txt(-e robots=off)を無視し、cdnドメイン(--domains=domain.name)を使用し、URL(ミラーリングするURL、http://an.example.com)。すべて一緒にあなたは得ます:

 wget -np -e robots=off --mirror --domains=staticweb.archive.org,web.archive.org http://web.archive.org/web/19970708161549/http://www.google.com/

httpsと自己署名証明書を扱っている場合は、--no-check-certificateを使用して証明書チェックを無効にできます。 wgetヘルプは、可能なオプションを確認するのに最適な場所です。

46
mguymon