web-dev-qa-db-ja.com

大災害の計画

私は、ウェブデザインと開発も行う小さなマーケティング会社で働いています。 Hostgatorの専用サーバーですべてのWebデザインおよび開発顧客をホストします。 RAID 1構成のハードドライブを備えた専用サーバーがあります。また、cPanelを介して自動化され、自動FTPソフトウェアによってローカルにダウンロードされる毎週のバックアップも行います。

本日、Hostgatorに何らかの壊滅的な障害が発生した場合の対処方法について説明しました。サーバーが爆発した、Hostgatorが深刻なネットワークの問題を抱えている、FBIが有名な「私たちが見るすべてのサーバーを奪取する」などのレイドなどを行った可能性があります。次に、それを次のレベルに進め、Hostgatorが長時間停止し、ローカルバックアップにアクセスできなかった場合はどうすればよいかと考えました。これは、火災、洪水などが原因である可能性があります。サーバーが長時間にわたってダウンしている確率はわかっていますおよび同時にアクセスできないローカルファイルはリモートですが、必要なのはただ- two起こるべき悪いことであり、それは我々が立つであろう場所です。 (パンクしたタイヤを手に入れて、スペアがパンクしたり行方不明になったことがわかった場合、2つの悪いことが同時に起こりやすいことがわかっています)。

言うまでもなく、「最悪のシナリオ」タイプのイベントに備えたいと思っています。これにより、ほぼ間違いなくビジネスが停止することになります。私の2つの質問は次のとおりです。

  1. Hostgatorによる長期にわたる停止に備えて、私たちは何ができますか?理想的なシナリオには、クライアントのWebサイトがあり、できれば電子メールをすぐに実行できるようになります。

  2. 重要なデータが失われないように、堅牢なバックアップ計画には何が含まれますか?理想的なソリューションは自動化されます。

回答ではコストは問題ではないと想定できますが、ソリューションが手頃な価格であるほど良いです。

18
John Conde

災害復旧は、特に複数のサーバー、サイト、およびデータベースを扱う場合、大きなタスクになる場合があります。選択したソリューションで考慮すべき2つの重要な項目は、目標復旧時間(RTO)と目標復旧ポイント(RPO)です。

RTOは、基本的に、サイトがバックアップされるまでにかかる時間の予測です。 1〜2分(またはそれ以下)のRTOがある場合は、ニックが提案した、ファイルとデータのセカンダリデータセンターへのリアルタイムレプリケーションとDNSの自動フェールオーバーを伴うソリューションを検討する必要があります。有料サービスまたは両方のデータセンターのハードウェア(F5ネットワークの BIG-IP Global Traffic Manager など)を使用して実行します。これはコストがかかりますが、主に「何がRTOが数時間または数日である場合、サーバーのオンライン化、DNSの切り替えなど、より多くの手動の関与を伴う災害復旧手順を検討することができます。 RTOはそれを可能にします。

RPOは、基本的にバックアップが実行される頻度と、災害発生時に失われるデータの量です。コンテンツやデータの変更が頻繁に発生する場合は、RPOが数分または数時間である可能性が高く、リアルタイムレプリケーションまたは高頻度のバックアップを処理している可能性があります。コンテンツがそれほど頻繁に変更されない場合、または数日間データを失うことを必ずしも気にしない顧客がいる場合、バックアップの頻度は低くなります。

私が言ったように、私はニックが言わなければならなかったことの多くに同意します。他の選択肢として、RackspaceやAmazonなどの大規模なクラウドベースプロバイダーのクラウドベースのサービスを利用することも検討できます。特に、これらのプロバイダーはどちらも、大規模なインフラストラクチャを備えており、発生したほぼすべての災害を処理できます。クラウドサイトまたはクラウドサーバー(Rackspaceで使用される用語)のようなものを使用すると、同様に拡張できるという利点があり、物理的なハードウェアの側面を必ずしも心配する必要がありません。

Rackspaceには、クラウドサーバー、物理サーバー、クラウドファイルをソリューションの一部として組み合わせて、インフラストラクチャを混在させることができるカスタムオプションもあります。ハイブリッドアプローチは、1つのサイズをすべてのアプローチに適合させたくない場合、顧客のニーズに応じて検討する必要がある場合があります。

役立つ場合は、Rackspaceサイトにも災害復旧専用のページがあります。これは here にあります。 (また、記録のために、私はRackspaceと提携していませんが、過去に彼らのサービスを使用しました)。

これがお役に立てば幸いです。

EDIT:これは、クラウドソリューションを評価している場合に役立つと思われます。 Gartner Magic Quadrant Report for Infrastructure and as a Service and Web Hosting は、他のソリューションプロバイダーに関する洞察を提供する場合があります。

6
Rob

別のホスティング会社の別の施設でサーバーを完全に複製することが最も明白な解決策のようです。

ファイルは、rsyncやunisonなどのツールと同期を保つことができます。 SQLバックアップもrsyncedでき、スクリプトによってスレーブデータベースにアップロードできます。

2
ZJR

ソースコードリポジトリ(SVNまたはGIT)を使用して、すべてのコードのバージョン管理を実行していることを確認してください。 SVNまたはGITを使用していますか?

Project Locker のようなサードパーティのリポジトリでアカウント(無料または有料)を取得できます。作業中にすべてのコードをバージョン管理する場合は、基本的にすべてをバックアップします。 3番目の場所にあるリポジトリ。これにより、すべての作業を一度に失う可能性がさらに低下します(ほぼゼロ)。

SVNのコミット/チェックアウトは、コマンドラインを使用するか、Versions(Macの場合)やTortoiseSVN(Windowsの場合)などのクライアントを使用して実行できます。

1
Joel Glovier