web-dev-qa-db-ja.com

ロールバック機能を備えた冗長ストレージシステムがある場合でも、バックアップは必要ですか?

私の組織は最近ストレージシステムを購入しました。 RAID6の1.5ペタバイトで、物理的に異なる場所にオンライン同期ミラーがあります。

システムはロールバック/ファイルの回復を許可し、デフォルトでは最大30日間を許可しますが、これは増やすことができます。

ストレージ上にのみ存在するデータに対して何らかの追加のバックアップが必要かどうかについては、議論が続いています。

システムには非常に優れた冗長性レベルがあり、地理的な冗長性があり、ある程度までのロールバックが可能です。つまり、定義された時間(デフォルトでは30日)まで古いデータまたは誤って削除されたデータを回復できます。

このシナリオを考えると、「従来の」バックアップをとっても意味がありますか?伝統的に、私は何かが故障した場合に取得できるスナップショットを備えた専用のバックアップシステムを意味します。

本当に必要ですか?何か不足していますか?私は単に伝統的な方法で考えて、熱心すぎているのでしょうか?

32
nsn

あなたが説明することは、地理的に分散したRAIDとRAID バックアップではなかったであることが不可欠です。

通常、オンライン同期とは、攻撃者による(すべての)スナップショットやボリュームの削除や単に管理エラーなどの操作を含め、プライマリストレージで行ったすべての操作がすぐにバックアップシステムに複製されることを意味します。

40
Sven

30日間のロールバックは優れた機能ですが、「critical-important-file-xyz」が破損/損傷し、31日以上経過するまで検出されなかった場合はどうなりますか?この状況は、バックアップスケジュールとアーカイブスケジュールの違いですが、説明では後者については触れていません。アーカイブシステムは通常、非常に低コストのテープに保存されます。また、ビジネスが30日を超えてデータを保持するための規制要件またはその他の要件を持つ事業であるかどうかに関する情報もありません。これはよくあることです。

これがあなたの状況に当てはまらない場合、あなたは良いはずです。

7
Victor Marquez

地理的に離れたマシンにデータが両方あるのは良いことです。

サイトの両方またはすべてに関連する複数の障害が発生した場合はどうなりますか?一方の火災、もう一方のサーバーの盗難?または、それらの間の線に問題があり、プライマリロケーションのサーバーが停止し、HDコントローラが類人猿になり、ジャンクを書き込みますか?または、一部のインサイダーが両方に対して悪意のある行為を実行しますか?または、疑わしいため、FBIは両方の場所でサーバーを没収します(そうすることは決してありませんが、おそらくschmucksと一緒にデータセンターでホストされています)。または。n度まで分析されたすべてが冗長であるいくつかの注目度の高い「クラウド」の停止を思い出しますが、それでも、問題が発生する可能性があります。これらすべてが起こりそうもないことを認めますが、あなたは起こりそうもないことが起こり得ることを認めました。

では、そのデータはどれほど重要/価値があるのでしょうか?それがなくなった場合、組織は何をしますか?

6

ここでの問題は、高可用性/冗長性インフラストラクチャではなくバックアップになる前に、データの複製されたコピーをどのように切り離し、地理的に区別する必要があるかについてのようです。私の直感では、あなたは近くにいますが、それでもバックアップが必要です。

他の回答やコメントにいくつかの考えをまとめる(チェリーピックする)には、「まあ、XテクノロジーはY災害シナリオをカバーしていないので、バックアップではない」という経路をかなり下に行くことができます。あなたにとって何が合理的かを決める必要があります。それがあなたが尋ねている理由のようです。これに対する私の感想、および多くのコメント者の感想は、障害、事故、および悪意のあるアクションが伝播または発生しないように、バックアップは使用中のデータとは別の技術インフラストラクチャに存在する必要があるということです通過するハードルがはるかに高い。コメントに記載されている例は、誰かがボリュームを削除することです。これは、私の意見では空のパイシナリオではありません。しかし、さらに、私の仕事からの実際の例。私が勤務している大学(ただし、ありがたいことにこのインフラストラクチャを管理していない)には、キャンパス施設の多くをサポートする深刻な高可用性仮想化インフラストラクチャがあります。複数のサイトにありますが、すべて1つのベンダーのプラットフォームで実行されています。不明なバグが1日発生して、最初に1台のサーバーを停止させ、次に負荷がシフトすると、そのサイトの残りの部分が削除され、次に負荷が再びシフトすると、ホスティングしている他のサイトが削除されました。そのインフラストラクチャ。 (私は彼らがそれ以来この問題を解決したと信じています)。この場合、データは失われませんでしたが、データがどこにあるかを含むシナリオを想像することは現実的です。

バックアップはこれらすべての影響を受けず、インフラストラクチャがダウンしているときにもアクセスできるようにする必要があります。 RAIDの再構築中にデータが1週間利用できない場合、ビジネスクリティカルなドキュメントをバックアップから復元できるのは素晴らしいことです(必須ではありません)。 RAIDが消えて他のサイトに複製された場合、そのバックアップを別のベンダーから、またはテープなどの隔離されたメディアに保存する必要があります。

以上のことから、バックアップをデータとは別のインフラストラクチャに配置する必要があることを繰り返します。ここには多くの分離レベルがありますが、直接レプリケーションを介して接続されているものはすべて、バックアップとしては近すぎると思います。さらに何かが必要になります。

4
Nick

前提:ストレージシステムは多くのアプリケーションで使用されます。

別のバックアップシステムを使用すると、はるかにうまくいくと思います。

RAIDとミラーリングはバックアップではありませんが、組み込みのロールバック機能により、従来のバックアップシステムを置き換えることができます。

だが:

次の理由により、ストレージベースではなく、アプリケーション/データベースのリカバリポリシーを選択します。

  1. アプリケーションには、データのリカバリと許容可能な損失に関連するさまざまな要件があります(それらのいくつかは、さまざまな規制によって課されます:読み取り専用メディア、暗号化、過去X年間の保持など)。
  2. 一部のアプリケーションには、(非常に)優れたバックアップおよびリカバリツール(Oracle、mssql)が組み込まれており、バックアップ/リカバリの部分を実行するための推奨方法です(Oracle DBAとして、私はOracleに関連するすべてのバックアップをrmanで実行します)。
  3. 増加、スペースの使用量は予想よりもはるかに速く増加する可能性があります。現在、このシステムは30日間のロールバックデータに対応できますが、将来的には保証されません
  4. 安価で、バックアップ/リカバリポリシーに対応するために大きなテープを使用するコストは、数年の成長の後、現在と同じロールバックウィンドウを尊重するために、新しい大きなディスクを購入するコストよりも小さくなります。
1
valentin