大企業はどのようにデータをバックアップしていますか？

Question

GoogleやFacebookなどの大量のデータを扱う企業は、すべてをどのようにバックアップしますか？

Wikipediaのこの Googleプラットフォーム記事によると、Googleにはそれぞれ80 GB以上のハードディスクを備えた推定450,000以上のサーバーがあります。それは大量のデータです。彼らは本当に1 GBのデータごとに1 GB以上のバックアップを保持していますか？

Mark Henderson · Accepted Answer

それはあなたの目的が何であるかに依存します。

災害復旧用のバックアップ（サーバーが爆発した、データセンターが焼失したなど）を探している場合、簡単に言えば、バックアップをまったく実行できない可能性があります。機密の政府データを扱うクライアントがおり、その使命の一部はリムーバブルメディアへのバックアップまたはバックアップを行うことは許可されていませんです。 DRサイトへのライブレプリケーションは許可されています。どちらのサイトも同じレベルの物理的および論理的セキュリティでカバーされています。ここでの問題は、サイトAで何かを台無しにすると、ほぼ即座にサイトBに複製されることです。

データ整合性の観点からバックアップについて話している場合（たとえば、誤ってCustomersテーブルを削除し、それがすでにDRサイトに複製されている場合）、大きなテープライブラリのLTO-5テープがよく使用されます。テープあたり最大3 TB、およびテープライブラリ内の複数のテープを使用すると、膨大な量のデータをすばやくバックアップできます（ここでは、Mbpsを指しますが、25 TBのデータのバックアップには、まだ何時間もかかる場合があります）。

適切なバックアップスイートは、高圧縮と重複除外を実行します。これにより、必要なストレージ容量が大幅に削減されます。 15：1の比率（1GBのバックアップに15GBのデータが保存されている）と主張されていた圧縮および重複排除されたExchangeバックアップツールの見積もりを見ました。

多くの検索エンジンデータのバックアップにGoogleが悩まされていることは非常に疑わしい。データの大部分は置換可能であり、広範囲に分散されているため、データセンターのかなりの部分、場合によっては全体が失われた場合でも、システムは維持されます。フェイルオーバーBGPルートのおかげでオンライン。

実際、それは Googleはメトリックの断片的なデータをテープにバックアップしますのように見えます。これは、私が期待していたものとはかなり異なります。

Part of the Google tape library

ipozgaj · Answer

ほとんどのデータは独自のGFSファイルシステムに格納されており、GFSではファイルを作成する64 MBブロックごとに少なくとも3つのコピーが必要です（GFSは64 MBブロックを使用します）。そうは言っても、すべてのファイルの少なくとも3つのコピーがあり、障害のあるノードのブロックは、残りの2つの適切なコピーのいずれかから新しいノードにデータを複製するだけですばやく置き換えることができるため、バックアップに煩わされることはないと思います。

詳細については、 http://labs.google.com/papers/gfs.html をご覧ください。

Jim B · Answer

farseekerの答えは良いですが、この観点から考えると明確になると思います。何を復元しようとしているのですか？ DR用ですか？必要な回復時間は？例として、会社が25 TB sql server database。に依存していると仮定します。データ障害またはエラー（ドロップされたテーブル、破損したdbなど）の場合、CTOはデータベースを1時間未満サイト障害が発生した場合は2時間必要です。

一見するとこれは難しいように思えますが、不可能ではありません。バックアップ戦略が1時間で回復する必要があることを知っているので、フルバックアップを復元する予定はなく、dbaチームと協力して、DBが管理可能なチャンクに分割されていることを確認する必要があります。また、トランスログバックアップを頻繁に実行します。 DRの場合は、レプリケーション戦略を検討する必要があります（ログデータがリアルタイムでレプリケートされたが、適用されていない時間遅延バージョンの可能性があります）。ファーシーカーが言ったようにそれは目的に依存し、その目的は何らかの形の回復を行うことであるべきです。