web-dev-qa-db-ja.com

テープバックアップとオフサイトストレージサービスを排除する方法は?

更新をお読みくださいAT下。ありがとうございます!;)

環境情報(すべてのWindows):

  • 2サイト
  • 30台のサーバーサイト#1(3TBのバックアップデータ)
  • 5サーバーサイト#2(1TBのバックアップデータ)
  • サイト#1とサイト#2を接続するMPLSバックボーントンネル

現在のバックアッププロセス:

オンラインバックアップ(ディスク間)

サイト#1には、4台の1TB USB2.0ディスクを搭載したSymantecBackup Exec12.5を実行しているサーバーがあります。フルバックアップのBEジョブは、サイト#1のすべてのサーバーでこれらのディスクに対して毎晩実行されます。サイト#2は、購入時にすでに持っていたソフトウェアを使用して、中央のファイルサーバーにバックアップします。 BEジョブは、そのデータを毎晩サイト#1にプルし、それらを上記のディスクに保存します。

オフサイトバックアップ(テープ)

バックアップサーバーに接続されているのはテープドライブです。 BEは、外部ディスクを週に1回テープにバックアップします。これは、オフサイトのストレージ会社によって取得されます。明らかに、2つのテープライブラリをローテーションします。1つは常にここにあり、もう1つは常にそこにあります。

要件:

  • 各サイトでディスク間を実行し、サイト#1をサイト#2に、またはその逆に複製することにより、テープおよびオフサイトストレージサービスの必要性を排除します。
  • ハードウェアオプションとしてのソフトウェアベースのソリューションは高すぎる(つまり、SonicWall、Arkeia)。
  • Exchange、SharePoint、およびSQLのエージェント。

これまでのいくつかのアイデア:

ストレージ

各サイトのDroboProは、最初の8TBのストレージを備えています(これらは現在、最大16TBまで拡張可能です)。これらはラックマウント可能で、異なるドライブを許可し、iSCSIインターフェイスを備えているため、私はこれらが好きです。彼らも比較的安いです。

ソフトウェア

Symantec Backup Exec 12.5には、必要なすべてのエージェントとライセンスがすでに含まれています。 BEが行うすべてのことと重複排除とレプリケーションを実行する、同様の価格のより良いソリューションがない限り、これを使い続けたいと思います。

サーバ

SCSIアダプタ(テープドライブ用)はもう必要ないので、バックアップサーバーを仮想化します。これは、現在SQLボックスを保存する唯一の物理マシンであるためです。

問題:

  • サイト間で複製する場合、パイプを通過するデータをできるだけ少なくする必要があります。これまでにここで説明した内容には、重複排除や圧縮はありません。
  • 複製されるファイルは、ディスク間バックアップからのBEの仮想テープライブラリです。このため、これらの巨大なファイルは毎日変更されるため、毎週ネットワークを通過します。

そして最後に、質問:

サイト間のレプリケーションだけを処理するために、重複排除、または少なくとも圧縮を行うソフトウェアはありますか?または、私たちのセットアップを見て、私が見逃している他の解決策がありますか?それはより安く、より速く、より良いかもしれませんか?

ありがとう。長い間ごめんなさい。

更新2:

私はこの質問にもっと注目を集めるために報奨金を設定しました。可能な限り少ない量のデータ(圧縮、重複排除、またはその他の方法)を使用して、2つのサイト間のデータの複製を処理するソフトウェアを探しています。 rsyncに似たものが機能しますが、Windowsにネイティブである必要があり、起動して実行するためのシェナニガンを含むポートではありません。 GUIベースの製品を好みます。それが機能する場合は、いくつかの骨を削ってもかまいません。

上記の基準を満たす回答のみをお願いします。存在しないと思われる場合、または私が制限していると思われる場合は、それを自分自身に保管してください。 7日経っても答えがまったくない場合は、そうしてください。みなさん、ありがとうございました。

更新2:

皆様からのご提案に心より感謝申し上げます。賞金が切れる前に、これらすべてを試す方法はありません。今のところ、この賞金を使い果たして、最も多くの票を獲得した人は100レップポイントを獲得します。再度、感謝します!

5
Daniel Lucas

Windows Server 2003 R2以降はDFSRをサポートしています。DFSRは、3つのサイト(T1 <-> T1 <-> T1トポロジで80GB以上)のかなり小さなパイプを介して大量のデータを同期およびバックアップするために広範囲に使用しました。

msdn.Microsoft.com/en-us/library/bb540025(VS.85).aspx

データを複数のサーバーに複製すると、データの可用性が向上し、リモートサイトのユーザーがファイルにすばやく信頼性の高い方法でアクセスできるようになります。 DFSRは、リモート差分圧縮(RDC)と呼ばれる新しい圧縮アルゴリズムを使用します。 RDCは、限られた帯域幅のネットワーク上でファイルを効率的に更新するために使用できる「diffoverthewire」プロトコルです。 RDCは、ファイル内のデータの挿入、削除、および再配置を検出し、ファイルが更新されたときにDFSRがデルタ(変更)のみを複製できるようにします。

DFSRは完全にマルチマスターであり、必要に応じて構成できます。これにより、ごくわずかな帯域幅とCPUで、「バックアップ」の場所でデータの同期が維持されます。ここから、ボリュームシャドウコピーサービスを使用できます。

technet.Microsoft.com/en-us/library/cc785914.aspx

ボリュームシャドウコピーサービスは、ビジネスアプリケーション、ファイルシステムサービス、バックアップアプリケーション、高速リカバリソリューション、およびストレージハードウェアと連携することにより、一貫したシャドウコピーを生成できます。 Windows Server 2003オペレーティングシステムのいくつかの機能は、共有フォルダとバックアップのシャドウコピーなど、ボリュームシャドウコピーサービスを使用します。

シャドウコピーはディスク上にあり、スナップショットからスナップショットに変更されたファイル以外に「スペースなし」を取ります。これは、スナップショットの作成時にディスクI/Oがわずかに増加することを除けば、悪影響を与えることなくライブデータセットで実行できるプロセスです。

私はこのソリューションをかなり長い間使用し、大きな成功を収めました。ファイルへの変更は、非常に大きなファイルのほんの数バイトが変更された場合でも、数秒以内に他のサイトに書き出されました(低帯域幅のリンクを介しても)。スナップショットには、任意の時点で作成された他のスナップショットとは独立してアクセスできます。これにより、緊急時のバックアップとオーバーヘッドがほとんどありません。スナップショットは、就業時間の開始前に1回、昼食時間に1回、1日が終わった後に1回に加えて、5時間間隔で起動するように設定しました。

これにより、すべてのデータを両方の場所に並行して保存し、比較的最新の状態に保ち、必要な頻度で「バックアップ」(実際にはバージョン管理に相当)することができます。

シャドウコピークライアントをクライアントコンピューターにインストールして、バージョン管理されたファイルにアクセスできるようにすることもできます。

www.Microsoft.com/downloads/details.aspx?FamilyId=E382358F-33C3-4DE7-ACD8-A33AC92D295E&displaylang=en

ユーザーが誤ってファイルを削除した場合は、フォルダー、プロパティ、シャドウコピーを右クリックし、最新のスナップショットを選択して、スナップショットからライブコピーにコピーします。

MSSQLバックアップは、特定のフォルダー(またはネットワーク共有)に書き出すことができます。このフォルダーは、サイト間で自動的に同期され、定義したスケジュールでバージョン管理されます。

これらを使用したデータの冗長性とバージョン管理は、優れたバックアップシステムとして機能する可能性があることがわかりました。また、読み取り元のファイルが使用されていないため、ワークフローに干渉することなく特定のスナップショットをオフサイトにコピーするオプションも提供します...

2番目のバックアップサイトは読み取り専用の同期/ミラーとして構成できるため、これはセットアップで機能するはずです。

6
Kyle Brantley

Windowsは私の専門分野ではありませんが、rsyncはあるサイトから別のサイトへのバックアップの取得に役立つ場合があります。 Rsyncは、ファイルをより小さなブロックに分割し、ネットワーク全体で変更されたブロックのみを転送することで機能します。また、送信時にデータを圧縮することもできます。

Windows用のバージョンがいくつかありますが、私はそれらを使用したことがないので、それらがどれほどうまく機能するかについてコメントすることはできません。 cygwinを使用すると、Windowsでrsyncを取得できますが、それによって少し面倒になる可能性があります。ただし、理想的には、スケジュールされたタスクを使用して実行を自動化できるWindows用のrsyncクライアントを見つける必要があります。

4
3dinfluence

編集:

Software Pursuitsの「SureSync」( http://www.softwarepursuits.com/SureSync/SureSync.asp を参照)を使用して、お客様のリモートサイトの本番サーバーとスタンバイサーバー間でデータを複製しています。成功。これはネイティブのWindowsアプリケーションであり、パブリッシャーマシンとサブスクライバーマシンでサービスとして実行され、デルタをコピーし、セキュリティを保持し、NTFS変更ジャーナルに従い、一般的に私たちのニーズに応えてきました。

(これを行っている特定のお客様には、従来のオフサイトテープバックアップローテーションもあります。オフラインバックアップが必要だと思います。私の回答のそのセクションをそのままにしておかないと、良心的に質問に答えることはできませんが、私はSureSyncが素晴らしかったことがわかります。製品の変更ログをいくつか読んでください。製造元が本当に、本当に細部に気を配っていることは明らかです。)


1つの観察:テープを排除すると、オフラインストレージが排除されます。オフサイトは1つのことですが、オフラインは別のことです。リモートの攻撃者が本番システムを破壊する場合、テープとテープドライブの間にエアギャップを設けて、バックアップも破壊できないようにするのは本当に素晴らしいことです。

バックアップのオフサイトストレージが必要であり、オフラインバックアップも必要です。

また、テープのようなものなしで、独立したサードパーティにテスト復元とデータ検証を行わせることは非常に困難です。おそらくあなたの業界では問題ではありませんが、私はデータをテープを介してオフサイトでサードパーティに送信し、データの整合性を「復元可能性」の観点から独自に検証する金融機関で働いてきました。そして、「データのみを入力として使用して、アプリケーションの信頼できるインストールで計算された合計と、合計が適切に比較されるかどうかを確認しましょう」から。

2
Evan Anderson

サイトからサイトへのレプリケーションの速度を上げたい場合は、WANアクセラレーターを調べてください。市場にはいくつかあります。別の管理者がRiverbedからのものを私に勧めました:- http://www.riverbed.com/index.php?cnt=1

基本的に、送信前にデータを圧縮し、受信後にデータを解凍します。それはユーザーにとってシームレスです。

1
Matt Simmons

BackupExecはこれを簡単にしません。理想的には、バックアップをどこかに「コピー」するオプションがあるはずですが、BEにそれがあるかどうかはわかりません

この環境でHPDataProtectorを使用した場合に作成するものは次のとおりです。ジョブの「コピー」があります。重複排除オプションもありますが、約500Kを超えるファイルが保存されているファイルシステムでは注意が必要です。

  • 両方の場所にあるディスクアレイ DRレプリケーションに必要です
  • 両方の場所でバックアップを続行します
  • 月曜日にコピージョブを使用して週末のジョブをリモートサイトにコピーします週に1回、完全バックアップをテープからにコピーしますリモートデータセンターのディスクアレイ。 DPデータベースは、両方のバックアップジョブを追跡します。
  • B2Dジョブの有効期限を適切に設定しますリモートロケーションに必要なリモートコピーの数を決定し、コピージョブにデータ保持期間を正しく設定します。これは、テープローテーションの保持とは別の間隔にすることができます。

圧縮を使用するようにディスクバックアップを設定できると思いますが、これはソフトウェアで行われるため、バックアップ速度が大幅に低下します。

DataProtector重複排除は、WindowsおよびLinux上のファイルサーバーに対してのみ機能します。 Exchange/MS-SQL/Sharepointの重複排除は行われません。

1
sysadmin1138

この実行中のスレッドに新しいオプションを追加します。

私たちが使い始めたソフトウェアはAppAssureによって作られています(現在はDellに買収されています)。製品名はReplayと呼ばれています。

これは、ディスク間バックアップを実行するWindowsサーバー用に設計されており、スナップショットをリモートサイトに自動的にコピーできるレプリケーションオプションがあります。

これには自動重複排除、自動バージョンロールアップが含まれ、レプリケーションは非常に効率的であり、バックアップスナップショットが15分または1時間ごとに終日行われている場合でも、営業時間外に行われるようにスケジュールできます。

変更のみがWANデータの完全なコピーではなく)を介して送信されます。データの新しい完全なコピーを実行する必要がある場合は、初期バックアップを外部ディスクにオフロードして出荷できます。最初の同期のためにWAN)を介して完全バックアップを送信する必要がないように、インポートするリモートサイトに送信します。

バックアップディスクの場合、完璧なコンパニオンはDrobo B800i Iscsisanシステムです。比較的安価で、市販のSATAドライブから商品を取り出し、バックアップを実行するのに妥当なパフォーマンスを備えています(ただし、VMWare ESXホストやSQLデータホスティングなどの重すぎる処理を実行するには十分ではありません)Droboがパフォーマンスデータを公開しないのには理由があります。 B800i、Equallogic PS sanのようなもの、またはEMCやHPのような大手のSANベンダーのものと比較すると、かなりローエンドです。しかし、ディスク間システムのストレージとしては素晴らしいです。

1
QueBall

IBMは、以前は「Softek」と呼ばれていた、Replicatorと呼ばれるソフトウェアソリューションを持つ会社を買収しました。 TCP/IP上で実行されるのはブロックレベルのレプリケーションです。最初の同期が完了すると、変更されたブロックのみがリモートサイトにコピーされます。したがって、巨大なBEファイルの1つが多少変更されたからといって、ファイル全体をコピーする必要はありません。これはネイティブのWindowsアプリケーションであり、使いやすいコンソールを備えており、ネットワークを介したディスク同期を管理するための非常に優れた方法です。

IBM/Softekレプリケーター

1
user10451

私が言いたくないのですが、マルチサイトバックアップを実行する最も簡単で最速の方法は、優れたストレージアレイを使用することです。 Dell/EqualLogicとHP/LeftHandの両方に、SAN製品に組み込まれたソフトウェアがあり、複数のSAN間で一定の増分バックアップが可能です。セットアップは迅速かつ簡単ですが、最も安価なソリューションではない場合があります。 。

1
user18482

私は約1年前に同様の問題を抱えており、robocopyやrsyncからCiscoWAASやWANアクセラレーターまで)すべてを調べました。最終的に、安全かつ迅速なデルタ同期に最適な愚かな安価なソリューションに出くわしました。サイト間のファイル。Delta同期が重要です。すべてではないにしても、ほとんどのP2Pクライアントは完全です。ファイルの同期のみ。

パワーフォルダー
LANのみのモードがあり、クライアントに接続を許可するIPのセットを指定できます。また、転送モードのかなり良い組み合わせがあります。

私が望むように物事を正確にセットアップするために少し掘り下げました。 Powerfolderの人たちは間違いなくUI開発者ではありませんが、サポートは非​​常に役に立ち、wikiの検索機能がなくても、彼らのwikiドキュメントは素晴らしいものです。 :-)

Exchange、SQL、Sharepointのインラインソリューションにはまだ移行していませんが、データベースのバックアップをディスクに保存し、Powerfolderに同期させることで十分に安心できます。

このソリューションはうまく機能し、実装にかかる費用が100ドル(調査とセットアップの工数を除く)未満であるため、同社はこのソリューションを気に入っています。

Powerfolderがあまり知られていないのは驚くべきことです。

P.S。 -リンクがないことをお詫びします(LAN専用モード、転送モードなど)。 「新規ユーザーは最大1つのハイパーリンクしか投稿できません」

1
GollyJer

考慮すべきことが1つあります。スナップショット/バックアップをディスクに保持する期間はどれくらいですか?テープは通常、長期のアーカイブに使用されます。 1年前に削除されたメールを復元する必要がある場合は、テープにアクセスします。削除せずにディスクを長期間保持しない限り、データを復元する機能の大部分が失われます。

0
Kevin Kuphal

この環境で最初にやろうとすることは、小さなサイトのサーバーを排除することです。これを実行できるかどうかは、ユーザー数、帯域幅の可用性、リンクを通過するデータの種類など、多くの要因によって異なります。 5台のサーバーでは比較的少数のユーザーと話していると思います。そのため、Riverbedまたは同等のソリューション(ハードウェアプリントサーバーデバイスでバックアップし、ルーターを使用してDHCPとローカルDNSキャッシュを処理する)を調査する方が経済的に有利な場合があります。サーバーなどを保守するよりも実行可能であり、セットアップが大幅に簡素化され、全体的に管理オーバーヘッドの削減、サービスレベルの向上などにつながります。

0
Maximus Minimus

速度、使いやすさ、価格については、ExaGridなどのターゲット重複排除アプライアンスを実際に検討する必要があります。 DRサイトへのレプリケーションにより、非常に高速に稼働します。テープを完全に排除します。 www.exagrid.com

0
Chris

これは少し気が狂ったように見えるかもしれませんが、私はバージョン管理システムを使用して、バックアップファイルを私が忠実にバックアップする単一のリポジトリにプッシュすることに頼りました。これはスポークとハブのモデル(gitのように配布されていない)であり、私は多数のクライアントを見つけました。それの本当に良いところは、監査証跡と、バージョン管理システム用のほぼユビキタスなクライアントを使用してバックアップを簡単に取得できることです。重複排除はバージョン管理システムの主な目標であり、同じデータが複数回到着したときにさまざまなチェックと浅いコピーを実行するものもあります。

0
ojblass

まだ調べていない場合は、Data Protection Manager(DPM)をチェックアウトしてください。

http://www.Microsoft.com/systemcenter/dataprotectionmanager/en/us/default.aspx

私はこれを内部使用のために設定しているところです。私はまだすべてのイン/アウトを知りません。つい最近まで、マイクロソフトがそのような製品を提供していることに気づいていませんでした。

デルタ差分を実行することはわかっていますが、レプリケーションのニーズについてはよくわかりません。

0
pulcher

robocopy を確認する必要があります。または、GUIが必要な場合は、 richcopy を参照してください。どちらのツールもマルチスレッドで、高速で効率的であり、マージと同期のための多くのオプションがあります。 osql backup database コマンド(DBバックアップの場合)およびexmerge(ブリックレベルの交換バックアップの場合)と組み合わせて使用​​でき、自動化する簡単なスケジュールされたタスクを作成できます。

0
nedm

EVaultExpressリカバリアプライアンスを確認してください

http://www.i365.com/disaster-recovery/index.html

これは、サービスとしてオフサイトで実行するディスクベースのシステムです。または、独自のevaultシステムを使用することもできます。帯域幅と高速なバックアップ/復元が簡単です。

私はいくつかの人気のあるバックアップソリューションを使用しましたが、これははるかに習得/使用が簡単でした。サービスも10倍良かった。

0
MathewC

私は個人的に nison を使用してサイトを同期します。 Windowsで十分にサポートされており、rsyncのような変更されたデータブロックのみを同期し、使いやすいGUIを備えており、音声とビールの両方で無料です。 16TBのバックアップ用に設定しましたが、問題なく動作します。

次に、VTLバックアップを各サイトから別のサイトに複製するだけで済みます。

0
wazoox

2つのサーバーAとBがあります。

サーバーA SQL Serverのプライマリノードを実行します(プライマリ)IIS 6.0ネットワーク負荷分散(NLB)レプリケートされたファイルサービス

サーバーB SQL Serverのセカンダリ(サーバーAのフェイルオーバー)ノードIIS 6.0NLBレプリケートファイルサービス

Aがダウンした場合、すべてのデータはBにあり、その逆も同様です。ファイルは、当社のWebサイトを処理する複製エージェントを介して複製され、いずれかのサーバーでファイルが変更されるたびに更新されます。データはフェイルオーバーマシンにミラーリングされるため、Aがダウンすると、Bは自動的にプライマリDBの役割を引き継ぎます。 NLBを使用すると、エンドユーザーはどのサーバーにアクセスしているかを知る必要がないため、ダウンタイムと多くの構成の問題について心配する必要が最小限に抑えられます。

これに加えて、DBのバックアップを定期的に作成し、ファイルをオフサイトにバックアップします。データが頻繁に管理されている場合は、バックアップ用のハードウェアメディアを検討する必要がありますが、毎日の変更が少ない場合は、その場合はオンラインバックアップサービスを検討できます。

あなたのデータはあなたの評判とあなたのビジネスですあなたがデータを安全に保つためにお金を使うものは何でも、あなたがすべてを失ったり、データが壊れたりした日に、堅牢なバックアップソリューションのコストが見えるようになりますペニーのように。

0
Middletone