web-dev-qa-db-ja.com

10テラバイトのデータを保存するための最も安全で最も安価な方法は何ですか?

私は制作会社のメンバーで、最初の長編映画の準備をしています。私たちは、元のコンテンツをすべて(可能な限り長く)安全に保つためのデータストレージの方法について議論してきました。データが100%安全になることは決してないことは理解していますが、私たちにとって最も安全なソリューションを見つけたいと考えています。

私たちは考慮しました:

  • 16TB NASオンサイトストレージ用

  • 4-5 2TBハードドライブ(安価ですが冗長ではありません)、元の映像をドライブにコピーしてから、静的なフリーバッグに密封します

  • データをBlu-Rayディスクに書き込む(時間と費用がかかる:200ディスク== $ 5000)

  • テープドライブ?

テープドライブはディスクよりも信頼性が高いという事実を除けば、私はテープドライブについてほとんど知りません。この量のデータに関する経験/知識は非常に高く評価されています。

19
Josh T

これは、通常のバックアップやライブデータではなく、アーカイブを使用することを前提としています。

SATAハードドライブのセット(1または2 TB)に加えて、いくつかの追加機能を用意します。データをディスクにコピーします。 QuickPar (またはパリティボリュームをサポートするアーカイバ)を使用して、追加のパリティファイルを作成します。ハードディスク間でパリティファイルを配布します。

十分なパリティファイルが残っている場合、パリティ情報を使用してファイルを再構築できます。したがって、1つのディスクが停止しても、パリティ情報を持つ他のディスクが機能する場合は、パリティファイルを使用して元のディスクを再構築できます。

冗長性を高めるには、すべてを2回実行し、別々の場所に保存します。

あなたが本当に妄想的であるならば、各サイトでPCIとPCI ExpressをSATAコントローラーに保存してください!

編集:一体、パラノイアがすべてである場合は、すべてのことをやり遂げて、ディスクを読み取ることができる各サイトにギガビットイーサネットを備えたPCを保管してください!

14
ligos

私たちが使用するLTO4ドライブは、テープあたり800GBで詰め込むことができます。欠点は、ドライブ自体のコストです。ブルーレイディスクの5000ドルで吠えた場合、LTO4のコストは気に入らないでしょう。一方、カート自体はGBあたりでかなり安いので、たくさんのコピーを保持できます。これらのテープの保管寿命は良好ですが、テープドライブを交換するときに、新しいメディアにテープを移動することを計画する必要があります。このストレージをどのように使用するかを説明する方法から、テープは適切ではないと思います。これがアーカイブソリューションではなくバックアップソリューションになる場合を除いて、そうではありません。さまざまな問題。

毎日のネットの変化が十分に小さい場合は、このために何らかのクラウドベースのバックアップベンダーを検討することをお勧めします。もちろん、これはインターネット接続がどれだけ強力かによって異なり、インターネット接続からの復元も同様に苦痛を伴う可能性があります。これらのサービスはかなり新しいため、データの破産問題をどのように処理するかは不明です。彼らが廃業した場合、それはどうなりますか?

ローカルディスクストレージは間違いなく行く方法です。簡単に交換できるドライブを備えたドライブエンクロージャは、コストの制約を考慮するとおそらく最善の策です。そのデータをオフラインで使用できる場合は、それを利用してください。ディスクは安価であり、ディスクエンクロージャはテープドライブよりも安価です。可動部品が少なくなります。


ビデオの役割で積極的に使用するのではなく、アーカイブにこれが必要だと思います。もしそうなら、それは別のストレージの問題です。

9
SysAdmin1138

NASの調査で、 DroboPro または DroboElite 自己管理型ストレージデバイスを見たことがありますか?

それに応じて映像と予算の一部/すべてを失った場合の費用を検討してください;)

3
Josh Newman

頻繁に使用するライブファイルには、何らかのNAS/RAIDを用意することをお勧めします。大容量のドライブを使用する場合は、RAID-6などを使用することをお勧めします。RAID-5+ホットスペアのように、RAIDが劣化する前に2つのディスクに障害が発生する可能性がありますが、ホットスペア構成とは異なります。 2番目の追加ドライブにもパリティが設定されているため、RAIDで障害時にスペアにパリティを再構築する必要はありません。ドライブが大きくなると、再構築中にドライブに障害が発生する可能性が高くなるため、可能な限り多くのライブパリティを使用することをお勧めします。

これに加えて、テープドライブのようなハードディスクの使用をお勧めします。最近では、アーカイブ用にドライブをファイリングできる ハードドライブケース (また これら )を購入することもできます。ファイルをRAIDにダンプしてから、ファイルするドライブに追加のアーカイブコピーを作成できます。

Pixel Corps のような一部のビデオ制作会社は、同様の設定を使用しています。

また、ファイルを複数の場所(同じ屋根の下ではない)に保存することを強くお勧めします。また、「2か所以上書かれていない場合は、まだ保存していない」というマントラに必ず従ってください。また、RAIDはnotそれ自体のバックアップとしてカウントされません。

2
James Snyder

これは主にオフラインバックアップタイプのストレージ用であると想定します。簡単に作成および復元できますが、日常の操作ではあまり使用されません。

最近では、2TBドライブを約140ドルで購入できます。つまり、10 TB、5ドライブ、700ドルの場合。 DebianやUbuntu、またはその他のLinuxフレーバーを実行しているサーバーを中心にセミローパワーサーバーを構築するには、約400ドルを計算してください。複数のNICを備えたシステムを入手した場合は、ネットワークインターフェイスを 結合 して(トランキングをサポートするマネージドスイッチが必要になる可能性があります)、サーバーの利用可能な帯域幅を増やすことができます。 NICの障害から保護します。次に、Samba、NFS、またはその他の方法でストレージを、それを使用する必要のあるワークステーションに公開できます。この大規模なデータボリュームの場合、これらのドライブの1つがそれを噛んだときに(そうでない場合)、データがない状態にならないように、何らかの冗長性が必要になる可能性があります。いくつかの理由から、ここではRAID5はお勧めできませんが、RAID10は適切です。サーバーはLinuxを実行しているため、 mdadm を使用してRAIDアレイを管理できます。これを行うには、物理​​デバイスの数を2倍にする必要があるため、最大10台のドライブになります。このストレージサーバーの総コスト:約1800ドルに加えて、サーバーの構築と管理におけるスウェットエクイティ。

あなたが本当にあなたのデータを愛しているなら(これが本当に重要な本番データであるなら、あなたはそうすべきです!)、あなたは複製サーバーを構築し、バックアップをバックアップすることができます。これは、恐ろしく遅い可能性のあるrsync crontab、確実に高速な netcat/tarパイプ ソリューション、またはレイドデバイスをとして設定することで実行できます。 drbd デバイスのベース。ストレージが両方のマシン間で自動的に複製されるため、(基本的に)データの冗長バックアップが保証されます。データボリュームの可用性を保証するために、さらに洗練された ハートビート フェイルオーバーシステムをセットアップすることができます。

2
Jeff Shattock

バッファローTeraStationIII8TBネットワーク接続ストレージ-£1,085.56

Amazon.co.ukリンク

4TBにアップグレードしたテラステーション1TBバージョンを入手しました。これは、RAID5で問題なく動作します。小さいバージョンを購入して自分でアップグレードしてお金を節約するか、複数のterastationsなどを購入することを検討できます。

2
falter

8〜10台の2TBハードドライブ。 2セット作ります。すでに述べたように、別々に保管してください...

テープはディスクよりも保存されている状態に非常に敏感なので、私はテープを避けます。また、5年後も、SATAドライブを何かに接続できる可能性は高いですが、テープを読み取ることができるテープドライブにアクセスできない可能性があります。

長期的な安定性の観点からは光学系が最適ですが、おっしゃるように、コストとロジスティクスにより、光学系はやや実用的ではありません。

2
Adrien

ホスティングサービスを検討しましたか?価格がどのように高くなるかはわかりませんが、大容量ストレージを販売するホスティングサービスを検討することをお勧めします。多分 [〜#〜] aws [〜#〜]

2
nicorellius

Josh、これが作業データなのかアーカイブデータなのかを明確にしていません。データが貴重な場合、バックアップとアーカイブの間に実際の違いはなく、保存する場所、つまり作業システムまたはアーカイブシステムにのみ違いがあります。繰り返しますが、データが貴重である場合、データを保護し、バックアップのルールを遵守したいのであれば、作業システムとアーカイブシステムは同一になります。

アーカイブは、保存されているものよりもメディアの種類に適用されます。アーカイブとは、データが変更されないことを意味します。つまり、一般にWORMと呼ばれる、一度だけ書き込まれ、何度も読み取られます。 WORMドライブは通常テープですが、RDXQuikstorやRDXQuikstation(8ベイRDXステーション)などには、特定のドライブ用のWORMオプションがあるため、上書きできません。 RDXQuikstationがあなたのアーカイブに適しているのではないかと思います。

アーカイブシステムはバックアップ計画の一部であることを忘れないでください。データのコピーを1つだけ持つことを検討するべきではありません。

バックアップのいくつかのルールは次のとおりです。

3-2-1ルール。

データの3つのコピー。 2つの異なるメディア上の1つのソースと2つのバックアップ。そのうちの1つはオフサイトで維持されます。

例:オンサイトサーバーをオンサイトNASにバックアップし、オフサイトをテープまたはRDXにバックアップしました。オンサイトサーバーはオンサイトNASにバックアップされ、オフサイトNASはバックアップされました。オンサイトサーバーはオンサイトNASにバックアップされ、オフサイトNASにリアルタイムで複製されます。オンサイトバックアップはディスクである必要があります。

メディア:

オフサイトバックアップは時間によって異なります。オフサイトをポータブルメディアにバックアップすると、自動的に時間遅延が発生します。つまり、月曜日の夜間バックアップは火曜日の夜にオフサイトで実行されます。火曜日の営業終了前に災害が発生した場合、2日分の損失が発生します。どれだけ失う余裕があるかは、ビジネスとデータ変更の頻度に完全に依存します。

メディアストレージ:

メディアストレージのルールを完全に遵守してください。一部のテープでは、磁場の発生源から十分に離れた、狭い温度範囲と湿度範囲の間で垂直に保管する必要があります。テープを落とすと信頼性が低下します。彼女の携帯電話の隣に彼女のハンドバッグにオフィスの女の子と一緒にテープを家に送ることは起こるのを待っている災害です。また、テープは、ドライブに挿入する前にバックアップ環境で最大2時間必要であり、テープとテープドライブの間の温度と湿度を等しくします。テープも廃棄し、必要な時間/書き込み間隔で交換する必要があります。

個人的には、これらの理由から、私はテープが好きではありません。コストは小さくなく、誰かにそれを管理させるコストでもありません。テープに投資してもルールに従わないのは無意味です。あなたは安いが信頼性が低下することでそれを行うことができます。

単一障害点を排除します。

バックアップデータを複数のメディアに分散させないでください。例えば。 1つのテープでの完全バックアップと、他の6つのテープ間の差異により、データ損失のリスクが7倍になりました。バックアップがある場合は、データの復元に必要なすべてのファイルが含まれているのが好きです。 7つの完全バックアップがある方がよいでしょう。

ある意味で、レイドは複数のメディアとしてカウントされます。 RAIDを使用する場合は常に、ホットスワップ自動フェイルオーバーがあることを確認してください。専用のホットスワップスペアとしてドライブベイに少なくとも1つのスペアドライブを用意すると、システムはデッドドライブをホットスワップスペアと自動的に交換します。テラバイトのデータがある場合は、RAIDに2つ以上のホットスワップスペアを用意することを検討してください。

オフサイト距離を観察します。

オフサイトの距離は重要です。状況によってはデータの損失を防ぐだけの場合、オフサイトバックアップを作成しても意味がありません。地震、洪水、竜巻、ハリケーンなどを経験したことがある人なら誰でもそう言うでしょう。私たちの街での最近の地震では、オフサイトのバックアップ(まだサーバーの隣にテープがあります)や読み取り不可能なバックアップがない大企業がたくさんありました。通常、60マイル/ 90kmが適切な距離です。

予算がわからないのでアドバイスは難しいです。予算は、バックアップとストレージの選択に影響を与えます。私はITを提供する映画プロデューサーで働いてきました。サポートしているので、私はあなたの業界の可動部分についてある程度理解しています。未回答の質問がたくさんあります:

もしあれば、どのサーバーがありますか?スタッフは何人いますか?これはあなたの唯一の長編映画ですか?最大のファイルまたはファイルセットのサイズはどれくらいですか?この映画と次の映画の間の時間は何ですか?例えば。フルタイムで生産している場合は、ファイバーを介したリモートバックアップなどの毎月の費用をカバーするキャッシュフローがあります。映画はどのようなキャッシュフローを生み出しますか?今後、どのような要件がありますか?これらおよびその他の質問は、要件、方法論、および予算を設定します。

例:1年に3本の長編映画を制作し、12人のスタッフを雇用して毎月コマーシャルを制作している場合、次のような余裕があります。RAIDにバックアップされたRAIDを備えたサーバーNASオンサイト。専用ファイバーリンク(それほど高価ではありません)100メガビットの競合なし(ISPによって抑制されていない)リンクが60m/90k離れたデータセンターに複製されます。重要なアーカイブデータはテープまたはRDXに書き込まれ、データセンターまたはテープボールトに保存されます。予算はあなただけです。余裕のある冗長性とバックアップの程度に関する決定要因。

または、予算が少なく、収入が販売によるものであり、将来が不明な場合は、自宅に保管されているTAPE、RDX、またはUSBドライブ(非推奨)を検討している可能性があります。

データの損失と比較検討された現在および将来の要件、キャッシュフローおよび予算は、決定的な要因です。経験豊富なバックアップスペシャリストやビジネスアナリストを雇って、ストレージとバックアップのプロセスを実行することをお勧めします。

1
Samuel

本当に紛失しないようにしたい場合は、少なくとも2つのアーカイブオプションが必要です。おそらくテープとハードドライブ。なんらかの冗長性なしに1つのコピーを作成することは、データダイスを振るもう1つの方法です。

1
irrational John

ストレージのニーズに応じて、個々のワークステーションのバックアップを検討している場合は、リムーバブルSATAドライブ用のThermaltakeBlacX外部ストレージドックを検討してください。これらは、外部USB接続とSATA接続の両方をサポートします。ドライブをドックにドロップし、データをコピーするだけで、バックアップが作成されます。

私は自宅と職場にドックを持っています。私は各場所でバックアップを作成し、オフサイトストレージのためにそれらを別の場所に持っていきます。また、進行中の作業を場所間で移動するためのスクラッチドライブもあります。

ドックはそれぞれ約$ 60.00で、1.5TBドライブを$ 100未満で入手できます。

1
dhperry

テープドライブやデータをテープに保存するセマンティクスについてはよくわからないので、そこではお手伝いできません。ブルーレイを大規模バックアップとして使用することの法外なコストを考えると、私はNASまたは個々のドライブに固執するでしょう。

NAS/RAIDで注意すべきことの1つは、1つの仮想ドライブにかなりの量の情報を保存できる一方で、すべてのドライブをまとめておく必要があり、RAIDは一般的にそれほど長期的ではないということです。バックアップ」ソリューション。複数のドライブを失い、NASデバイス自体を失う可能性があります(また、交換用デバイスがドライブからデータを読み取れるという保証はほとんどありません。 「同一の」デバイス。)

最近のハードドライブの価格が非常に安く、一般的な安定性があることを考えると、私は個々のドライブを選びます。少額のコスト(おそらく$ 1200〜 $ 1500)で10台の2Tbドライブを簡単に入手し、2セットのバックアップを生成できます。 RAIDやNASデバイス)に伴うリスクなしに、データのオフラインバックアップと冗長バックアップの両方を取得できます。SATAがいつでもどこにでも移動する可能性が低いため、個々のドライブも幅広い互換性を提供します。すぐに。

1
jrista