web-dev-qa-db-ja.com

「RAID 5 +スペア」または「RAID 6」を使用する必要がありますか?

「RAID 5 +スペア」とは何ですか( ユーザーマニュアル、セクション4.17.2、P.54からの抜粋 ):

RAID5 + Spare:RAID 5 + SpareはRAID 5アレイで、1つのディスクがスペアとして使用され、ディスクに障害が発生するとすぐにシステムを再構築します(図79)。少なくとも4つのディスクが必要です。 1つの物理ディスクに障害が発生した場合、データはパリティブロックから読み取られるため、データは引き続き利用可能です。故障したディスクのデータは、ホットスペアディスクに再構築されます。故障したディスクを交換すると、交換したディスクが新しいホットスペアになります。単一のディスクに障害が発生してもデータは失われませんが、システムがホットスペアにデータを再構築する前に2番目のディスクに障害が発生すると、アレイ内のすべてのデータが失われます。


「レイド6」とは( ユーザーマニュアル、セクション4.17.2、P.54からの抜粋 ):

RAID6:RAID 6では、データはすべてのディスク(最小4つ)にストライプ化され、各データブロック(図80のpとq)の2つのパリティブロックが同じストライプに書き込まれます。 1つの物理ディスクが故障した場合、故障したディスクのデータを交換用ディスクに再構築できます。このRAIDモードは、データ損失なしで最大2つのディスク障害をサポートできます。 RAID 6は、障害が発生したディスクからのデータの再構築を高速化します。


「Raid 5 +スペア」と「Raid 6」はどちらもSO類似...違いはわかりません。

「RAID 5 +スペア」が最適になるのはいつですか?

そして「Raid 6」が最適になるのはいつですか?

マニュアルは5つ星の評価で異なるレイドを簡単に説明しています。 「Raid 5 + Spare」は4つ星を獲得しますが、「Raid 6」は5つ星を獲得します。もしマニュアルを盲目的に信頼するなら、私は「レイド6」が常により良いと結論するでしょう。 「Raid 6」は常にの方がいいですか?

12

要するに:

  • 安全性が主な関心事である場合は、RAID6を使用してください。RAID6は、2台のドライブが同時に故障しても生き残ることができるためです。ドライブがR5 +スペア構成で故障した場合、スペアが速度が上がるまで別の故障から安全ではありません。これは、大きなドライブでかなり時間がかかる可能性があります(電源がオフになっているドライブでは前代未聞ではありません)スペアなどの年齢の場合、最終的に呼び出されたときにスピンアップに失敗します)。

  • パフォーマンスが優れている場合は、アレイが機能低下状態ではないときに書き込みパフォーマンスが向上するため、5 + spareを使用します。ただし、R5とR6のパフォーマンスの違いは、R5と他のソリューションの違いifほとんどの場合、適切なコントローラがあります(つまり、一度ブロックの書き込み操作を2回または3回実行すると、パリティ計算が行われ、次に2回または3回の同時書き込みが行われます。非常に安価なコントローラとソフトウェアRAIDが実行する可能性のある「読み取り後読み取り(-読み取り後)-読み取りパリティ-計算後書き込み-書き込み後(書き込み後)」ではありません。

編集:私は最初に潜在的に重要なポイントを逃しました:

  • 電力消費が懸念される場合、R5 +スペアには追加の利点がありますifコントローラーは、必要になるまでスペアドライブの電源をオフに保ちます。
17
David Spillett

RAID 5 +ホットスペア:

  • 同等のコントローラーハードウェアRAID 6よりも優れたパフォーマンス
  • 2つのディスクを同時に失うことはできません。ディスクを紛失した場合、リビルド時間(ホットスペアあり)で冗長性なしがあります。この時間に失敗したものはすべて、完全な損失を引き起こします(goodデータ救済会社にすべてを送信し、本当に$$$$を支払うのではありません)

RAID 6:

  • rAID 5よりもパフォーマンスが悪い(コントローラによって異なりますが、非常に目立つものから実質的に差がないものまでさまざまです)
  • 同時に2つのディスクを失う可能性があります

RAID 5または6の場合、同じ運用環境に属していないディスクを使用するように注意する必要があります。再構築時に単一の障害が発生した後、ストレスの増大が原因で次のディスクが障害を起こす可能性があります(私はそれを確認しました!)。同じ実行からのディスクには、まったく同じファームウェアがあり、おそらくvery似た物理プロパティがあります。

編集:何を選択するか

(これは、サーバーのパフォーマンス要件と許容可能なリスクにも依存します。)

サーバーの環境がハードウェア(コロ、気候など)にとってかなり良い場合、RAID5 +ホットスペアで問題ありません。

短時間で複数のディスクに障害が発生する可能性が高い環境(振動、湿度、汚れ)がある場合は、RAID 6を使用してください。

常に適切なバックアップも持っていますとテストリカバリ。

編集2:まともなRAIDコントローラーにはスクラブがあり、すべてのセクターを定期的に検証します。

7
knitti

RAID5は1つのパリティストライプを使用します。リードソロモンエラー訂正を計算し、RAID6の場合とRAID5の場合の2つのストライプを書き込む必要があります。 RAID5は、RAID10のコストのためにストレージが巨大である強力なデータベースアプリケーションに使用されます。 RAID5のコストは67%から94%まで変動し、RAID10が50%の場合はディスクの可用性が高くなります(ストレージコストがはるかに高くなります)。エラー訂正の計算とパリティビットの追加書き込み。

ドライブの平均故障間隔(MTBF)を使用すると、2つのドライブが次々に、または同時に故障する確率は、約(0.1% x 0.1%)*12または0.001 x 0.001 * 12; 1000台のドライブを実行している場合、年間平均で1.2台のドライブが失われます。 2台のドライブは、約8.3年ごとに次々と故障します。ここで、再構築中のドライブへの負荷が大きいため、ドライブ障害はポアソン分布ではないため、この期間中に2番目のドライブの障害が発生する可能性が高くなり、分布はガンマ分布に近くなり、障害が発生します。

結論として、RAID5のパフォーマンスは、書き込みおよびDBアプリケーションのRAID6よりも優れており、はるかに優れています。 Webサーバーなどのほとんど読み取りアプリケーションの場合、違いはないため、RAID6を使用する必要があります。大容量ストレージの場合、RAID10よりもRAID5を使用することのコスト上のメリットは非常に大きくなります。オーバーヘッドを許容できる場合は、ディスク集中型のアプリケーションにはRAID10を使用してください。 RAID10は常にパフォーマンスが向上します。

見逃された最大の収益はRAIDはバックアップではなく、冗長性を提供することでダウンタイムを制限する方法です。データが重要な場合は、バックアップする必要があります(そして回復プロセスをテストします)。

10 2TBのRAIDアレイが1つある場合SASドライブに障害が発生すると、回復に数千ドルのコストがかかり、回復が可能であっても数週間かかります。

すべてのRAIDアレイが最終的に失敗します!

3
Dr. Bombilious

これらの回答は理論上のドライブパフォーマンスのみに基づいているため、正しくないように見えます。 1 GBのキャッシュを備えたRAIDコントローラーがある場合、ユーザーまたはアプリケーションの観点から、書き込み(通常、通常の負荷の下-大規模な非通常の高負荷シナリオではない)は即時に行われます-書き込みはメモリに移動し、 「実際の」書き込みは、ドライブのパフォーマンスで発生します。

ただし、同じデータが最近または定期的に既に読み込まれていない限り、読み取りを「偽造」することはできません(キャッシュで高速化)。 RAID 6は読み取りに優れており、より耐性があります(2対1ドライブ)。 RAID 5は書き込みが遅く、再構築時には本当に遅くなります。

そのため、RAID 5は実際の書き込みでは遅くなりますが、優れたRAIDコントローラによって非表示にされます-ユーザー/アプリケーションの観点から、メモリ内で書き込みが発生します。ただし、RAID 5はRAID 6よりも読み取りが遅く、データが既に読み込まれていないか、アルゴリズムが繰り返し読み取りの記録を保持していない限り、コントローラーで改善されません。実生活では、レイド6が勝利します。

結論として、RAID 5の書き込みは低速ですが、優れたコントローラーによって非表示になっているため、RAID 5または6は基本的に、書き込みでの「認識される」パフォーマンスと同じになります(いくつかの例外があります)。ただし、RAID 6は読み取りが高速で、コントローラーは実際のワークロードで読み取りパフォーマンスを向上させるのに役立つとは考えられません。ここで、RAID 6は2つの失敗をとることができ、RAID 5 + 1は1つだけ失敗することを追加します。RAID6をより簡単に選択できるようになります。RAID5での再構築も非常に遅いことを忘れないでください。また、RAID 6ドライブが使用され(したがって、正しくテストされている)、故障したドライブはすぐに故障する傾向があることも知りました。アレイが30日以上稼働すると、それは何年も続く傾向があります。ホットスペアはテストされておらず、実際には必要なときにすぐに失敗する可能性があります。

1
Trevor

データの整合性の観点から厳密に言えば、そうです。 2つのドライブを安全に失う可能性がありますが、システムへの深刻な物理的外傷がない限り、2を失うことはまれです。

経済的にはそれほどではありません。ホットスペアは、必要になるまで電源を切ることができます。つまり、電力を使用せず、摩耗はありません。

そしていつものように、RAIDは適切なオフサイトバックアップ計画の代わりにはなりません。

あなたは10を考えましたか? RAID 6に十分なディスクがある場合は、10ボリュームを実行するのに十分です。ほとんどの場合、10の方が高速であり、冗長性があります(ディスク容量が多少犠牲になります)。

1
Joel Coehoorn

これらは事件の事実であり、彼らは議論されていません(彼らが話していることを知っている人は誰もが主張しています):

  1. RAID5 + hotspareは、文字通り、選択できるRAIDの選択肢として最悪のものです。
  2. RAID10は、データを重視する場合(たとえば、ビジネスを継続するためにデータに依存することを意味する場合)のデフォルトの選択である必要があります。

考えられるすべてのRAIDオプションを検討する場合、主にRAID5 +ホットスペアがある場合、4つのドライブがあり、4つのドライブでRAID6またはより良い、あなたはRAID10を行うことができます。

4つのドライブを使用すると、すべての選択肢(R5 + HS、R6、R10)から同じ使用可能なストレージが得られます。

目標がパフォーマンスである場合、RAID10はRAID5およびRAID6よりも優れています。

安全が目標の場合、RAID6またはRAID10は、ホットスペアの有無にかかわらずRAID5よりも優れています。どちらが安全かは議論の余地があります(6対10)。 RAID6は2つのドライブ障害に耐えることができますが、回復不能な読み取りエラー(URE)が原因で、RAID6の1つのドライブ障害が原因でアレイ全体が停止する可能性もあります。

RAID10は、パリティベースではないため、UREに関して同じ問題はありません。パリティRAID(R5など)がドライブを失い、次にUREを検出すると、アレイ全体が失われます。 RAID1またはRAID10では、ドライブが失われ、ミラーディスクでUREが検出された場合、読み取り不可能なセクターのみが失われます。

RAID5が最悪の選択肢である理由の詳細な説明はこちら を参照してください。 ドライブ数による合理的なRAID選択のリストについては、こちら も参照してください。 (ホットスペアに関係なく)RAID5が最良の選択ではないことに注意してください。

0
user1594322