web-dev-qa-db-ja.com

劣化したアレイ。 3つのディスクに障害が発生したRAID 6

RAID 6および16ドライブを備えたディスクのアレイがあります。数日前に3台のディスクに障害が発生し、アレイは劣化としてマークされました。データにアクセスできず、オペレーティングシステムを起動できません。データにアクセスする必要がありますが、何もできません。何かアドバイス?データを回復またはアクセスするにはどうすればよいですか?ライブCDを使用してOSを起動できますか? SAS Diskを使用しています。よろしくお願いします。

12
Arturo Castro

前述のように、RAID-6アレイの3つ以上のディスクが停止すると、アレイは回復できなくなります。

ただし、3つのディスク障害が同時に発生することはほとんどありません。エンクロージャ、バックプレーン、コントローラに障害が発生している可能性があります。

ディスクを取り外して再度挿入し、コントローラーやエンクロージャーを交換して、同じコントローラーを持つ別のサーバーにディスクを配置してみてください(使用可能なコントローラーがある場合)。

42
Massimo

サーバーの種類、RAIDコントローラーの種類など、具体的な情報は提供しません。

10分間すべてをオフにしてみてください...サーバーの電源を切ります。ドライブをスピンダウンさせます。

サーバーの電源を入れて、RAIDコントローラがドライブを再認識し、起動できるかどうかを確認します。

19
ewwhite

コメントで述べたように、RAID6は最大2つのディスク障害に耐えることができます。 3番目のディスクに障害が発生した場合、アレイはトーストです。

最も明白なことは、バックアップから復元することです。これが不可能な場合、障害が発生したディスクの少なくとも1つがまだ読み取り可能な場合(読み取りエラーはありますが)、障害が発生した各ディスクのブロックレベルのコピーを別の正常なディスク(例:ddrescue <failed_disk> <new_disk>)そして、これらのコピー(および他の適切なディスク)を使用してアレイを再起動します。

元のデータが失われたり破損したりするパンクチャド配列で終了します。ただし、運が良ければ、データの大部分にアクセスできるはずです。

バックアップがなく、障害が発生したディスクを読み取ることができない場合は、データレスキューサービスに連絡する必要があります。

14
shodanshok
  1. タグの内容に関係なく、ソフトウェアRAIDはおそらくありません。ソフトウェアRAID6からOSを起動することはできません。

  2. サーバーを床に落とした場合を除いて、16台のうち3台のディスクが同時に故障することはほとんどありません。 3つのディスクが大きな時間間隔で1つずつ故障していて、誰も気付かないか、コントローラ、ケーブル、電源装置、バックプレーンの故障、またはファームウェアのバグのいずれかが発生しています。回復戦略は異なります。アクセス可能なBIOSまたはRAIDコントローラーのログがある場合があります。

  3. どちらの場合も、最初に、動作することがわかっている別のコントローラーを使用して、すべてのディスクを別のメディアにバックアップします。その過程で、実際に壊れているディスクの数とその量がわかります。

  4. ほとんど(おそらくすべて)のハードウェアRAIDコントローラはがらくたです。私は難しい方法を学びました。 「ディスク障害」状態は、実際には単一の不良セクターである可能性があり、ほとんど(またはすべて)のデータが回復可能である可能性があります。

  5. 「機能が低下した」アレイとは、すべてのデータにアクセス可能なアレイです。あなたが説明するのは、「劣化」ではなく「故障」または「オフライン」アレイです。これらの問題に経験がない場合は、ISに連絡してください。

  6. リカバリー/ライブCDから開始することは、プロセスの一部である場合とそうでない場合があります。ファイルシステムを読み取り専用モードでマウントする方法がわからない場合は、知っている人に連絡してください。そのような間違いによって完全に回復可能なデータを殺すことは可能です。


眠れない夜を何度も過ごした後、最初のディスクに障害が発生するとすべてが機能しなくなるようにサーバーを設計しました。これは、誰も無視しない唯一のエラーメッセージです。

7
fraxinus

バックアップから回復します。このRAID LUNにデータが表示されることはもうありません。

5
RiGiD5

RAID 6は、障害が発生した2台のハードドライブのみに耐えることができます。バックアップがなく、データが必要な場合は、ハードドライブの復旧会社に依頼することをお勧めします。ハードドライブを操作すればするほど、データを回復できない可能性が高くなるので、自分でデータを回復しようとはしません。

2
Joe

最後の手段として(他のユーザーがすでにここに回答として投稿したすべてを試した後)、1つのドライブをオンライン/非劣化として強制することができます。

ハードウェアRAID 6の非常に古いドライブ6台のうち3台が故障したというケースがありました。私は幸運で、一部のデータを回復できました。

  1. 2台の故障したドライブを取り外した
  2. ハードウェアRAIDコントローラのオプションで、3番目に故障したドライブをオンラインとして強制しました(機能低下ではありません)。
  3. 2つの新しいドライブを入れる
  4. アレイを再構築しました
  5. そして最後に故障したドライブを取り外しました

私は幸運で関連データを失いませんでしたが、もちろんこのアプローチではデータの破損/損失のリスクがありますが、それ以外の場合はRAIDのデータが失われるため、RAIDコントローラがそのオプションを提供する場合は一撃の価値があるかもしれません。

0
Zauberfisch