web-dev-qa-db-ja.com

RAIDのどのドライブに不良セクターがありますか?

LSI MegaRaid SASコントローラを使用して、単一の仮想ドライブに4つの物理ドライブがあります。ドライブの1つに(少なくとも)不良セクタがあると思われます:

  • 一部のファイルをバックアップしようとするとIOエラーが発生する
  • badblocksを実行すると、いくつかの不良セクターが報告されます

この問題の解決は、問題のあるディスクを交換してRAIDアレイを再構築するのと同じくらい簡単になることを願っています。 LSI MegaRaid WebBIOSで問題のあるディスクを特定できると思いましたが、不良セクターをチェックするオプションが見つかりません。

以下はWebBIOSのスクリーンショットです: enter image description here

問題のあるディスクをどのように特定できるかについて誰かがアドバイスを提供できますか?

3
James

Smartmontoolsには、LSI(および他の)RAIDアレイを介してSMARTデータをドライブにポーリングすることを可能にする拡張機能があります。通常、これは、RAID抽象化が直接覆い隠しているため、実行できることではありません。ドライブとのインターフェース。

Smartmontoolsがマシンにインストールされていない可能性があります。ただし、ほとんどのディストリビューションのほとんどの「メインリポジトリ」にネイティブであり、Windowsバージョンさえあります。 http://sourceforge.net/projects/smartmontools/files/

次のように、LSI MegaRAIDコントローラの背後にあるドライブをポーリングするために使用できます。

smartctl -a -d megaraid,N /dev/sdX

ここで、「-a」はすべてのディスクデータを表示することを意味し、-dはデバイスタイプ(この場合はメガレイド)を意味し、その後にNが続くと、そのコントローラーのドライブ番号を意味します。スロット0のドライブにアクセスするには、ここで0と言います。 4つのドライブすべてをポーリングする場合は、このコマンドを4回実行し、Nを0から3に置き換えます。sdXは、オペレーティングシステム内で通常見られるRAID抽象化そのものです。あなたのものはおそらくsdaです。

各ドライブからの長い出力が表示されます。探しているのは、報告された一般的なSMARTエラー(コントローラーがドライブを拒否していないため、見つからない可能性があります)のいずれかです)、または「オフラインの修正不可能なセクター」または「保留中のセクター」が報告されました。このフィールドに0を超えるドライブは不良です。いずれかの値を1ずつインクリメントするには失敗した読み取りのLOTがかかるため、これらのフィールドに慈悲を与えるべきではありません。

次のような短いテストまたは長いテストを実行することもできます(上記と同じルールが適用されます)。

smartctl -t [long|short] -d megaraid,N /dev/sdX

8
Spooler

RAIDがエラーを渡した場合、明らかに何かがサイレントに修正できない問題があります。

読み取りエラーが発生した場合は、これらのブロックのすべての冗長コピーが破棄されていることを意味します。スペアがないため、障害のあるドライブは取り出されません。

書き込みエラーが発生した場合は、1つのドライブが書き込みエラーを報告し続けており、RAIDは現在冗長ではないため、ドライブを排出できません。冗長構成で書き込みエラーが表示されることはありません。その場合は、コントローラーを交換してください。

さらにディスクを追加できる場合は、3番目のミラーを作成します-リカバリが失敗し、ファイルシステムをチェックする必要がありますが、できる限り多くのデータをそのままにしておく必要があります。コントローラが壊れたディスクをすべて追い出します。

クリーンセットアップに戻ったら、これらのエラーが問題になる前にキャッチするために、スケジュールされたチェックをセットアップします。

5
Simon Richter

LinuxまたはWindowsを使用している場合は、システムを起動し、megacliユーティリティを使用します。

megacli -pdlist -aALL

結果で「ファームウェアの状態」の行を確認します。劣化したディスクは次のように表示されます。

Firmware state: Offline
2