web-dev-qa-db-ja.com

SASドライブにいくつかの不良ブロックがあるのは正常ですか、それともできるだけ早くドライブを交換する必要がありますか?

RAID 1ミラーの一部であるドライブに2つの不良ブロックがあります。 Adaptec Storage Mangerは、ブロックを検出したときに私に電子メールを送信しました。そのドライブに対して4つの中程度のエラーが表示されますが、状態は依然として「最適」です。

AdaptecRAIDコントローラーを使用するのはこれが初めてです。たまに悪いブロックが正常なのか、それともすぐにそのドライブを交換する必要があるのか​​わかりません。


更新:ドライブは同じ日に故障しました!


ディスクサブシステムは次のとおりです。

  • ZMMを搭載したAdaptec6405
  • (2)SeagateニアラインSASドライブ(ST31000424SS)

他のドライブはまだ不良ブロックを報告していません。整合性チェックを実行しています。

Adaptec Storage Manager screenshot

5
Nate

私は通常、自分の質問に答えることはありませんが、この場合、明確な答えがあります。ドライブをできるだけ早く交換してください。問題のドライブは同じ日に故障しました。

午前の早い時間に、次のような3通の電子メールを受け取りました。これが、ドライブに不良ブロックがあることを私が知った方法であり、唯一の警告でした。

======================================================================================

ADAPTEC's EMAIL NOTIFICATION MANAGER (Instant)

======================================================================================

Event Type   : Warning
Event Source    : [email protected]
Date     : 06/29/2011
Time     : 05:29:03 AM PDT

--------------------------------------------------------------------------------------
Event(s) List With Description
--------------------------------------------------------------------------------------
Bad Block discovered: controller 1 (21a6e00).
--------------------------------------------------------------------------------------

**[Note]:   This message was generated by the Adaptec Storage Manager Agent.
Please do not reply to this message.

その日の終わりまでに、それは失敗しました。

2
Nate

ドライブがアレイで使用されている場合、コントローラーはTime Limited ErrorRecoveryを設定します。これにより、ディスクがデータをすぐに読み取れない場合、ディスクは中程度のエラーを報告します。これは、読み取りエラーから回復しないことや、セクターが完全に読み取れないことを意味するものではありません。
(安価なSATAドライブはTLERをサポートしておらず、ドライブがデータを回復しようとしている間、読み取り操作がハングします。これは、安価なSATAドライブをアレイでバスに接続してはならない多くの理由の1つにすぎません。もちろんこれは当てはまりません。この特定の質問に)

セクターが読み取り不能であるとディスクが判断した場合、ディスクはセクターを再マップします。元の不良セクタはチェーンの上位に報告されないため、OSで実行されているソフトウェアはそれを知る方法がありません。できる唯一のことは、SMARTレポートを検索して、再マップされたセクターの数を確認することです。再マップされている多くのセクターは、今後の悪いことを示す良い兆候です。SMARTは、ディスクでソフトエラーとハードエラーが発生した回数も報告する場合があります。

いずれにせよ、SMART故障前の予測は役に立たなかった; Google SMART Study はそれを裏付ける。

7
Chris S

大型ドライブには不良セクタを移動するための余分なスペースがたくさんあります。2週間の間に数百のセクタが交換され、その後ドライブをさらに1か月間使用し続けました(RAID6なので、ラッシュはしませんでした)。

交換されたセクターがさらにいくつかあることを毎日警告し続ける場合は、失敗する前に交換します。ドライブを最初に使用したときの不良セクタのバーストはまったく怖いものではありませんが、継続的な状態は通常、エンクロージャ内の粒子または読み取り/書き込みヘッドの損傷を意味します。

4
Mark

私はSASドライブを使用していませんが、通常のSCSIドライブとIDEドライブがいくつかの不良ブロックを取得し、他の問題なしで何年も動作します。S.M.A.R.T.ステータスは、ドライブが低下し、障害が発生するリスクがあることを示します。

また、RAID 0以外のRAIDを使用している限り、障害が発生した場合でも保護されます。

2
James