S.M.A.R.T-予測障害数

Question

IBM ServeRAID M5015コントローラーのRAIDステータスをMegaCLIで監視していますが、これをディスクの1つに持っています：

Enclosure Device ID: 252 Slot Number: 6 Enclosure position: 0 Device Id: 14 Sequence Number: 2 Media Error Count: 32 Other Error Count: 0 Predictive Failure Count: 18 Last Predictive Failure Event Seq Number: 8119 PD Type: SAS Raw Size: 279.396 GB [0x22ecb25c Sectors] Non Coerced Size: 278.896 GB [0x22dcb25c Sectors] Coerced Size: 278.464 GB [0x22cee000 Sectors] Firmware state: Online, Spun Up SAS Address(0): 0x5000c50042c319c9 SAS Address(1): 0x0 Connected Port Number: 5(path0) Inquiry Data: IBM-ESXSST9300653SS B6336XN04HC10525B633 IBM FRU/CRU: 81Y9671 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: 6.0Gb/s Link Speed: 6.0Gb/s Media Type: Hard Disk Device Drive: Not Certified Drive Temperature :33 Celsius

これはどういう意味ですか？正確な説明が見つかりません。詳細を確認する方法はありますか？ RAIDアレイは最適な状態です。

メディアエラー数：2

予測障害数：18

交換する必要があるディスクを物理的に知るために、CLIを介して前面のLEDをオンにする方法はありますか？

ewwhite · Answer

ディスクにエラーがあります。 S.M.A.R.T。は自己監視、分析、レポートテクノロジを意味します

あなたが言及する特定のエラーは、ドライブの機械的劣化に関連しています。このレポートを使用して、IBMの保証交換を取得できます。ドライブは最終的に失敗します。

Bastien974 · Answer

シーゲイトのドキュメントから：

予測障害

スマート。ドライブが一定期間許容範囲を超えて動作している場合、予測障害を通知します。ファームウェアは、各属性のエラー率が許容できない回数の実行カウントを保持します。これを達成するために、エラーレートが許容できない場合はカウンターがインクリメントされ、エラーレートが許容可能な場合は常にデクリメントされます（ゼロを超えないように）。カウンターが継続的に増加して予測しきい値に達すると、予測エラーが通知されます。このカウンターは障害と呼ばれます

歴史カウンター。属性ごとに個別の障害履歴カウンターがあります。

故障したディスクを特定する方法は次のとおりです。

MegaCli -PdLocate -start -physdrv\[E:S] -aA

E：エンクロージャー
S：スロット
A：アダプター

DanBig · Answer

この時点でドライブは物理的に故障しています。現在心配する必要がある最も重要なことは、データの適切なバックアップと、そのドライブをできるだけ早く交換する計画です。