web-dev-qa-db-ja.com

S.M.A.R.T-予測障害数

IBM ServeRAID M5015コントローラーのRAIDステータスをMegaCLIで監視していますが、これをディスクの1つに持っています:

Enclosure Device ID: 252
Slot Number: 6
Enclosure position: 0
Device Id: 14
Sequence Number: 2
Media Error Count: 32
Other Error Count: 0
Predictive Failure Count: 18
Last Predictive Failure Event Seq Number: 8119
PD Type: SAS
Raw Size: 279.396 GB [0x22ecb25c Sectors]
Non Coerced Size: 278.896 GB [0x22dcb25c Sectors]
Coerced Size: 278.464 GB [0x22cee000 Sectors]
Firmware state: Online, Spun Up
SAS Address(0): 0x5000c50042c319c9
SAS Address(1): 0x0
Connected Port Number: 5(path0)
Inquiry Data: IBM-ESXSST9300653SS     B6336XN04HC10525B633
IBM FRU/CRU: 81Y9671
FDE Capable: Not Capable
FDE Enable: Disable
Secured: Unsecured
Locked: Unlocked
Needs EKM Attention: No
Foreign State: None
Device Speed: 6.0Gb/s
Link Speed: 6.0Gb/s
Media Type: Hard Disk Device
Drive:  Not Certified
Drive Temperature :33 Celsius

これはどういう意味ですか?正確な説明が見つかりません。詳細を確認する方法はありますか? RAIDアレイは最適な状態です。

メディアエラー数:2

予測障害数:18

交換する必要があるディスクを物理的に知るために、CLIを介して前面のLEDをオンにする方法はありますか?

4
Bastien974

ディスクにエラーがあります。 S.M.A.R.T。自己監視、分析、レポートテクノロジを意味します

あなたが言及する特定のエラーは、ドライブの機械的劣化に関連しています。このレポートを使用して、IBMの保証交換を取得できます。ドライブは最終的に失敗します。

7
ewwhite

シーゲイトのドキュメントから:

予測障害

スマート。ドライブが一定期間許容範囲を超えて動作している場合、予測障害を通知します。ファームウェアは、各属性のエラー率が許容できない回数の実行カウントを保持します。これを達成するために、エラーレートが許容できない場合はカウンターがインクリメントされ、エラーレートが許容可能な場合は常にデクリメントされます(ゼロを超えないように)。カウンターが継続的に増加して予測しきい値に達すると、予測エラーが通知されます。このカウンターは障害と呼ばれます

歴史カウンター。属性ごとに個別の障害履歴カウンターがあります。

故障したディスクを特定する方法は次のとおりです。

MegaCli -PdLocate -start -physdrv\[E:S] -aA
  • E:エンクロージャー
  • S:スロット
  • A:アダプター
4
Bastien974

この時点でドライブは物理的に故障しています。現在心配する必要がある最も重要なことは、データの適切なバックアップと、そのドライブをできるだけ早く交換する計画です。

3
DanBig