web-dev-qa-db-ja.com

SMARTCTLレポートからHDDがどれだけ死んでいるかを判断する方法

今日、開いているターミナルで、「ハードドライブが故障しそうです!」というランダムなレポートがありました。

私はいくつかのテストを行いましたが、これがどれほど悪いかはわかりません。コンピューターは正常に動作していますが、先に進んですべての作業をgithubにプッシュしました。クラッシュしてすべてが失われる可能性がある場合は、このコンピューターで作業を続けたくありません。

ドライブはHDDです-WesternDigital CaviarSEシリアルATA

安定したドライブの場合、通常のsmartctlはどのようになりますか?

SMART属性:

enter image description here

テストが失敗する:

enter image description here

11
new Objekt

私はいくつかのテストを行いましたが、これがどれほど悪いかわかりません

短い答え:

このドライブをバックアップし、すぐに交換します。

長い答え:

Backblaze という会社が、ハードドライブの障害に関するデータを収集しました。そのデータを会社のブログで公開し、どのメーカーのドライブが他のドライブよりも頻繁に故障したかを強調しています。

最近のブログ では、どの5 SMART属性が差し迫ったドライブ障害を示しているかを正確に示すデータを公開しました:

経験から、次の5つのSMARTメトリックは、差し迫ったディスクドライブの障害を示しています。

  • SMART 5 –Reallocated_Sector_Count。
  • SMART 187 –Reported_Uncorrectable_Errors。
  • SMART 188 –Command_Timeout。
  • SMART 197 –Current_Pending_Sector_Count。
  • SMART 198 –Offline_Uncorrectable。

これらの5つの統計は、メーカー間で一貫性があり、障害の優れた予測因子であるため、業界の他の人からの経験と入力に基づいて選択しました。

記事はさらに次のことを示唆しています。

SMART 5: Reallocated_Sector_Count
1-4 keep an eye on it, more than 4 replace

SMART 187: Reported_Uncorrect
1 or more replace

SMART 188: Command_Timeout
1-13 keep an eye on it, more than 13 replace

SMART 197: Current_Pending_Sector_Count
1 or more replace

SMART 198: Offline_Uncorrectable
1 or more replace

あなたのケースでは、5(生の値2)、197(生の値484)、および198(生の値371)が失敗の兆候を示しています。

11
DavidPostill