web-dev-qa-db-ja.com

SSDの問題:CRCエラーの上昇、フリーズ、時々読み取り専用

私のラップトップSSD は機能しており、エラーの数は 前回の投稿 以来急上昇しました。

このドライブは死んでいるか死んでいますか?
現在オンであり、これを書いています-私はすべてのデータをバックアップしましたが、それが使用可能かどうかはまだわかりませんか?

製造元に連絡してもあまり役に立ちませんでした。Windowsをインストールしてそこからディスクチェックユーティリティを実行するか、外部ドライブとしてWindowsホストに接続してテストするように頼まれました。
両方を実行しましたが、エラーは発生しませんでした。

また、提供するユーティリティで確認しました(下のスクリーンショットを参照)。次に、clonezillaで作成したイメージを使用してUbuntuに戻りましたが、SATA PHYのエラーカウントが300に近いことがわかりました。

コネクタも確認しましたが、SSDはラップトップにあるため、ケーブルを(簡単に)変更することはできません。

これらは、メーカーのユーティリティによって生成されたテスト結果です

Test results

また、Ubuntuでのsmartctl出力は後で:

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     SPCC Solid State Disk
Serial Number:    XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (   30) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (   2) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       6352
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       2717
168 Unknown_Attribute       0x0012   100   100   000    Old_age   Always       -       0
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       25
173 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       105447539
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       77
194 Temperature_Celsius     0x0023   070   070   000    Pre-fail  Always       -       30
196 Reallocated_Event_Count 0x0000   100   100   000    Old_age   Offline      -       0
218 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       15431
241 Total_LBAs_Written      0x0012   100   100   000    Old_age   Always       -       6281157

SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.077  [VENDOR SPECIFIC]
  ca 00 80 b0 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 30 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 b0 8e 12 e1 00      00:11:08.075  WRITE DMA
  ca 00 80 30 8e 12 e1 00      00:11:08.074  WRITE DMA

Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.039  [VENDOR SPECIFIC]
  ca 00 80 b0 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 30 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 b0 7b 12 e1 00      00:11:08.037  WRITE DMA
  ca 00 80 30 7b 12 e1 00      00:11:08.037  WRITE DMA

Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.974  [VENDOR SPECIFIC]
  ca 00 80 b0 48 12 e1 00      00:11:07.973  WRITE DMA
  ca 00 80 30 48 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 b0 47 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 30 47 12 e1 00      00:11:07.972  WRITE DMA

Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.927  [VENDOR SPECIFIC]
  ca 00 80 b0 2a 12 e1 00      00:11:07.926  WRITE DMA
  ca 00 80 30 2a 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 b0 29 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 30 29 12 e1 00      00:11:07.924  WRITE DMA

Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.899  [VENDOR SPECIFIC]
  ca 00 80 b0 22 12 e1 00      00:11:07.898  WRITE DMA
  ca 00 80 30 22 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 b0 21 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 30 21 12 e1 00      00:11:07.896  WRITE DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      6288         -
# 2  Conveyance offline  Completed without error       00%      6285         -
# 3  Short offline       Completed without error       00%      6285         -
# 4  Extended offline    Completed without error       00%      6283         -
# 5  Extended offline    Completed without error       00%      6283         -
# 6  Short offline       Completed without error       00%      6283         -
# 7  Extended offline    Completed without error       00%      6262         -
# 8  Conveyance offline  Completed without error       00%      6262         -
# 9  Conveyance offline  Completed without error       00%      6262         -
#10  Extended offline    Completed without error       00%      6262         -
#11  Short offline       Completed without error       00%      6262         -
#12  Conveyance offline  Completed without error       00%      6211         -
#13  Extended offline    Completed without error       00%      6211         -
#14  Short offline       Completed without error       00%      6211         -
#15  Short offline       Completed without error       00%      6075         -
#16  Conveyance offline  Completed without error       00%      5564         -
#17  Extended offline    Completed without error       00%      5564         -
#18  Short offline       Completed without error       00%      5564         -
#19  Conveyance offline  Completed without error       00%      5319         -
#20  Short offline       Completed without error       00%      5319         -
#21  Conveyance offline  Completed without error       00%      4403         -

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
6
Muaad ElSharif

SSDを交換してください

人々はコメントで多くのことを試しましたが、このSSDにはいくつかの問題があるようです

S.M.A.R.Tの読み取り値から判断すると、お使いのドライブは多くのアクションを見ていません(1日に最大250の電力、約6 TBが書き込まれています)。これは保証の範囲内です。

私のアドバイスは

  • すべてのデータをすぐにバックアップします(既にカバーされていると言いますが)
  • sSDの取り外し/交換(もちろん予算に応じて)
  • 交換のためにディスクをメーカーに送ります

Slim S70」ディスクは、Silicon Powerwarranty

それらを送信するだけです ここでRMAリクエスト

6
Robert Riedl

2017年5月11日より前に、SSDファームウェアを更新しました。ただし、新しいバージョンが 2017年9月 でリリースされたため、Windowsを使用して適用する必要があります。


fstrimを実行して、ファイルシステム内の未使用ブロックを破棄します。

$ Sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed

私の場合、Windows 10パーティション/mnt/cおよび/mnt/eの結果はこの世界のものではありませんでした。そのため、ファイルをチェックしましたが、データに害はありませんでした。


パーティションがマウントされていないときにLive-USBで起動した後、SSDでfsck -fを実行します。別のオプションは、grubからfsck -fを実行しています- 起動可能なUSBスティックを使用して、ハードドライブがマウント解除されている間にハードドライブをfsckする方法


コメントで述べたように、不良なSATAケーブルはエラーを引き起こす可能性があります。しかし この回答 が指摘しているように、接続が緩んでいるとエラーが発生する可能性もあります。不良/緩い接続を除外するには、SSDからプラグを取り外し、プラグとドライブのオスピンに圧縮空気を吹き付け、ケーブルをしっかりと取り付け直します。


あなたの時間はどれくらいの価値がありますか?

最後の質問は、あなたの時間にどれだけの価値があるかです。この問題に10時間を費やしたと仮定すると、多くの新しい120GB SATA III SSDが ebay.com から購入できるため、1時間あたり5ドルになります


2018年2月23日更新

今夜、他のすべての答えを読みました。 1つの答えはそれを返すと言います。しかし、もしあなたが間違って何も見つけなければ、彼らは単にそれを送り返すでしょう、そしてあなたは2週間から2ヶ月の間ドライブなしでいるでしょう。

別の回答では、smartctlはドライブに問題はないと報告しています。

この回答では、fsck -fを実行することを提案しましたが、エラーは報告されていないと回答しました。

fsck起動ごとに実行

否定的な答え(それを返す)と肯定的な答え(何も間違っていない)の間の妥協案として、私の傾向は ブートごとにfsckを実行する になります。エラーが検出された場合、起動は一時停止され、エラーメッセージを読むことができます。リンクの使用を要約するには:

Sudo tune2fs -c 1 /dev/sdX

注:Xをドライブ文字、つまりabなどに置き換えます

1か月間エラーがなかった場合、値を1から30に変更します。これは、ほとんどのシステムで一般的なことです。一般的なSSDでは、fsckはすぐに実行されます。

SATAケーブルをきれいにして再装着する

他の人は、ラップトップにとって問題のあるSATAケーブルの交換に言及しました。妥協案として、ドライブ側のすべてのケーブルを外し、オスとメスの端に圧縮空気を使用してから、ケーブルをしっかりと差し込んでください。

3

ドライブに問題はありません。すべてのテストに合格します。単にSMARTデータを誤って解釈しているだけです。

まず、最初のスクリーンショットには生データが含まれており、それについて結論を出すことはできません。その作成者が何をデータが誰にでもなると考えるかはわかりませんが、実際には何の意味もありません。ウィンドウまたは何かを右にスクロールしても意味のある列に到達できない場合。

SMARTレポート(投稿した後者のレポート)の列について説明します。

  • 属性名:メトリックの名前
  • 値:現在の値、高いほど良い。多くの場合、値は100から100(最良)になりますが、値が大きいほど優れています。メトリックが「エラー率」のようなものであっても、正規化されているため、値が高いほどエラー率は低くなります。
  • 悪い:最悪の観測値、高いほど良い。
  • しきい値:値がこれを下回った場合、失敗状態です。またはそれ以上=パス。
  • タイプ:このメトリクスの失敗条件の意味。
    • Old_age:このメトリックは、特定の問題ではなく、ドライブの年齢/使用量を示します。
    • 事前障害:このメトリックは、ドライブの潜在的な問題を示しており、ドライブ障害の可能性が高くなります。
  • When_failed:これが失敗モードになったとき
  • Raw_value:値に寄与したドライブの内部測定-これはエンドユーザーにとっては有用ではなく、値がこれより低い場合も高い場合も、必ずしも良いまたは悪いことを示すわけではありません。

レポートの特定の領域に対処するには:

SMART総合健康自己評価テスト結果:合格

これは合格したすべてを反映しています。測定されたメトリックのいずれも、これまでに障害状態に入ったことはありません。

「エラー」のログは、ドライブの比較的典型的なものです。これらは、必ずしも回復不能なエラーやドライブ自体の問題を示すものではありません。それらのレポートはあいまいであるため、コントローラーでのDMA転送中であることを除いて、これから実際に何が起こったのかわかりませんが、重要な場合は全体のヘルスレポートに反映されます。特に、これらは、コントローラー側でキャンセルされた書き込みや、ドライブがサポートしていないロード中に何らかの機能を要求するOSのように、かなり無害なものである可能性があります。

最後に、CRCエラーまたはエラー率に関する注意:すべてのドライブにはエラー率があります。ドライブは、エラー訂正コードを使用することにより、一定数のビットエラーが予想され、設計されているような高密度でデータを保存します。エラー訂正コードにより、ビットチャンクごとに一定数のビットエラーが発生し、100%訂正されることが保証されます。ドライブは常にエラー訂正コードを常に適用しており、エラー訂正コードは、ランダムに発生する回復不能エラーの可能性が非常に低くなるように設計されています(例えば、宝くじ)よく機能するドライブで。統計にエラー率が表示され、それが大したことではないように扱われている場合、そうではないため、エラーが修正されます。

2
thomasrutter

WRITE DMAエラーしかないため、and short and longテストではエラーは表示されません。

DMAはダイレクトメモリアクセスに関するものなので、BIOSに個別のハードウェア診断テストがあるかどうかを確認し、メモリ関連のテストを試してください。

BIOS組み込みテストが利用できない場合、オフラインのハードウェア診断が利用できる場合は製造元のサポートサイトをご覧ください(例:CDまたはUSBスティックに書き込むブート可能なISOファイル)

(ところで:Ubuntuのcdにはメモリ診断もあります)

DMA書き込みはIOであるため、SATAケーブルを交換して、新しいエラー番号が追加されないかどうかを確認します(最後のエラー番号は298ですが、今すぐ追加できます)

0
jringoot