web-dev-qa-db-ja.com

RAIDで故障したハードドライブを特定する

カスタマイズされたバージョンのDebianを実行しているサーバーがあります。サンストレージレイドが付属しています。ツールが非常に限られており、新しいツールのインストールは許可されていません。 :(

dmesgに表示されるこのメッセージ:

end_request: critical target error, dev sda, sector 556782970
sd 0:0:0:0: [sda] Unhandled sense code
sd 0:0:0:0: [sda]  Result: hostbyte=0x10 driverbyte=0x08
sd 0:0:0:0: [sda]  Sense Key : 0x4 [current] 
sd 0:0:0:0: [sda]  ASC=0x44 ASCQ=0x0
sd 0:0:0:0: [sda] CDB: cdb[0]=0x28: 28 00 21 2f d5 7a 00 00 08 00
end_request: critical target error, dev sda, sector 556782970

したがって、セクター556782970に不良ブロックがあるようですが、交換できるように、どのハードドライブに属しているのかわかりません。

  • arcconf getlogsコマンドは、ドライブに関する問題を明らかにしません。

  • やった arcconf task start 1 logicaldrive 0 verify_fixしかし、これは役に立ちませんでした。

  • 私はe2fsck 小切手。一部のiノードを修正しようとしますが、上記の問題は残りました。 (私はその物理的な問題から推測します)。

詳細: http://Pastebin.com/cJ2bUywj

利用できないツール:(smartctl badblocks

3
p0werf00l

実際にarcconfを使用すると、次のような物理ドライブのステータスを確認できます。

arcconf getconfig 1 PD

障害状態のドライブを探して、障害としてマークされているドライブを特定します。参考までに、出力は次のようになります。

  Device #6
     Device is a Hard drive
     State                              : Failed
     Block Size                         : Unknown
     Supported                          : Yes
     Reported Channel,Device(T:L)       : 0,15(15:0)
     Vendor                             : *MISSING*
     Model                              : 
     Firmware                           : 
     Total Size                         : 0 MB
     Write Cache                        : Unknown
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     SSD                                : No
     MaxCache Capable                   : No
     MaxCache Assigned                  : No
1
ILIV

に基づく end_request: critical target error, dev sda, sector 556782970行、/ dev/sdaが問題の子だと思います。そのデバイスのシリアル番号は、次を使用して見つけることができます。

ls -l /dev/disk/by-id | grep "sda$"
1
jkt123

OSの情報を取得する答えがあるかもしれませんが、起動中にアクセスしたかどうかをコントローラーファームウェアが教えてくれる可能性があります。

カットアンドペーストで気付いたもう1つの点は、バッテリーに「故障」と表示されていることです。書き込みキャッシュのバッテリーがトーストであるため、ストライプが失敗を報告しているのだろうか?それは報告し、実際の悪いiノードはおそらく2つの問題があることを意味しますが。

Adaptec Controllersでの私の経験は、通常、バッテリーが切れたときに発生しますが、プリエンプティブな手段として書き込みキャッシュを無効にします。

1
MikeAWood