web-dev-qa-db-ja.com

デバイス(SATAドライブ)のバッファーI / Oエラー

サーバーのカーネルログ(ファイル操作を担当)の1つにこれらのメッセージが表示され続けます。これらの問題がどれほど深刻であるかを誰かが知っているのだろうか。ディスクは独自の3ウェアカード(非常に限られたtw_cliユーティリティ)で処理されるため、smartmontoolsを使用できません。

[2522065.275739] sd 0:0:1:0: [sdg] CDB: 
[2522065.275741] Read(10): 28 00 2e 90 97 f8 00 00 08 00
[2522065.275750] end_request: I/O error, dev sdg, sector 781228024
[2522065.281091] Buffer I/O error on device sdg, logical block 97653503
[2522065.287157] sd 0:0:1:0: [sdg] Device not ready
[2522065.287163] sd 0:0:1:0: [sdg]  
[2522065.287166] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[2522065.287168] sd 0:0:1:0: [sdg]  
[2522065.287170] Sense Key : Not Ready [current] 
[2522065.287174] sd 0:0:1:0: [sdg]  
[2522065.287176] Add. Sense: Logical unit not ready, cause not reportable
[2522065.287179] sd 0:0:1:0: [sdg] CDB: 
[2522065.287181] Read(10): 28 00 00 00 00 00 00 00 20 00
[2522065.287190] end_request: I/O error, dev sdg, sector 0
[2522065.291147] Buffer I/O error on device sdg, logical block 0
[2522065.291147] Buffer I/O error on device sdg, logical block 1
[2522065.291147] Buffer I/O error on device sdg, logical block 2
[2522065.308465] sd 0:0:1:0: [sdg] Device not ready
[2522065.308465] sd 0:0:1:0: [sdg]  
[2522065.308465] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[2522065.308465] sd 0:0:1:0: [sdg]  
[2522065.308465] Sense Key : Not Ready [current] 
[2522065.308465] sd 0:0:1:0: [sdg]  
[2522065.308465] Add. Sense: Logical unit not ready, cause not reportable
[2522065.308465] sd 0:0:1:0: [sdg] CDB: 
[2522065.308465] Read(10): 28 00 00 00 00 00 00 00 08 00
[2522065.308465] end_request: I/O error, dev sdg, sector 0

ありがとう!

2
fonnera

スマート値を使用できます。例:

 smartctl -a -d 3ware,2 /dev/twe0

SmartctlのマンページをQoutする:

Under Linux and FreeBSD, to look at ATA disks behind 3ware SCSI RAID controllers, use syntax such as:
          smartctl -a -d 3ware,2 /dev/sda
          smartctl -a -d 3ware,0 /dev/twe0
          smartctl -a -d 3ware,1 /dev/twa0
          where in the argument 3ware,N, the integer N is the disk number (3ware ´port´) within the 3ware ATA RAID controller.  The allowed values of N are from 0  to  31  inclusive.   The  first  two
          forms,  which  refer to devices /dev/sda-z and /dev/twe0-15, may be used with 3ware series 6000, 7000, and 8000 series controllers that use the 3x-xxxx driver.  Note that the /dev/sda-z form
          is deprecated starting with the Linux 2.6 kernel series and may not be supported by the Linux kernel in the near future. The final form, which refers to devices /dev/twa0-15,  must  be  used
          with 3ware 9000 series controllers, which use the 3w-9xxx driver.

          Note  that  if the special character device nodes /dev/twa? and /dev/twe? do not exist, or exist with the incorrect major or minor numbers, smartctl will recreate them on the fly.  Typically
          /dev/twa0 refers to the first 9000-series controller, /dev/twa1 refers to the second 9000 series controller, and so on. Likewise /dev/twe0 refers to  the  first  6/7/8000-series  controller,
          /dev/twa1 refers to the second 6/7/8000 series controller, and so on.

あなたの質問についてのいくつかのアイデアについて:

これはまだHDD/SSDの本格的な問題ではないかもしれませんが、できるだけ早く変更することをお勧めします。

まだ行っていない場合は、バックアップを作成してください。

次のような問題を確認できます。

e2fsck -fv /dev/sdX

スマート内に再割り当てされたセクターがある場合は、私の意見ではドライブを変更する必要があります。

2
Dennis Nolte

(たとえば)を使用してスマート情報にアクセスできます。

smartctl -a -d 3ware,N /dev/twa0

Nはポートnr、twa0はコントローラーです。

以下を使用すると、いくつかのインターフェイスエラー統計を取得できます。

smartctl -l sataphy -d 3ware,N /dev/twa0

そのコマンドを使用して、CRCカウントが増加したためにログに記録し続けた「ATA例外」がインターフェース/ケーブルエラーの結果であると判断できました(最終的にはディスクを別のタイプに交換する必要がありました。メインボードの交換同じタイプは役に立ちませんでした)。これを見ると、通常のSATAコントローラーは3Wareポートよりも多くの情報を提供します。

「バッファエラー」については、これまでに一度も経験したことがないため、推測することはできません。私は過去に(ソフトウェアRAIDで)多くの「ATA例外」を経験しましたが、これはほとんど常に障害の前兆でした。したがって、今はそのログをスキャンします。

1
Halfgaar