web-dev-qa-db-ja.com

エラーなしでデバイスを再シルバー化するZFS

最近、お客様のサイトのバックアップサーバーのHDDをより大きなものに交換しました。 HP SE326M1 *上で動作するそのfreenasボックス。

ZFSがドライブを交換しているときに、大規模な停電が発生しました。

大きな問題ではありませんでした-ボックスが再び始まり、リシルバーも。

今日、私は何か面白いものを見つけました。別のドライブも再シルバー化ステータスを取得しました。ただし、zpool status -vには読み取り/書き込み/ cksumエラーはありません。

  pool: Tank
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Mar  4 15:37:53 2017
        3.41T scanned out of 4.51T at 24.7M/s, 13h3m to go
        302G resilvered, 75.43% done
config:

    NAME                                            STATE     READ WRITE CKSUM
    Tank                                            ONLINE       0     0     0
      raidz2-0                                      ONLINE       0     0     0
        gptid/ad81fb87-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/b30f664d-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/09b6b651-ff29-11e6-9a6a-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive was replaced
        gptid/beb62f74-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/c2c97ff3-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
      raidz2-1                                      ONLINE       0     0     0
        gptid/41b1a629-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/4756cd8e-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/508e74c7-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/575939b3-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive in question
        gptid/5d914967-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0

errors: No known data errors

ステータス「(resilvering)」は、最初のドライブのresilverが進行中である間、過去数時間に表示されました。

2番目のドライブも再シルバー化されている理由を特定する方法はありますか? gptid/575939b3-9785-11e6-894c-d8d385e6539aに表示されるエラーに関係なく、ZFSがzpool statusにresilverステータスを表示するのはなぜですか?

-

* HP-Serverには、書き込みスルーモードのP410レイドコントローラーがあります。すべてのドライブは独自のRAID-0として構成されています

2
Martin Seitl

それは再び起こりました、そして今度は私はログを持っています。 user121391は完全に正しく、問題のドライブに「再試行不能」エラーがあったことが判明しました。

Mar 12 08:22:14 freenas ciss0: *** Fatal drive error, Port=1I Box=1 Bay=14
Mar 12 08:22:14 freenas ciss0: (da9:ciss0:0:9:0): READ(10). CDB: 28 00 1b 50 ff 98 00 00 08 00 
Mar 12 08:22:14 freenas FATAL I/O ERROR on logical drive 9 (), SCSI port 0 ID 21
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): CAM status: SCSI Status Error
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI status: Check Condition
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI sense: MEDIUM ERROR asc:11,0 (Unrecovered read error)
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): Error 5, Unretryable error

このエラーの後、RAIDコントローラーがドライブを再接続し、これが再シルバーをトリガーしたようです。

2
Martin Seitl