web-dev-qa-db-ja.com

ZFS-zpoolreplaceが終了しない

私はubuntu14.04.1サーバーに5x 3TBraidz1アレイを持っています。先月、ドライブの1つが故障しました(カチッという音が聞こえます)。ドライブをzpool replace RAID <dead drive> <new drive>に交換することができました。それは問題なく終了し、プールは再びオンラインで健全になりました。その後、別のドライブが停止しました。同じことを試みましたが、プールが次の状態でスタックしています

# zpool status
  pool: RAID
 state: DEGRADED
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: resilvered 29.1G in 6h3m with 1028 errors on Mon Jan  5 05:35:35 2015
config:

NAME                                   STATE     READ WRITE CKSUM
RAID                                   DEGRADED     0     0 1.00K
  raidz1-0                             DEGRADED     0     0 2.01K
    ata-ST3000DM001-9YN166_Z1F15FAV    ONLINE       0     0     0
    ata-ST3000DM001-9YN166_Z1F15FCJ    ONLINE       0     0     0
    replacing-2                        DEGRADED     0     0     4
      17164957131155215254             UNAVAIL      0     0     0  was /dev/disk/by-id/ata-ST3000DM001-9YN166_Z1F15TBH-part1
      ata-ST3000DM001-1ER166_W500JFME  ONLINE       0     0     0
    ata-ST3000DM001-1ER166_Z500765Z    ONLINE       0     0     3
    ata-ST3000DM001-1CH166_W1F1M2C6    ONLINE       0     0     0

errors: 1028 data errors, use '-v' for a list

幸いなことに、データは必須ではありません。エラーについては心配していません(ファイルはビデオであり、引き続き正常に再生されます)。他の質問やフォーラムで提案されているように、私はこれを改善するために次のアクションを試しました。

# zpool offline RAID ata-ST3000DM001-9YN166_Z1F15TBH
cannot offline ata-ST3000DM001-9YN166_Z1F15TBH: no valid replicas

# zpool offline RAID 17164957131155215254
cannot offline 17164957131155215254: no valid replicas

# zpool detach RAID ata-ST3000DM001-9YN166_Z1F15TBH
cannot detach ata-ST3000DM001-9YN166_Z1F15TBH: no valid replicas

# zpool detach RAID 17164957131155215254
cannot detach 17164957131155215254: no valid replicas

また、zpool clear RAIDzpool scrubを実行して、resilversをトリガーしましたが、プールを上記と同じステータスのままにしました。次に、新しいディスクを削除しようとしましたが、奇妙なことに、同じ有効なレプリカがないというエラーが発生しました。

# zpool offline RAID ata-ST3000DM001-1ER166_W500JFME
cannot offline ata-ST3000DM001-1ER166_W500JFME: no valid replicas

どうすればいいのか途方に暮れています。置換は成功したようですが、zfsは元のディスクを手放しません。

# dkms status -v
spl, 0.6.3, 3.13.0-43-generic, x86_64: installed
zfs, 0.6.3, 3.13.0-43-generic, x86_64: installed

更新:/etc/zfs/zpool.cacheでzpoolキャッシュを削除し、再起動しました。再び銀色になり、報告します。

アップデート2:上記と同じステータスのままです。置換を完了する方法がない場合、データを失うことなくプールを再構築する方法はありますか?

更新3:最新のステータスは次のとおりです。

# zpool status
  pool: RAID
 state: DEGRADED
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: resilvered 29.1G in 6h1m with 1028 errors on Wed Jan  7 03:49:13 2015
config:

    NAME                                   STATE     READ WRITE CKSUM
    RAID                                   DEGRADED     0     0 1.00K
      raidz1-0                             DEGRADED     0     0 2.01K
        ata-ST3000DM001-9YN166_Z1F15FAV    ONLINE       0     0     0
        ata-ST3000DM001-9YN166_Z1F15FCJ    ONLINE       0     0     1
        replacing-2                        DEGRADED     0     0     0
          17164957131155215254             UNAVAIL      0     0     0  was /dev/disk/by-id/ata-ST3000DM001-9YN166_Z1F15TBH-part1
          ata-ST3000DM001-1ER166_W500JFME  ONLINE       0     0     0
        ata-ST3000DM001-1ER166_Z500765Z    ONLINE       0     0     0
        ata-ST3000DM001-1CH166_W1F1M2C6    ONLINE       0     0     0

errors: 1028 data errors, use '-v' for a list

5つのドライブすべてのsmartctlデータは ここ です。

3
KernelSanders

してみてください

zpoolオフラインzpoolデタッチ

例えば最初の投稿の場合zpool offline RAID 17164957131155215254 zpool detach RAID 17164957131155215254

2
user4845169

私はまったく同じステータスを持っていました:

   NAME                                              STATE     READ WRITE CKSUM
    RAIDZ0_01                                         DEGRADED     0     0     0
      raidz1-0                                        DEGRADED     0     0     0
        gptid/4fb5f83e-91b1-11e2-923c-000c292ee274    ONLINE       0     0     0
        gptid/50402028-91b1-11e2-923c-000c292ee274    ONLINE       0     0     0
        replacing-2                                   DEGRADED     0     0     0
          2345526077585836973                         UNAVAIL      0     0     0
 was /dev/gptid/72973ce8-f3bf-11e2-9759-000c292ee274
          gptid/19062bb3-c67f-11e4-8683-000c292ee274  ONLINE       0     0     0
        gptid/d69abb6b-3cd2-11e4-873f-000c292ee274    ONLINE       0     0     0
        gptid/51e62469-91b1-11e2-923c-000c292ee274    ONLINE       0     0     0
        gptid/528221a4-91b1-11e2-923c-000c292ee274    ONLINE       0     0     0
        gptid/53288697-91b1-11e2-923c-000c292ee274    ONLINE       0     0    36
        gptid/c8d9e708-cc4a-11e3-99b3-000c292ee274    ONLINE       0     0     0
    logs
      gptid/ade4947f-e365-11e3-8230-000c292ee274      ONLINE       0     0     0
    cache
      gptid/f0017430-e364-11e3-8230-000c292ee274      ONLINE       0     0     0

errors: 802342 data errors, use '-v' for a list

あなたが試したことに加えて、私もFreenasを更新しましたが、すべて結果がありませんでした。しかし、私の場合、古いドライブを取り外して、物理的に新しいドライブと交換することを余儀なくされました。私は太字にして、WebGUIを介してドライブを「切り離す」ことにしました。これにより、プールのステータスが「劣化」から「オンライン」にすぐに変更されました。

0
gradtje