web-dev-qa-db-ja.com

raid6アレイでどのディスクが不良か

サーバー:Ubuntu Lucid
RAIDコントローラー:Adaptec 3805
HP Proliant DL180G5ハードウェア上のRAID6の8台のディスク

私のkern.logは、以下に示すように、sdbでエラーが発生したことを示しています。

[2740390.344436] sd 4:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[2740390.344439] sd 4:0:1:0: [sdb] Sense Key : Hardware Error [current]
[2740390.344442] sd 4:0:1:0: [sdb] Add. Sense: Internal target failure
[2740390.344447] sd 4:0:1:0: [sdb] CDB: Read(10): 28 00 33 dd dc 00 00 00 08 00
[2740390.344454] end_request: I/O error, dev sdb, sector 870177792
[2774094.573841] sd 4:0:1:0: [sdb] Unhandled sense code
[2774094.573847] sd 4:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[2774094.573851] sd 4:0:1:0: [sdb] Sense Key : Hardware Error [current]
[2774094.573856] sd 4:0:1:0: [sdb] Add. Sense: Internal target failure
[2774094.573862] sd 4:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 33 dd ef e8 00 00 01 00 00 00
[2774094.573873] end_request: I/O error, dev sdb, sector 5165150184
[2774094.615437] sd 4:0:1:0: [sdb] Unhandled sense code

arcconfコマンドは、すべてのディスク状態がオンラインで失敗したストライプであることを示しています:はい

8ディスクraid6アレイからどのディスクが不良であるかを特定するにはどうすればよいですか?

修正: 2012年5月2日-以下を追加:

/ usr/local/sbin/arcconf getconfig 1 AL

Controllers found: 1
----------------------------------------------------------------------
Controller information
----------------------------------------------------------------------
Controller Status                        : Optimal
Channel description                      : SAS/SATA
Controller Model                         : Adaptec 3805
Controller Serial Number                 : 0C18115C3BB
Temperature                              : 0 C/ 32 F (Normal)
Installed memory                         : 128 MB
Copyback                                 : Disabled
Background consistency check             : Disabled
Automatic Failover                       : Enabled
Global task priority                     : High
Stayawake period                         : Disabled
Spinup limit internal drives             : 0
Spinup limit external drives             : 0
Defunct disk drive count                 : 0
Logical devices/Failed/Degraded          : 2/0/0
NCQ status                               : Enabled
--------------------------------------------------------
Controller Version Information
--------------------------------------------------------
BIOS                                     : 5.2-0 (17342)
Firmware                                 : 5.2-0 (17342)
Driver                                   : 1.1-5 (2461)
Boot Flash                               : 5.2-0 (17342)
--------------------------------------------------------
Controller Battery Information
--------------------------------------------------------
Status                                   : Optimal
Over temperature                         : No
Capacity remaining                       : 99 percent
Time remaining (at current draw)         : 3 days, 1 hours, 11 minutes

----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical device number 0
Logical device name                      : boot
RAID level                               : 1
Status of logical device                 : Optimal
Size                                     : 476150 MB
Read-cache mode                          : Enabled
Write-cache mode                         : Enabled (write-back)
Write-cache setting                      : Enabled (write-back)
Partitioned                              : Yes
Protected by Hot-Spare                   : No
Bootable                                 : Yes
Failed stripes                           : No
Power settings                           : Disabled
--------------------------------------------------------
Logical device segment information
--------------------------------------------------------
Segment 0                                : Present (0,7)             Z2AD1A3H
Segment 1                                : Present (0,3)             Z2AD1834

Logical device number 1
Logical device name                      : data
RAID level                               : 6 Reed-Solomon
Status of logical device                 : Optimal
Size                                     : 2858990 MB
Stripe-unit size                         : 128 KB
Read-cache mode                          : Enabled
Write-cache mode                         : Enabled (write-back)
Write-cache setting                      : Enabled (write-back)
Partitioned                              : Yes
Protected by Hot-Spare                   : No
Bootable                                 : No
Failed stripes                           : Yes
Power settings                           : Disabled
--------------------------------------------------------
Logical device segment information
--------------------------------------------------------
Segment 0                                : Present (0,0)             6VPEFSZ0
Segment 1                                : Present (0,1)             5VPA5934
Segment 2                                : Present (0,2)             5VPA7132
Segment 3                                : Present (0,4)             5VPAJ8EJ
Segment 4                                : Present (0,5)             5VPA6NAZ
Segment 5                                : Present (0,6)             5VPAJM8Q


----------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
  Device #0
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,0(0:0)
     Reported Location                  : Connector 0, Device 0
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 6VPEFSZ0
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #1
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,1(1:0)
     Reported Location                  : Connector 0, Device 1
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 5VPA5934
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #2
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,2(2:0)
     Reported Location                  : Connector 0, Device 2
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 5VPA7132
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #3
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,3(3:0)
     Reported Location                  : Connector 0, Device 3
     Vendor                             : ST500DM0
     Model                              : 02-1BD142
     Firmware                           : KC44
     Serial number                      : Z2AD1834
     Size                               : 476940 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #4
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,4(4:0)
     Reported Location                  : Connector 1, Device 0
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 5VPAJ8EJ
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #5
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,5(5:0)
     Reported Location                  : Connector 1, Device 1
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 5VPA6NAZ
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #6
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,6(6:0)
     Reported Location                  : Connector 1, Device 2
     Vendor                             : ST375052
     Model                              : 5AS
     Firmware                           : JC4B
     Serial number                      : 5VPAJM8Q
     Size                               : 715404 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled
  Device #7
     Device is a Hard drive
     State                              : Online
     Supported                          : Yes
     Transfer Speed                     : SATA 3.0 Gb/s
     Reported Channel,Device(T:L)       : 0,7(7:0)
     Reported Location                  : Connector 1, Device 3
     Vendor                             : ST500DM0
     Model                              : 02-1BD142
     Firmware                           : KC44
     Serial number                      : Z2AD1A3H
     Size                               : 476940 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     NCQ status                         : Enabled


Command completed successfully.

以下に追加されたパーティション情報で更新

**fdisk -l**

Disk /dev/sda: 499.3 GB, 499289948160 bytes
255 heads, 63 sectors/track, 60701 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0002ab26

Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1       59952   481562624   83  Linux
/dev/sda2           59953       60702     6022145    5  Extended
/dev/sda5           59953       60702     6022144   82  Linux swap / Solaris

WARNING: GPT (GUID Partition Table) detected on '/dev/sdb'! The util fdisk doesn't support GPT. Use GNU Parted.


Disk /dev/sdb: 2997.9 GB, 2997878784000 bytes
255 heads, 63 sectors/track, 364471 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

Device Boot      Start         End      Blocks   Id  System
/dev/sdb1               1      267350  2147483647+  ee  GPT



**df -h**
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda1             453G  112G  319G  26% /
none                 1000M  224K 1000M   1% /dev
none                 1005M     0 1005M   0% /dev/shm
none                 1005M  664K 1004M   1% /var/run
none                 1005M  4.0K 1005M   1% /var/lock
none                 1005M     0 1005M   0% /lib/init/rw
/dev/sdb1             2.7T  1.5T  1.1T  58% /media/raid1
/dev/sdb1             2.7T  1.5T  1.1T  58% /media/usbhd-sdb1
/dev/sda1             453G  112G  319G  26% /media/usbhd-sda1


**fstab**
# /etc/fstab: static file system information.
#
# Use 'blkid -o value -s UUID' to print the universally unique identifier
# for a device; this may be used with UUID= as a more robust way to name
# devices that works even if disks are added and removed. See fstab(5).
#
# <file system> <mount point>   <type>  <options>       <dump>  <pass>
proc            /proc           proc    nodev,noexec,nosuid 0       0
# / was on /dev/sda1 during installation
UUID=12dd3c31-6dba-4c26-ba81-88a76510bffd /               ext4    errors=remount-ro 0               1
# swap was on /dev/sda5 during installation
UUID=81618042-ec4e-45e9-947f-9198d29651d3 none            swap    sw              0       0
UUID=a7832728-5bf9-45c4-8a29-2824b4f2c250 /media/raid1    ext4    errors=remount-ro,noatime 0       1
2
sixnumber

RAIDセットアップのボリューム「boot」がsdaとして認識され、「data」がsdbとして認識されるとすると、システムは次のように通知します。

[2740390.344436] sd 4:0:1:0:[sdb]結果:hostbyte = DID_OK driverbyte = DRIVER_SENSE

Scsiサブシステムが(adaptecカードの)低レベルドライバにエラーなしでコマンドを発行し、カードがエラーで応答しました(DRIVE_SENSEが設定されています)。

[2740390.344439] sd 4:0:1:0:[sdb]センスキー:ハードウェアエラー[現在]

これはエラーのタイプです(つまり、 scsiドライバー情報 を参照)。

[2740390.344442] sd 4:0:1:0:[sdb]追加。センス:内部ターゲット障害

これはドライバーが報告する追加情報ですが、私が知る限り、この情報は「特定の情報がない」/「何が悪かったのかわからない」という意味です。

[2740390.344454] end_request:I/Oエラー、dev sdb、セクター870177792

エラーはブロックレイヤーに到達しました。

別の回答で述べられているように、これは単一のディスク障害ではなく、レイド全体の障害です。データを注意深くチェックし、レイドサブシステムまたは少なくともコントローラーの交換を検討する必要があります。

また、RAIDコントローラーで常に(!)「バックグラウンド整合性チェック」/「パッシブスキャン」/「検証」を有効にして、再構築の場合にRAIDを強制終了する可能性のあるサイレント破損を見つける必要があります。

ファイルシステムエラーはありましたか?/dev/sdbはパーティション化/マウントされていますか?

3
tim

私が間違っていない限り、これらのエラーは、RAIDコントローラーによって修正されていないエラーがあることを示しています。 RAIDコントローラーはそのようなエラーをあなたから隠しているはずです。単純なディスク障害はないと思います。もっと深刻なことが起こっていると思います。

3
wfaulk

これはおかしなことに聞こえますが、サーバーの前面を見て、エラーLEDが点灯しているドライブを確認しましたか? (ドライブにLEDがあると仮定)

また、ストレージマネージャーソフトウェアをインストールすることもできます: http://www.adaptec.com/en-us/downloads/storage_manager/sm/productid=sas-3805&dn=adaptec+raid+3805.html

1
TheCleaner

Smartctl(CLI)またはAdaptecのCLI(上記のとおり)を介して情報を取得できる可能性があります

0
thinice

サーバーを再起動できる場合は、SmartStartDVDから再起動してください。覚えていれば、そこからACUにアクセスして、RAIDボリュームをグラフィカルに表示できます。

0