web-dev-qa-db-ja.com

RAID10アレイのチェックが遅い、遅い

新しいCentOS 7マシンを実行しています。 Linuxは2x SSDセットアップで動作し、4x SASドライブはソフトウェアRAID10でセットアップされています。RAID10アレイは大きく、4x 12TBドライブなので、24TBが使用可能です。

ファイルシステムは:ext4

これで、ファイルのコピーが完了し、レイドチェック(very first one)を実行しています。

Every 2.0s: cat /proc/mdstat                                                                                                                                                                                         Mon Oct 14 06:28:38 2019

Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] [faulty]
md127 : active raid10 sdf1[3] sdd1[1] sde1[2] sdc1[0]
      23437503488 blocks super 1.2 512K chunks 2 near-copies [4/4] [UUUU]
      [======>..............]  check = 32.6% (7649123136/23437503488) finish=3402.6min speed=77333K/sec
      bitmap: 0/175 pages [0KB], 65536KB chunk

md2 : active raid1 sdb2[1] sda2[0]
      20478912 blocks [2/2] [UU]

md3 : active raid1 sdb3[1] sda3[0]
      447318976 blocks [2/2] [UU]
      bitmap: 3/4 pages [12KB], 65536KB chunk

unused devices: <none>

約25万K /秒で開始しましたが、速度は低下し続け、現在は約75,000 K /秒です

現在、RAID10アレイのドライブは、他のものによって使用されていません。

私はすでに速度制限設定を微調整しました。

dev.raid.speed_limit_min = 100000

dev.raid.speed_limit_max = 1000000

CPU使用率は2%程度であり、RAM=無料のトンを取得し、RAIDアレイの4つ​​のドライブはドライブあたり約25%のドライブ使用率を報告しているため、再同期。

私の質問:

  1. これをスピードアップするにはどうすればよいですか?

  2. そして、それが遅くなる原因は何ですか?

4
Mr.Boon

あなたのmessageファイルは、私が期待したものを正確に示しています。ディスク/エンクロージャーは、コマンドを継続的に中止してリセットしています。影響を受けるディスクは常にsdcであると思われるため、おそらくそれが原因です。

問題を解決する明白な行動はそれを交換することです。しかし、私は最初にしようとします:

  • ドライブと電源/データケーブルを取り付け直します。
  • sdcを別のディスクと交換し(SASケーブル/電源コードを変更するため)、エラーがドライブに続くか、またはまったく同じスロット/ポートにバインドされたままかどうかを確認します。
  • オプションで、dd if=/dev/sdc of=/dev/null bs=1M iflag=directを介してディスクから直接読み取り、追加のデバッグデータを取得します。

何らかの理由でドライブを交換できない場合は、dd if=/dev/zero of=/dev/sdc bs=1M oflag=directを使用してデバイスを完全に書き換え、不良ブロックの再割り当てを強制することができます。 大きな警告:これにより、sdc上のすべてのデータが完全かつ不可逆的に破棄されます。ドライブを実際に交換できない場合は、試してみてくださいonly

1
shodanshok