RAID10アレイのチェックが遅い、遅い

Question

新しいCentOS 7マシンを実行しています。 Linuxは2x SSDセットアップで動作し、4x SASドライブはソフトウェアRAID10でセットアップされています。RAID10アレイは大きく、4x 12TBドライブなので、24TBが使用可能です。

ファイルシステムは：ext4

これで、ファイルのコピーが完了し、レイドチェック（very first one）を実行しています。

Every 2.0s: cat /proc/mdstat Mon Oct 14 06:28:38 2019 Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] [faulty] md127 : active raid10 sdf1[3] sdd1[1] sde1[2] sdc1[0] 23437503488 blocks super 1.2 512K chunks 2 near-copies [4/4] [UUUU] [======>..............] check = 32.6% (7649123136/23437503488) finish=3402.6min speed=77333K/sec bitmap: 0/175 pages [0KB], 65536KB chunk md2 : active raid1 sdb2[1] sda2[0] 20478912 blocks [2/2] [UU] md3 : active raid1 sdb3[1] sda3[0] 447318976 blocks [2/2] [UU] bitmap: 3/4 pages [12KB], 65536KB chunk unused devices: <none>

約25万K /秒で開始しましたが、速度は低下し続け、現在は約75,000 K /秒です

現在、RAID10アレイのドライブは、他のものによって使用されていません。

私はすでに速度制限設定を微調整しました。

dev.raid.speed_limit_min = 100000 dev.raid.speed_limit_max = 1000000

CPU使用率は2％程度であり、RAM=無料のトンを取得し、RAIDアレイの4つのドライブはドライブあたり約25％のドライブ使用率を報告しているため、再同期。

私の質問：

これをスピードアップするにはどうすればよいですか？
そして、それが遅くなる原因は何ですか？

shodanshok · Accepted Answer

あなたのmessageファイルは、私が期待したものを正確に示しています。ディスク/エンクロージャーは、コマンドを継続的に中止してリセットしています。影響を受けるディスクは常にsdcであると思われるため、おそらくそれが原因です。

問題を解決する明白な行動はそれを交換することです。しかし、私は最初にしようとします：

ドライブと電源/データケーブルを取り付け直します。
sdcを別のディスクと交換し（SASケーブル/電源コードを変更するため）、エラーがドライブに続くか、またはまったく同じスロット/ポートにバインドされたままかどうかを確認します。
オプションで、dd if=/dev/sdc of=/dev/null bs=1M iflag=directを介してディスクから直接読み取り、追加のデバッグデータを取得します。

何らかの理由でドライブを交換できない場合は、dd if=/dev/zero of=/dev/sdc bs=1M oflag=directを使用してデバイスを完全に書き換え、不良ブロックの再割り当てを強制することができます。 大きな警告：これにより、sdc上のすべてのデータが完全かつ不可逆的に破棄されます。ドライブを実際に交換できない場合は、試してみてくださいonly。