web-dev-qa-db-ja.com

MegaCLIはドライブ「その他のエラー」を引き起こします

「megalci-PDList-aAll」を実行すると、サーバーのペアにある6枚のディスクのうち2枚についてその他のエラーがログに記録されるという問題が発生しています。これがまた詳細です。

2台のDellR610サーバーがあります。それぞれに6枚のディスクがあり、次のように構成されています。

RAID1の2x 160gb SATAディスク

4 x 300gb SAS RAID10のディスク

ディスクをチェックするmegacliコマンドを実行すると、SATAドライブにエラーが記録されます。これは両方のサーバーに当てはまります。つまり、4台のドライブが影響を受けます。

私には2つのことが必要です。これが発生している理由とそれを停止する方法を見つけるための支援が必要です。また、Nagiosが私を放っておくために、エラーを解消するための支援も必要です。現在、私はそれらの目標を達成するためのあらゆる方法を受け入れています。

2つのサーバーはCentOS6.3x64上にあります。 MegaCLIバージョン1.01.39、バージョン8.02.21、またはバージョン8.04.07のいずれを使用しても、エラーが発生します。これは、最初の3つのドライブに対するMegacli -PDList-aAllの出力です。これは、2つの不良ドライブと1つの良好なドライブを示しています。

 [root @ nfs1b〜]#/ opt/MegaRAID/MegaCli/MegaCli64 -PDList -aAll 
 

アダプター#0
エンクロージャデバイスID:32 スロット番号:0 ドライブの位置:ディスクグループ:0、スパン:0、アーム:0 エンクロージャ位置:N/A デバイスId:0 WWN: シーケンス番号:2 メディアエラー数:0 その他のエラー数:1001 予測失敗数:0 最後の予測障害イベントシーケンス番号:0 PDタイプ:SATA
未加工サイズ:149.049 GB [0x12a19eb0セクター] 非強制サイズ:148.549 GB [0x12919eb0セクター] 強制サイズ:148.5 GB [0x12900000セクター] ファームウェアの状態:オンライン、スピンアップ デバイスファームウェアレベル:8A22 シールドカウンター:0 診断の成功:N/A SASアドレス(0):0x1221000000000000 接続済みポート番号:0(path0) お問い合わせデータ:K85DTA926Y1YFUJITSU MHZ2160BK G2 8A22 FDE対応:対応不可 FDE有効:無効 保護:非保護 ロック:ロック解除 EKMが必要注意:いいえ 外部状態:なし デバイス速度:不明 リンク速度:不明 メディアタイプ:ハードディスクデバイス ドライブ温度:N/A PI適格性:いいえ ドライブはPI情報用にフォーマットされています:いいえ PI:いいえPI ポート-0: ポートステータス:アクティブ ポートのリンク速度:不明 ドライブはSMARTアラートにフラグを立てました:いいえ
エンクロージャーデバイスID:32 スロット番号:1 ドライブの位置:ディスクグループ:0、スパン:0、アーム:1 エンクロージャーの位置:N/A デバイスId:1 WWN: シーケンス番号:2 メディアエラー数:0 その他のエラー数:1001 予測失敗数:0 最後の予測障害イベントシーケンス番号:0 PDタイプ:SATA
未加工サイズ:149.049 GB [0x12a19eb0セクター] 非強制サイズ:148.549 GB [0x12919eb0セクター] 強制サイズ:148.5 GB [0x12900000セクター] ファームウェアの状態:オンライン、スピンアップ デバイスファームウェアレベル:8A22 シールドカウンター:0 正常な診断完了:N/A SASアドレス(0):0x1221000001000000 接続済みポート番号:1(path0) お問い合わせデータ:K85DTA926W8EFUJITSU MHZ2160BK G2 8A22 FDE対応:対応不可 FDE有効:無効 保護:非保護 ロック:ロック解除 EKMが必要注意:いいえ 外部状態:なし デバイス速度:不明 リンク速度:不明 メディアタイプ:ハードディスクデバイス ドライブ温度:N/A PI適格性:いいえ ドライブはPI情報用にフォーマットされています:いいえ PI:いいえPI ポート-0: ポートステータス:アクティブ ポートのリンク速度:不明 ドライブはSMARTアラートにフラグを立てました:いいえ
エンクロージャーデバイスID:32 スロット番号:2 ドライブの位置:ディスクグループ:1、スパン:0、アーム:0 エンクロージャーの位置:N/A デバイスId:2 WWN: シーケンス番号:2 メディアエラー数:0 その他のエラー数:0 予測失敗数:0 最後の予測障害イベントシーケンス番号:0 PDタイプ:SAS
生のサイズ:558.911 GB [0x45dd2fb0セクター] 非強制サイズ:558.411 GB [0x45cd2fb0セクター] 強制サイズ:558.375 GB [0x45cc0000セクター] ファームウェアの状態:オンライン デバイスファームウェアレベル:D1S4 シールドカウンター:0 正常な診断完了:N/A SASアドレス(0):0x50014ee7aab51c32 SASアドレス(1):0x0 接続ポート番号:2(path0) お問い合わせデータ:WD WD6001BKHG D1S4WXF1E62KUYR7 FDE対応:対応不可 FDE有効:無効 セキュア:非セキュア ロック:ロック解除 EKMが必要注意:いいえ 外部状態:なし デバイス速度:不明 リンク速度:不明 メディアタイプ:ハードディスクデバイス ドライブ温度:26C(78.80 F) PI適格性:いいえ ドライブはPI情報用にフォーマットされています:いいえ PI:PIなし ポート-0: ポートステータス:アクティブ ポートのリンク速度:不明 ポート-1: ポートステータス:アクティブ ポートのLi nkspeed:不明 ドライブはS.M.A.R.Tアラートにフラグを立てました:いいえ


enter code here

これはDellによってブランド変更されたLSI製造のカードであるため、ブランド変更のため、MegaCLIの使用に関するDellのヘルプまたはLSIのヘルプを取得できません。私のグーグルは恩恵をもたらしませんでした。

1
Kellen

それが起こっている理由に関して、MegaCliソフトウェアのそのバージョンはSATAドライブでサポートされていないコマンドを発行しているようです。これは、コントローラーのイベントログを取得することで確認できます。

MegaCli64 -AdpEventLog -GetLatest 100 -f events.log -aALL

実行後、events.logファイルにはコントローラーエラーイベントが含まれます。実際に原因がドライブに発行されたサポートされていないコマンドである場合、エラーイベントは次のようになります。

イベントの説明:予期しないセンス:PD 07(e0x20/s7)パス1221000007000000、CDB:4d 00 4d 00 00 00 00 00 20 00、センス:5/24/00

この一般的なコードの表 によると、5/24/00のセンスコードは「不正な要求-CDB(コマンド記述子ブロック)の無効なフィールド」です。

2
Raman

この問題の解決策を見つけました。

私はついにMegaCLIのバージョン を見つけました4 そしてそれは私の古いFijutsuSATAドライブのようです。

リンクが将来廃止された場合でも、 少し掘り下げて -「MegaRAID820X」というタイトルが付いているのであれば、ダウンロードは引き続きLSIのサイトで利用できるはずです。 MegaCLI-Linux、バージョン3.00.03 "で、バージョン4.00.16をダウンロードで提供しています。

1
Kellen