web-dev-qa-db-ja.com

ESXiホストがvCenterへの接続を失う

単一のESXIホストで非常に奇妙な問題が発生しています。

私は2つの同一のホスト、コアi3、6 nics、16g ramを持っています。 4つのNICは、すべて異なるVLANで、管理、vmotion、vmネットワークに使用されます。それらはすべて、静的トランク内のHP Procurve 24ポートギグスイッチに行きます。他の2つのNICはiSCSIです。

2つのVSSがあります。1つは4nicsで、もう1つは2とiSCSIトラフィックのみです。

両方のホストの構成は同じであり、ハードウェアも同じです。両方のホストは、CPUとメモリの両方で約30%の使用率で実行されています。 ESXI v。5.1を実行しています。

何が起こっているのかというと、突然のホスト2はすべてvCenterからドロップアウトします。 (vCenterは物理マシンでホストされています)。エラーはありません。接続が失われるだけです。

VCenterからホストにpingを実行しようとすると、できません。ワークステーションからpingを行おうとすると、ほとんどの場合、SSHで接続できます。 DCUIから「管理ネットワークをテスト」すると、ゲートウェイとDNSサーバーにpingを実行できます。管理ネットワークを再起動しても、vCenterからアクセスできません。

Services.shを再起動すると、エラーなしですべて完了しますが、役に立ちません。ホストは、vCenterに登録することも、vCenterからpingを実行することもできません。

これを改善する唯一のことは、ホストを完全に再起動することです。ログのエクスポートを行いましたが、この時点で何を探すべきかさえよくわかりません。どのログを見る必要がありますか?私が追加できる他の唯一の情報は、これが1日の同じ時間、早朝に発生しているように見えるということです。現在、何も実行されていません。バックアップジョブはありません。

2
TheEditor

ホワイトボックスハードウェアでこれらの問題が発生した場合は常に、関連する重要なコンポーネント(NIC、ストレージ)のドライバー(およびファームウェア)を確認し、 VMwareパッチポータル を使用してESXiディストリビューションの最新リビジョンに更新することをお勧めします。 =またはUpdateManager。

ラボまたはラボなし、古いビルドを実行しています:ESXi 1065491と現在のESXi 1483097

最初に、更新を実行します。 VMware ESXi 5のパッチは累積的ですか?

その後、実際のホストのログを調べて、vCenterの切断時間近くに何が起こっているかを確認します。小切手 /var/log/hostd.logおよび/var/log/vmkernel.log

ファイアウォール、DNS、またはその他のネットワークの問題がないことが確実な場合は、これが何が起こっているのかを理解する最善の方法です。

他のすべてが失敗した場合、これはisESXiであり、ストレージを共有しています。このようなビルドのトラブルシューティングに時間を費やしても、特に他のホストのパフォーマンスが良好な場合は、必ずしも役立つとは限りません。 PowerCLIを介して設定をコピーします 、再構築し、 復元 ホスト。

2
ewwhite