web-dev-qa-db-ja.com

Hyper V VMがランダムに接続を失うのはなぜですか?

約2週間に1回、奇妙な断続的な接続の問題が発生しています。

最初の構成:2つの物理ホスト(node01とnode02)を持つHyperVフェールオーバークラスターを実行しています。ホストは両方とも、SP1が適用されたWindows Server 2008 R2 HyperVサーバー(無料)を実行しています。これらのホストでは、Windows Server 2008 R2 WebエディションSP1を実行する2つのVMを実行しています。ストレージサーバーは、iSCSIを介して接続されたWindows Storage Server 2008です。ホストとストレージサーバーの両方で、インテルのWebサイトから直接ダウンロードされた最新のネットワークドライバーが実行されています。

ここに問題があります:99.99%の時間、すべてが完全に動作します。 2〜3週間に1回程度、VMは両方とも着信と発信の両方で同時にネットワーク接続を失います。これが起こるとき、

  1. どちらのVMにもRDPできません。
  2. どちらのホストにもRDPできます。
  3. ノードを右クリックして[仮想マシンに接続]を選択すると、フェールオーバークラスターマネージャーからVMのいずれかに接続できます。
  4. 上記の#3で説明したようにVMに接続すると、LAN上のWebサイトやマシンにアクセスできなくなります。VMは問題を解決しません。
  5. VMを別のノードに移動すると、問題が修正されます(今後2週間)。
  6. ホストを再起動してVMをホストに戻すと、問題が修正されます(今後2週間)。
  7. この場合、フェイルオーバークラスターはVMを自動的にフェイルオーバーしません。
  8. ホストまたはVMのいずれにも異常なイベントログエントリはありません。

これは、上記と同じ症状で約5回発生しました。ネットワークドライバーまたはネットワークハードウェアの問題だと思いますが、既に最新のドライバーを実行しているので、どうすればよいかわかりません。

これは本当のスクラッチャーです...何かアイデアはありますか?

更新

私はここで非常に似たケースを見つけました: 仮想マシンがHyper Vクラスターのネットワーク接続を失います

2011年7月29日更新

修正プログラムをインストールしてネットワークドライバを更新した後も、同じ問題が発生します。ハードウェアの詳細を求めるコメントに応えて、サーバーはIntel SR1670HVです。これは、2つの独立したS5500HVマザーボードを含む1Uシャーシです。通信は、Intel 82574Lであるマザーボードの内蔵NICを介して行われます。ネットワークドライバはバージョン16.2.49.0です。

10
Mike

これはハードウェアの問題であることが判明しました。問題をNetgear GSM7224v2管理対象スイッチに特定し、D-Link DGS-1024Dに置き換えました。それ以来、すべてが正常に機能しています。

「教訓」として、この場合、ハードウェアの問題であることが判明した診断設定の99%をソフトウェア設定のトラブルシューティングに費やした可能性があります。マイクロソフトサポートに259ドルも支払って(そして電話で長い時間を費やして)、ソフトウェアの設定をざっと調べてそれを理解できるようにしました。この話の教訓は、ソフトウェアと同じくらいハードウェアを疑うことだと思います。

2
Mike

私は今、このような問題を抱えていました。正確な詳細は覚えていませんが、最終的な解決策は、仮想ネットワークアダプターに動的に割り当てられた競合するMACアドレスに関するものでした。それらをそれらに固定することは、動的にはなりませんでした。仮想マシンを別のホストに移動することが困難になる可能性があるため、通常はそれを行いたくありませんが、この場合は役立ちました。

もう1つは、物理NICがBroadcomによって作成され、以前の管理者がBroadcomユーティリティを誤って使用して、2つのNICをホスト上でトランクし、帯域幅/スループットを向上させたという構成エラーが発生したことです。そのセットアップを削除してNICの1つを構成したので、ホストマシンにはIPがまったくありませんが、仮想ゲストへのパススルーには引き続き使用できます。次に、各仮想マシンが一方または他方のNICのみを使用するように設定し、履歴トラフィックに基づいて負荷を分散します。もちろん、これは、アダプターまたは接続がダウンしてもフェイルオーバーが発生しないことを意味し、トラフィックが時間の経過とともにバランスが保たれているかどうかを確認できていませんが、それ以来、安定しています。

7
Joel Coel

これは古い質問であることは承知していますが、同じ問題が発生し、解決に多くの時間を費やしたため、効果的な解決策を共有したいと思いました。私はここに私の問題の解決策を見つけました:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

私の状況での解決策は、TCP VMのオフロードを無効にすることでした。リンクから関連セクションを引用します。

TCPオフロードを無効にするために、Broadcom 8507 Nextreme II NICに接続されている各VMに新しいレジストリ値を作成して設定する必要がありました。

次のレジストリ変更を使用して、TCPオフロードを無効にしました。

キー:HKLM\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters

値(DWORD):DisableTaskOffload = 1

無効にした後TCPオフロードごとにVMこのようにしてすべての問題が解決し、複数のVMを1つに接続することができましたNIC = Broadcom 5708 Nextreme II NICのポート。

私のサーバーにはBroadcom NetExtreme NICなので、この問題の原因は明らかにドライバに関連しているようですが、DisableTaskOffload = 1に設定すると、問題は完全に解決しました。この情報が他の誰かの検索の時間を節約することを願っています!

5
BruceHill

より単純なHyper-V環境で同様の問題に遭遇し、Microsoftでこの記事に遭遇しました。 Webサーバーが頻繁に使用されている場合、状況に合うようです。

http://support.Microsoft.com/kb/974909 -Windows Server 2008 R2ベースのコンピューターで大量の発信ネットワークトラフィックが発生すると、実行中のHyper-V仮想マシンのネットワーク接続が失われる

3
Christopher

私たちの場合は24〜48時間ごとでしたが、同じ問題がありました。ウイルス対策/ファイアウォール製品がHyper-VでServer 2008を特別にサポートしていることを再確認します。そうでない場合は、問題が解消するかどうかをテストするために、別の(または可能であれば一時的に削除する)ウイルス対策/ファイアウォール製品を試してください。

マイクロソフトに電話をかけ、後でいくつかのダンプ/ログファイルをアップロードした後、彼らはTrendMicro OfficeScanが私たちの事件の犯人であると判断しました。 Hyper-Vでは明示的にサポートされていないことが判明したバージョンを使用していたため、最新のリリースにアップグレードすると、問題は解消しました。

2
Jesse

VMゲストのネットワークアダプタープロパティで、ジャンボパケットとラージセンドオフロードを無効にしましたか?これらの設定に関する私の経験に基づいて、私は間違いなくそれを試します。

1
Greg Askew