web-dev-qa-db-ja.com

Hyper-V2008R2クラスターでVM)を開始できません

2つのノードを持つServer2008R2Hyper-Vクラスターがあります。 SANでCSVを使用します。私はそれらを管理するためにSCVMMを使用しています。最近、フェイルオーバーを引き起こすクラッシュがいくつか発生し、仮想マシンが停止して他のノードで起動しました。ほとんどの場合、これは問題なく機能しました。停電中のある時点で、両方のノードがSANにしばらくアクセスできず、CSVがオフラインになりました。フェールオーバークラスターマネージャーでオンラインにすることが機能し、ほとんどの仮想マシンが機能しました。うまく始めました。

ただし、1つの仮想マシンは起動しません。

  • SCVMMでは、欠落していると表示されます。
  • フェールオーバークラスターマネージャーでは、「SCVMMホスト名構成」リソースが失敗した状態でオフラインとして表示されます。
  • 失敗した構成リソースを開始しようとするか、仮想マシンを他のノードに移動しようとすると、5分間待機し、「エラーコード:0x80071714グループは別のノードに移動しているため、要求を受け入れることができません」というエラーが表示されます。

上記のエラー以外に、フェールオーバークラスターに最近関連するログがないか、どちらのノードにもWindowsイベントログがないようです。先週障害が発生したときからフェールオーバークラスターマネージャーで確認できる重大なイベントがいくつかあります。

  • イベントID21502:「SCVMMホスト名構成」は仮想マシンを仮想マシン管理サービスに登録できませんでした。
  • 25分後、イベントID 1230:クラスターリソース 'SCVMMホスト名構成'(リソースタイプ ''、DLL 'vmclusres.dll')がクラッシュまたはデッドロックしました。リソースホスティングサブシステム(RHS)プロセスは終了を試み、リソースは別のモニターで実行するようにマークされます。
  • それを5分間隔でさらに3回繰り返しました。
  • それ以来、ログはありません。

SAN上のファイルを見てきました。それらはすべて無傷のようです。 XML構成ファイルは有効であるようです(XMLファイルが破損した場合にこれが発生する可能性があることがいくつかの調査で示されています)。

編集:クラスター検証レポートも実行しました。失敗したリソースと、オンライン中にディスクをテストできなかったという予想されるエラーに加えて、すべてが正常に見えます。

この仮想マシンを再度実行するにはどうすればよいですか?

1
Grant

問題の原因が正確にわからないにもかかわらず、VMを再度実行するのは非常に簡単でした:

  • 問題が発生しているノードを特定するVM
  • VMMでメンテナンスモードにします(または、そのノードからすべてをライブマイグレーションします)。問題VMはまだそのノードでスタックします。
  • そのノードでクラスターサービスを停止してから、再開してください。

クラスターサービスを停止すると、VMは残りのノードの1つにすぐに引き継がれ、自動的に起動しました。

0
Grant