web-dev-qa-db-ja.com

qfle3ドライバーによるVMWareホストのクラッシュ-bnx2iレガシードライバーへの復帰の解決

それは今しばらくの間起こっています。 「QLogic 57810 10ギガビットイーサネットアダプター」ネットワークカードを使用するいくつかの異なるホスト、Dellホストは、ネイティブqfle3ドライバーを使用している間、しばらくの間失敗しています。肯定的な結果なしに、負荷分散キューを無効にしてみました(ホストがクラッシュし続けました)。見つかった唯一の解決策は、bnx2iドライバーに戻すことでした。これは間違いなくホストのsopをクラッシュさせました。

ハードウェアの問題は複数のマシンで発生しているため破棄しています。ハードウェアの小売業者でさえ、それらのカードの一部を交換することに同意しましたが、まだ運がありません。ホストのバージョンは6.7.0であり、VMWareから直接回答を得るのに苦労しています-互換性マトリックスによると、ファームウェアは問題ありません。

他の誰かがこの問題に遭遇しましたか?問題は何でしょうか?

1
RedNano

2019-03-01を編集:VMwareサポートポータルで更新されたドライバーがリリースされました。

私は、HPE、Broadcom/QLogic/Cavium/Marvell(現在誰でも...)、およびVMwareとこの(または非常に類似した)問題に取り組むために7か月を費やしました。それはタフで、非常にピンクの(PSODのように)経験です。 2018年6月から2018年7月に、さまざまな構成のさまざまなデータセンターで開始されました。 HPEはqfle3を使用する必要があり、vSphere 6.0(bnx2の使用が許可されています)にはいくつかの主要な機能が不足していたため、私は岩と難しい場所の中間にいました。

2つの独立した問題があります(もっと多いかもしれませんが、私の問題に固有です):

  • iSCSIオフロード(bnx2iについて言及)ドライバーは不安定です。他のさまざまなアカウントを聞いたことがありますが、私の場合、ホストはiSCSIの構成後数秒または数分以内にPSODになります(多くの場合、ブートiSCSIログイン中にホストがクラッシュするため、ブートループが発生します)。 2018年12月下旬のベータドライバーは現在正常に動作しています。安定した/テスト済み/認定済みのドライバーは、2019年1月末(または2月上旬)にQLogicダウンロードポータルでMarvellによって公開される予定です。回避策:ソフトウェアiSCSIを使用します。
  • VSphere 6.7 RSSモジュールにバグがあり、vSphere 6.7U2(2019年春)で修正する必要があります。これにより、PSODやNMIが時々発生したり、ネットワーク接続が失われたりすることがよくあります(多くの場合、vMotionの後で)。回避策は、vSphere RSSロードバランサーを無効にすることですesxcli network nic queue loadbalancer set --rsslb=disable -n vmnicX

私の場合、すべての実稼働NICをIntel iSCSI(iSCSIもRSSもサポートしていない)に切り替える必要がありましたが、将来のいくつかの要件のため、引き続きケースをプッシュしました。

1
Don Zoomik