web-dev-qa-db-ja.com

vSphere ESX 5.5ホストがNFSサーバーに接続できない

概要:私の問題は、ホストがpingを実行できるにもかかわらず、ESXホストからNFSデータストアとしてQNAP NFSサーバーを使用できないことです。私はすべてのネットワークトラフィック(NFSを含む)と各vmkernelアダプターのサブネットにLACPアップリンクを備えたvDSを利用しています。

セットアップ:vSphereを評価していて、2つのvSphere ESX 5.5ホスト(node1とnode2)があり、それぞれに4x NICがあります。 LACP/802.3adを使用してスイッチとチーム化し、各ホストのLAGをアップリンクとして2つのホスト間に分散スイッチを作成しました。ネットワーキングはすべて分散型スイッチを経由します。理想的には、DRSと冗長性を利用したいと考えています。ドメインコントローラーVM( "Central")およびvCenter VM( "vCenter")がnode1で実行されており(node1のローカルデータストアを使用)、両方のホストが接続されている両方のホストがvCenterデータセンター内にあり、HAとDRSが現在無効になっているクラスターにあります。

QNAP TS-669 Pro(バージョン4.0.3)(TS-x69シリーズはVMware Storage HCL上にあります)をNFSデータストアのNFSサーバーとして使用します。802.3adとスイッチを組み合わせて2x NICがチーム化されています。

vmkernel.log:ホストのvmkernel.logからのエラーはあまり役に立ちません:

NFS: 157: Command: (mount) Server: (10.1.2.100) IP: (10.1.2.100) Path: (/VM) Label (datastoreNAS) Options: (None) cpu9:67402)StorageApdHandler: 698: APD Handle 509bc29f-13556457 Created with lock[StorageApd0x411121]
cpu10:67402)StorageApdHandler: 745: Freeing APD Handle [509bc29f-13556457]
cpu10:67402)StorageApdHandler: 808: APD Handle freed!
cpu10:67402)NFS: 168: NFS mount 10.1.2.100:/VM failed: Unable to connect to NFS server.

ネットワークセットアップ:これが私の 分散スイッチのセットアップ(JPG)です。 これが私のネットワークです。

  • 10.1.1.0/24 VM管理(VLAN 11)
  • 10.1.2.0/24ストレージネットワーク(NFS、VLAN 12)
  • 10.1.3.0/24 VM vMotion(VLAN 13)
  • 10.1.4.0/24 VMフォールトトレランス(VLAN 14)
  • 10.2.0.0/24 VMのネットワーク(VLAN 20)

vSphereアドレス

  • 10.1.1.1 node1の管理
  • 10.1.1.2 node2の管理
  • 10.1.2.1 node1 vmkernel(NFSの場合)
  • 10.1.2.2 node2 vmkernel(NFSの場合)
  • 等.

その他の住所

  • 10.1.2.100 QNAP TS-669(NFSサーバー)
  • 10.2.0.1ドメインコントローラー(node1上のVM)
  • 10.2.0.2 vCenter(node1上のVM)

次の設定でCisco SRW2024Pレイヤー2スイッチ(ジャンボフレームが有効)を使用しています。

  • Node1(ポート1から4)のLACP LAG1は、VLAN VLAN for VLAN 11-14,20として設定されています。
  • ルーター(ポート5から8)のLACP LAG2は、VLAN VLAN 11-14,20のトランクとして設定されています。
  • Node2(ポート9から12)のLACP LAG3は、VLAN VLAN for VLAN 11-14,20として設定されています。
  • タグなしのトラフィックをVLAN 12に受け入れるように設定されたQNAP(ポート23および24)設定用のLACP LAG4

各サブネットは別のサブネットにルーティング可能ですが、vmk1からNFSサーバーへの接続には必要ありません。他のすべてのトラフィック(vSphere Web Client、RDPなど)は、この設定を適切に通過します。専用の物理NIC=でVMware Workstationセットアップの上部にあるESXホストVMを使用して、QNAP NFSサーバーを事前にテストしましたが、問題はありませんでした。

NFSサーバー共有のACLは許容範囲内であり、すべてのサブネット範囲に共有へのフルアクセスを許可します。

node1 vmk1からQNAPにpingを実行できます。NFSに使用する必要があるアダプターです。

~ # vmkping -I vmk1 10.1.2.100
PING 10.1.2.100 (10.1.2.100): 56 data bytes
64 bytes from 10.1.2.100: icmp_seq=0 ttl=64 time=0.371 ms
64 bytes from 10.1.2.100: icmp_seq=1 ttl=64 time=0.161 ms
64 bytes from 10.1.2.100: icmp_seq=2 ttl=64 time=0.241 ms

Netcatはエラーをスローしません:

~ # nc -z 10.1.2.100 2049
Connection to 10.1.2.100 2049 port [tcp/nfs] succeeded!

Node1のルーティングテーブル

~ # esxcfg-route -l
VMkernel Routes:
Network          Netmask          Gateway          Interface
10.1.1.0         255.255.255.0    Local Subnet     vmk0
10.1.2.0         255.255.255.0    Local Subnet     vmk1
10.1.3.0         255.255.255.0    Local Subnet     vmk2
10.1.4.0         255.255.255.0    Local Subnet     vmk3
default          0.0.0.0          10.1.1.254       vmk0

VMカーネルNIC情報

~ # esxcfg-vmknic -l
Interface  Port Group/DVPort   IP Family IP Address                              Netmask         Broadcast       MAC Address       MTU     TSO MSS   Enabled Type       
vmk0       133                 IPv4      10.1.1.1                                255.255.255.0   10.1.1.255      00:50:56:66:8e:5f 1500    65535     true    STATIC     
vmk0       133                 IPv6      fe80::250:56ff:fe66:8e5f                64                              00:50:56:66:8e:5f 1500    65535     true    STATIC, PREFERRED
vmk1       164                 IPv4      10.1.2.1                                255.255.255.0   10.1.2.255      00:50:56:68:f5:1f 1500    65535     true    STATIC     
vmk1       164                 IPv6      fe80::250:56ff:fe68:f51f                64                              00:50:56:68:f5:1f 1500    65535     true    STATIC, PREFERRED
vmk2       196                 IPv4      10.1.3.1                                255.255.255.0   10.1.3.255      00:50:56:66:18:95 1500    65535     true    STATIC     
vmk2       196                 IPv6      fe80::250:56ff:fe66:1895                64                              00:50:56:66:18:95 1500    65535     true    STATIC, PREFERRED
vmk3       228                 IPv4      10.1.4.1                                255.255.255.0   10.1.4.255      00:50:56:72:e6:ca 1500    65535     true    STATIC     
vmk3       228                 IPv6      fe80::250:56ff:fe72:e6ca                64                              00:50:56:72:e6:ca 1500    65535     true    STATIC, PREFERRED

私が試した/チェックしたもの:

  • NFSサーバーへの接続にDNS名を使用していません。
  • MTUを確認した。 vmk1、dvSwitch、Ciscoスイッチ、およびQNAPの場合は9000に設定します。
  • QNAPをVLAN 11(VM Management、vmk0))に移動し、適切なアドレスを指定しましたが、同じ問題がありましたが、後で元に戻しました。
  • NASデータストア)の接続を開始しようとしました。すべて同じ結果になります。
  • サーバーに接続していないにもかかわらず、「VM」、「/ VM」、「/ share/VM」のパス名を試しました。
  • Linuxシステム(10.1.2.123)をVLAN 12に設定されたスイッチポートに接続し、NFS共有10.1.2.100:/VMをマウントしようとしました。正常に動作し、読み書き可能でした。それへのアクセス
  • ESXホストのファイアウォールを無効にしてみましたesxcli network firewall set --enabled false

私は次に何をしようかというアイデアが足りません。 VMware Workstationのセットアップとは異なる方法で行っていることは、物理スイッチと2つのホスト間の仮想分散スイッチでLACPを使用することです。私はvDSがおそらく私のトラブルの原因であると思いますが、この問題を解消せずに修正する方法がわかりません。

4
Gerald

私はあきらめた。

LACPをアップリンクから削除し、マルチパスを使用してiSCSIに切り替えました(SANのみのポートグループと各アップリンクに関連付けられたvmk)。

0
Gerald

うーん... vDS、NFS、LACPは私にとってはうまくいきます。ただし、vSphere機能のハイエンドセットを使用して、かなり深く作業を始めているようです。ほとんどのインストールではLACPは必要ありませんが、使用しようとすることの魅力は理解できます...

QNAPがマウントを許可していない場合、vDSやその他の機能は重要ではありません...

  • vmkpingで接続を確認しましたが、おそらくジャンボMTUで試してください:vmkping -s 9000 10.1.2.100(インターフェースを指定する必要はありません)。それが機能することを確認します。
  • 当面は、QNAP ACLを完全に無効にします。
  • マウントパス名はおそらくip.address:/share/VM/
  • 再度マウントを試みますが、ESXiホストの/var/log/vobd.logのメッセージに注意してください。 「マウント要求がNFSサーバーによって拒否されました。」のように表示される場合、問題はQNAPです。
  • 申し訳ありませんが、物理的なスイッチのタイプ/モデルと構成がありません...それについて説明できますか?関連するポートにトランクVLAN + LACP構成が必要です。

VDS構成のスクリーンショットは、1つのホストに相当する情報のようです。構成にLACPがあり、適切な負荷分散モードが設定されていることを確認します。次のようになります。

enter image description here

enter image description here

2
ewwhite

tS-420UとESXi 5.5 U1で昨日同じ問題がありました。 マイセットアップ:-vCenterサーバーを備えた2つのESXi 5.5-直接接続ストレージ-QNAP TS-420U NAS(ルーティングの問題がないため)-すべてサブネット10.207.253.128/26にあります

NASを構成した後、ACLを適切なサブネット(10.207.253。*)に設定し、問題なく接続しました。しかし、ESXiホストを再起動すると、接続はなくなり、同じエラーが発生します。 NAS再起動してNFSサービスをオフ/オンにしても効果がありませんでした。最後に試したのは、ACLをNASサーバーを*->ブームに設定することでした。どちらのESXiホストも問題なくNFS共有に接続できます。

次に、ESXiホストがサブネットに設定されたACLで接続できない理由を確認する必要があります...

1
stefan.kress

残念ながら、ESXiには診断コマンドrpcinfoおよびshowmountが含まれていません。デフォルトでは、NFSはUDPを使用します。マウントを実行するには、システムがNFSサーバーのrpcポートマッパー(tcp/udpポート111)と通信できる必要があります。これにより、mountdおよびnfsサービスのポートが提供されます。他のシステムでは、rpcinfo -p <ip>を使用してポートマップが機能していることを確認し、showmount -e <ip>を使用して何がエクスポートされているかを確認します。

また、vMotion、FTロギング、iSCSIとは異なり、NFSは特定のvmkにロックされません。利用可能なインターフェースを使用します。 NFSサーバーと同じサブネットにインターフェースがあるので、それはすべきそれを使用します。

NASにログがある場合は、そこに手掛かりがないか確認してください。それ以外の場合は、単一のリンクに戻り、トラフィックを監視することが唯一の手段になります。 (そのスイッチはポートミラーリングを行いますか?)

0
Ricky Beam