web-dev-qa-db-ja.com

82566DC / e1001eでハードウェアユニットのハングを検出

Ubuntu Serverのインストールで突然問題が発生しています。このマシンは、12.04、13.10、およびしばらくの間14.04で正常に動作しました。

これを始めました:

12:44:34  e1000e 0000:00:19.0 eth0: Detected Hardware Unit Hang:
12:44:34    TDH                  <75>
12:44:34    TDT                  <77>
12:44:34    next_to_use          <77>
12:44:34    next_to_clean        <75>
12:44:34  buffer_info[next_to_clean]:
12:44:34    time_stamp           <100e01775>
12:44:34    next_to_watch        <75>
12:44:34    jiffies              <100e01ed3>
12:44:34    next_to_watch.status <0>
12:44:34  MAC Status             <802a3>
12:44:34  PHY Status             <792d>
12:44:34  PHY 1000BASE-T Status  <3800>
12:44:34  PHY Extended Status    <3000>
12:44:34  PCI Status             <10>
12:44:34  e1000e 0000:00:19.0 eth0: Reset adapter unexpectedly
12:44:37  e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
12:45:59  e1000e: eth0 NIC Link is Down    

その後、インターフェースは時々戻ってきますが、ほとんどは戻りません。

壊れたハードウェアをまだ除外していませんが、そうだとしたら驚かれるでしょう。

3
Stefan Arentz

here で説明されているように、私に合った解決策を見つけました。

次のコマンドを試すことができます。

ethtool -K eth0 gso off gro off tso off

うまくいくかどうか教えてください。

編集:この解決策は問題を少しだけ解決したようです。後でNICが高負荷になったときに同じエラーが発生しました。ハードウェアの問題のようです。NICと今までこのエラーは表示されません。おそらく、別のネットワークカードでテストして、問題が解決するかどうかを確認してください。

1
Mauker