web-dev-qa-db-ja.com

Amazon EC2でカーネルを更新した後、RHEL6.1で再起動が失敗する

新しいRHELインスタンスを起動するたびに、yum updateを実行して、最新のシステムから起動するのが好きです。ただし、その後インスタンスを再起動しようとすると、インスタンスがライブになることはありません。

カーネルの更新が根本原因であるとトラブルシューティングしました。問題を再現するための最小限の手順は次のとおりです。

  1. 新しいRHEL6.1インスタンスを起動します
  2. 接続してから実行します:
    1. yum update kernel*
    2. reboot

システムはダウンしたままです。 EC2管理コンソールからのシステムログはあまり役に立ちません。

...
Please stand by while rebooting the system...
md: stopping all md devices.
xenbus_dev_shutdown: device/console/0: Initialising != Connected, skipping
Restarting system.

カーネルパニック、起動時の問題などについては言及されていません。

私が読んだところによると、EC2インスタンスではデフォルトのカーネルを使用できないようです。それが本当なら、ジェネリックyum updateを実行するときに、誤ってカーネルをyumで更新して、インスタンスを強制終了しないようにするにはどうすればよいですか?

4
Benjamin

ファイル/etc/yum.confを編集して、次のようにエントリを追加します。

除外=カーネル*

その後、yumはすべてのパッケージを除外し、開始名にカーネルが含まれます。

このURLで詳細を読むことができます:

http://www.cyberciti.biz/faq/redhat-c​​entos-linux-yum-update-exclude-packages/

カーネルをアップグレードできないという問題に関しては、通常のPCでアップグレードするようにカーネルをアップグレードすることはできません。 Amazon EC2は、カーネルセットアップの場合にカスタマイズされた設定を使用します。詳細については、EC2インスタンスでカーネルアップグレードを実行する方法について、次のURLに従ってください。

http://www.vincestross.com/2009/04/upgrade-an-ec2-instance/

4
Farhan

RHELに含まれているカーネルのバージョンにバグが発生したようです。昨年のXen開発メーリングリストにこの問題に関するスレッドがありました: http://old-list-archives.xen.org/archives/html/xen-devel/2010-11/msg00616.html

EC2コンソールまたはコマンドラインユーティリティを使用してインスタンスを再起動してみてください。

カーネルをアップグレードできないという問題に関して:これは、最新のAmazonマシンイメージ(AMI)には当てはまりません。 RHEL 6 AMIなどの新しいAMIはPV-GRUBで起動します。これにより、他のサーバーと同じようにカーネルをアップグレードできます。

PV-GRUBの詳細については、こちらのEC2ドキュメントを参照してください: http://docs.amazonwebservices.com/AWSEC2/latest/UserGuide/index.html?UserProvidedkernels.html

5
msw

問題は、ブロックデバイスの名前が/ dev/xvdaから/ dev/xvdeに変更されることです。menu.lstを変更して、/ dev/xvde1をポイントし、fstabを変更してxvde 1 2 3をマウントするか、ドライブにラベルを付けて、ラベル

ラベルを使用していますが、問題は修正されています。

2
Richard Szabo

私はこの問題によって本当にブロックされましたが、私は今それを回避しているようです。カーネルのヒントは今は関係がないようですが、/var/lib/dhcp-client/*ファイルを削除することが本当に役立つことがわかりました。

AWSomedayの一部の技術トレーナーが直接行った、Amazonが監視で行った2つのチェックは次のとおりです。

  1. CPUはアイドルではありません
  2. ネットワークインターフェイスが存在します

したがって、最初に行うことは、実行する監視ステップを確認することです。 1/2で問題がない場合は、DHCPに問題がある可能性があります。したがって、上記の解決策があなたのために働くかもしれません。

1
webofmars

Amazonによって作成された新しいリリースはLABELSを使用しているようですが、これは実際には問題を修正しません。この問題は、回復を行うために別のインスタンスボリュームのマウントを開始したときに発生します。

0
webofmars