web-dev-qa-db-ja.com

clocksourcetsc不安定

さて、今私は実際のサーバーに障害があります;)

起動してからしばらくすると(約1分)、サーバーがハングします。私にできることはハードリセットだけです。次に、/ var/log/kern.logで再起動すると、次のことがわかります。

Jul 29 22:38:57 leonidas kernel: [   90.729598] longhaul: Failed to set requested frequency!
Jul 29 22:38:57 leonidas kernel: [   90.731252] longhaul: Enabling "Ignore Revision ID" option.
Jul 29 22:38:57 leonidas kernel: [   91.201461] longhaul: Failed to set requested  frequency!
Jul 29 22:38:57 leonidas kernel: [   91.201482] longhaul: Disabling ACPI C3 support.
Jul 29 22:38:57 leonidas kernel: [   91.204230] longhaul: Disabling "Ignore Revision ID" option.
Jul 29 22:38:58 leonidas kernel: [   91.416133] longhaul: Failed to set requested frequency!
Jul 29 22:38:58 leonidas kernel: [   91.416152] longhaul: Enabling "Ignore Revision ID" option.
Jul 29 22:38:58 leonidas kernel: [   91.960048] Clocksource tsc unstable (delta = -105611479 ns)

ネット上でいくつかのリソースを見つけましたが、クロックソースを変更するか、ACPIを無効にするように言われました。 ACPIを無効にしてみましたが、効果がありませんでした(ただし、ハングするまでの時間が長いことに気付きました)。私のシステムにはそのような時計がないので、時計をhpetに変更することはできません。

Cat/sys/devices/system/clocksource/clocksource0/available_clocksourceの出力:
acpi_pm jiffies tsc

私のシステムはVIA Epiaハードウェア上のubuntuサーバーです。

2
amorfis

CPUは、CPUのクロックレートを制御しようとしているため、システムとの連携を拒否しています。これは、特定のハードウェアの既知の問題のようです。 longhaulドライバーは一部の構成で壊れています これにより、CPUの省電力、別名CPU周波数スケーリングで問題が発生します。戻って元のエラー投稿を見ると、長距離ドライバーは「壊れている」と思われますが、「正常に動作している」ことがはっきりとわかります。これを無効にするか、別のクロックソースでオーバーライドすることが目標になります。

TSCは「タイムスタンプカウンター」の略で、CPUの速度に応じて一定に増加することになっています。 CPUが周波数を動的に変更すると、TSCは「変更」または「逸脱」し、カーネルはそれに気づきます。したがって、TSCに関するカーネルからのログ内のメッセージ。ここでの秘訣は、CPU周波数ガバナーを見つけて機能をオフにするか、常に最大CPUを有効にすることです。基本的に、CPUを周波数スケーリングなしでフルスロットルで実行する必要があります。 Ubuntuでは、これはCPUのタイプによっても影響を受ける可能性があります-私のパーソナルPCは古いAthlon XPボックスなので、CPU周波数を制御するためにpowernowdデーモンをインストールしますAMD CPUであるため、この機能は使用できませんが。IntelCPUは(おそらく)他のものを使用し、VIAまだ何か違う。あなたはしたいかもしれません

apropos power

...そして、manページでどのプログラムが提案されているかを確認します(これにより、どのプログラムが原因である可能性があるかについての簡単な手がかりが得られます)。

もう1つのアプローチは、クロックソースをacpi_pmに明示的に設定することです。これは、提供した出力に基づいてサポートされているようです。 jiffiesを試すこともできますが、acpi_pmの方がおそらくより良い結果が得られます。


一部の検索では おそらくVIAベースのチップを使用していることを示唆しています。これはCPU周波数スケーリングを処理するときにドライバーの問題が発生することがあります 。特定のハードウェア設定がわからないので、これ以上は言えません。幸運を。

2
Avery Payne