web-dev-qa-db-ja.com

一見ランダムに見えるG4カーネルパニックとロックアップのトラブルシューティング

最近、私の9歳のApple G4ファイルサーバーがランダムにクラッシュしました。カーネルパニックになることがよくありますが、システムがロックすることもあります。ほとんどの場合、外出時に発生するようです。オフィス...しかし、私がオフィスにいるときでも、システムは別のサーバールームにあり、コンソールにはほとんど誰もいません。RAMの不良を疑って、memtestを実行しましたが、20パス後に問題は見つかりませんでした(実行しました)。 10パス、再起動、さらに10回実行。シングルユーザーモードは両方とも)Appleハードウェアテストでも問題は報告されません(100回以上のループでさらにループで実行した後)

ハードウェアが悪くなっているのではないかと思います...それis結局9歳です。ただし、現時点ではサーバーを交換する予算はありません。次のアップグレードまで、私の最善の選択肢は何でしょうか?何がクラッシュしているのかをトラブルシューティングする方法はありますか?または、少なくとも、カーネルパニックまたはロックアップ後にシステムを自動的に再起動して、サービスを再開できるようにする方法はありますか?

panic.logは次のことを示しています。

Mon Jun 29 12:52:23 2009
panic(cpu 1 caller 0x00040180): zalloc: "socket" (751876 elements) retry fail 3
Latest stack backtrace for cpu 1:
      Backtrace:
         0x000954F8 0x00095A10 0x00026898 0x00040180 0x0026B868 0x00290E10 0x00290F1C 0x00296B40 
         0x002ABDB8 0x000ABD30 0x00000000 
Proceeding back via exception chain:
   Exception state (sv=0x32288780)
      PC=0x9001B08C; MSR=0x0000F030; DAR=0x12555000; DSISR=0x42000000; LR=0x8EF88A00; R1=0xBFFFF700; XCP=0x0000003
0 (0xC00 - System call)

Kernel version:
Darwin Kernel Version 8.11.0: Wed Oct 10 18:26:00 PDT 2007; root:xnu-792.24.17~1/RELEASE_PPC

*********

Fri Jul  3 10:15:24 2009
panic(cpu 1 caller 0x00040180): zalloc: "socket" (762004 elements) retry fail 3
Latest stack backtrace for cpu 1:
      Backtrace:
         0x000954F8 0x00095A10 0x00026898 0x00040180 0x0026B868 0x00290E10 0x00290F1C 0x00296B40 
         0x002ABDB8 0x000ABD30 0x00000000 
Proceeding back via exception chain:
   Exception state (sv=0x2C543000)
      PC=0x9001B08C; MSR=0x0000F030; DAR=0x11A41000; DSISR=0x42000000; LR=0x8EF88A00; R1=0xBFFFF700; XCP=0x0000003
0 (0xC00 - System call)

Kernel version:
Darwin Kernel Version 8.11.0: Wed Oct 10 18:26:00 PDT 2007; root:xnu-792.24.17~1/RELEASE_PPC

*********

Tue Jul 21 20:44:47 2009
panic(cpu 1 caller 0x00040180): zalloc: "socket" (762004 elements) retry fail 3
Latest stack backtrace for cpu 1:
      Backtrace:
         0x000954F8 0x00095A10 0x00026898 0x00040180 0x0026B868 0x00290E10 0x00290F1C 0x00296B40 
         0x002ABDB8 0x000ABD30 0x00000000 
Proceeding back via exception chain:
   Exception state (sv=0x2C543000)
      PC=0x9001B08C; MSR=0x0000F030; DAR=0x11A41000; DSISR=0x42000000; LR=0x8EF88A00; R1=0xBFFFF700; XCP=0x0000003
0 (0xC00 - System call)

Kernel version:
Darwin Kernel Version 8.11.0: Wed Oct 10 18:26:00 PDT 2007; root:xnu-792.24.17~1/RELEASE_PPC

*********
2
Josh

これがMacOS X Serverを実行しているファイルサーバーとして実行されている場合、正しいと思いますか?カーネルパニック後に自動的に再起動しない場合は、ハードウェアが十分に古いため、サーバーのデフォルトであるため、おそらくサポートされていません。

明らかに、カーネルパニックではなく、ハングしただけの場合、サーバーは再起動を試みませんが、 Sophisticated Circuitsのキックオフ! がその問題の優れた解決策であることがわかりました。基本的に、ソフトウェアは電源パススルーでハードウェアに時々pingを実行し、ボックスがロックされてpingが停止すると、電源が入れ直されます。プレスト!自動再起動、カーネルパニック、またはいいえ!

2
morgant

カーネルパニックの原因を知っていますか?コンピュータが失敗している特定のカーネル拡張はどれですか?

スーパーユーザー の無関係な質問でカーネルパニックログを読み取る方法について少し投稿しました。

パッケージでない場合は、カーネルパニックからkextの名前を見つけることができます。この情報は~/Library/Logs/panic.logで見つけることができます。または、パニック後にコンピューターを再起動すると、エラーを報告するかどうかを尋ねられます。林檎。レポートを押してから中央のタブをクリックして、クラッシュの詳細を表示します。

例は次のとおりです。

 panic(cpu 0 caller 0x0035C330): freeing free mbuf
 Backtrace, Format - Frame : Return Address (4 potential args on stack) 
 0x2545bc08 : 0x128d08 (0x3c9afc 0x2545bc2c 0x131de5 0x0) 
 0x2545bc48 : 0x35c330 (0x3ea258 0x3ae65000 0x23935100 0x493e0) 
 0x2545bc88 : 0x7424a4 (0x36f19300 0x493e0 0x0 0x134b11) 
 0x2545bca8 : 0x9f1458 (0x23935000 0x36f19300 0x0 0x0) 
 0x2545bcd8 : 0x9ef6d6 (0x23935000 0x36f19300 0x0 0x0) 
 0x2545bcf8 : 0x9fa0ce (0x23935000 0x36f15f00 0x1000000 0x0) 
 0x2545bea8 : 0x9f375a (0x23935000 0x3a14880 0x40000000 0x34fb8b) 
 0x2545bf08 : 0x398f79 (0x23935000 0x3a14880 0x1 0x13becf) 
 0x2545bf58 : 0x39814b (0x3a14880 0x4121d48 0x4121d8c 0x0) 
 0x2545bf88 : 0x397e81 (0x3a184c0 0x5d3734 0x452084 0x40431f4) 
 0x2545bfc8 : 0x19a77c (0x3a184c0 0x0 0x19d0b5 0x696543c) Backtrace terminated-invalid frame pointer 0x0  
 Kernel loadable modules in backtrace (with dependencies):
 com.Apple.iokit.AppleYukon(1.0.9b3)@0x9ed000  

 dependency: com.Apple.iokit.IONetworkingFamily(1.5.1)@0x73b000
 dependency: com.Apple.iokit.IOPCIFamily(2.2)@0x60a000
 dependency: com.Apple.iokit.IOACPIFamily(1.2.0)@0x6b6000
 com.Apple.iokit.IONetworkingFamily(1.5.1)@0x73b000

 Kernel version:
 Darwin Kernel Version 8.8.2: Thu Sep 28 20:43:26 PDT 2006; root:xnu-792.14.14.obj~1/RELEASE_I386

相対的な線を区別しました。具体的には、「カーネルロード可能モジュール...」の後の最初の行を探しています。この場合、アイテムはcom.Apple.iokit.AppleYukon(イーサネットドライバー/カーネル拡張子)であるため、ファイル名はcom.Apple.iokit.AppleYukon.kext

1
Chealion

すでにCrashReporterやその他のシステムログを見て、そこに何か面白いものが表示されているかどうかを確認したと仮定します。

しかし、古いマシンから余分な時間を絞り出そうとするとき、私が最初に行うことの1つは、冷却をチェックすることです。箱からすべてのほこりを取り出し、ファンが正常に回転していることを確認します。

...クライアントを実行していて、電源の入れ直しについてモーガンの提案を受けた場合は、「電源障害後に自動的に再起動する」の「エネルギーセーバー->オプション」を確認してください。また、OS X Serverを実行している場合は、「サーバーが「フリーズ」した場合に自動的に再起動する」の設定もあります。

1
Joe H.

サーバーでlastコマンドを実行して、起動(および通常の再起動)がいつ行われたかを確認できます。この時期に発生するシステムログに何か興味深いものはありますか?

また、ファイルサーバーであるため、必ずハードドライブを確認してください。 RAIDに接続されたG5(?)があり、RAIDが不満の場合は正しく機能しません。

0

また、メモリ、破損、またはその他のメモリ障害を見ると、そのようなランダムなことが発生する可能性が非常に高くなります。

DIMMをx86PCに交換できる場合は、MemTest x86 +を使用して明らかなエラーがあるかどうかを確認してください。ただし、エラーがランダムであるか、十分にあいまいな場合は、MemTestでクリーンに表示できます。

http://www.memtest.org/

0
LapTop006