web-dev-qa-db-ja.com

Google Colabが12時間前にランダムに切断する理由

Colabノートブックが12時間前に切断されることがありますが、なぜそうなのか興味があります。 「ランタイムが切断されました」というメッセージが表示されることがあります。

それ以外の場合、メッセージはありません。ノートブックを再接続した後、しばらく実行されていないように見えます(ノートブックがビジーではないため)。さらに、私のtensorflowの.metaファイルと.dataファイルは、Googleドライブで過去8時間のうち6時間ほど更新されていません。

SOでいくつかの質問を見つけましたが、これは私の問題に似ていますが、他の人の状況は初期化で「スタック」しますが、私のノートブックは「スタック」しません。ランタイムを再起動しようとしても、ノートブックが古いVMに接続されているという兆候はまだありません。

編集:google colab VM "preemptible"はどうですか?google compute engineにはいつでも切断できる "preemptible"マシンがあることを知っています。私にとっては、無料の顧客が使用するコラボもプリエンプティブになりますが、コラボのこの主張をサポートするドキュメントは見つかりませんでした。

9
teter123f

Google Colabは、長時間実行されるタスク向けではありません。 Colab FAQs Webページから(強調は私のものです):

Colaboratoryはインタラクティブな使用を目的としています。特にGPUでの長時間のバックグラウンド計算は停止する場合があります。暗号通貨マイニングにはColaboratoryを使用しないでください。これはサポートされていないため、サービスが利用できなくなる可能性があります。 ColaboratoryのUIを使用して継続的または長時間実行される計算を実行したいユーザーは、ローカルランタイムを使用することをお勧めします。

私の経験では、「長時間実行される計算」には、ニューラルネットワークのトレーニングと、2〜3時間以上実行されるbashコマンドも含まれます。上記のように、これらのタイプの長時間実行タスクは、通常数時間以内にサービスが利用できなくなる可能性があります。

8
ninjin

再接続するだけで、最後の結果が回復するまで数分間待ちます。切断されたところから再開します。

0
Pragyan