web-dev-qa-db-ja.com

CoreOSを使用するデジタルオーシャンドロップレットのサイズ変更は、CoreOsクラスターを破壊します

私はCoreOを初めて使用し、DigitalOceanで実験してきました。まず、これがDigitalOceanの問題なのかCoreOSの問題なのかわかりません。


複製方法:

  • 2つのCoreOSを起動し、それらをリンクして、Cloud-Configを介してクラスターを形成します。
  • Digital Ocean Dashboardで、ドロップレットの電源を切り、サイズを変更します。
  • 両方の液滴の電源を入れます。
  • 液滴の1つにssh
  • fleetctllist-machinesを実行します

あなたは得る必要があります

 2015/04/22 21:05:50 INFO client.go:291:http://127.0.0.1:4001 /からの応答の取得に失敗しました:ダイヤルtcp 127.0.0.1:4001:接続が拒否されました
 2015/04/22 21:05:50エラーclient.go:213:{Get /coreos.com/fleet/machines}の結果を取得できず、100ミリ秒で再試行します
 2015/04/22 21 :05:50 INFO client.go:291:http://127.0.0.1:4001 /からの応答の取得に失敗しました:ダイヤルtcp 127.0.0.1:4001:接続が拒否されました
 2015/04/22 21:05: 50エラーclient.go:213:{Get /coreos.com/fleet/machines}の結果を取得できず、200ミリ秒で再試行します
 2015/04/22 21:05:50 INFO client.go:291: http://127.0.0.1:4001/からの応答の取得に失敗しました:ダイヤルtcp 127.0.0.1:4001:接続が拒否されました
 2015/04/22 21:05:50エラーclient.go:213:取得できません{Get /coreos.com/fleet/machines}の結果、400ミリ秒で再試行
 2015/04/22 21:05:51 INFO client.go:291:http://127.0.0.1からの応答の取得に失敗しました:4001 /:ダイヤルtcp 127.0.0.1:4001:接続が拒否されました
 2015/04/22 21:05:51エラーclient.go:213: {Get /coreos.com/fleet/machines}の結果を取得できず、800ミリ秒で再試行します
 2015/04/22 21:05:51 INFO client.go:291:http://からの応答の取得に失敗しました127.0.0.1:4001/:ダイヤルtcp 127.0.0.1:4001:接続が拒否されました
 2015/04/22 21:05:51エラーclient.go:213:{Get/_coreos.comの結果を取得できません/ fleet/machines}、1秒で再試行

Journalctl -uetcdの実行
が表示されます

 4月22日14:38:02テストetcd [578]:[etcd] 4月22日14:38:02.471情報| f507c71154cc47b1804558c7298d0313:状態が「リーダー」から「フォロワー」に変更されました。
 4月22日14:38:02テストetcd [578]:[etcd] 4月22日14:38:02.471情報| f507c71154cc47b1804558c7298d0313:期間#7が開始されました。
 4月22日14:38:02テストetcd [578]:[etcd] 4月22日14:38:02.471情報| f507c71154cc47b1804558c7298d0313:リーダーが「f507c71154cc47b1804558c7298d0313」から「」に変更されました。
 4月22日14:38:11テストetcd [578]:[etcd] 4月22日14:38:11.257情報| f507c71154cc47b1804558c7298d0313:状態が「フォロワー」から「候補」に変更されました。
 4月22日14:38:11テストetcd [578]:[etcd] 4月22日14:38:11.258情報| f507c71154cc47b1804558c7298d0313:リーダーが「fa61f58c81fd4e7abe9ac0b6585fafef」から「」に変更されました。
 4月22日14:38:11テストetcd [578]:[etcd] 4月22日14:38:11.546情報| f507c71154cc47b1804558c7298d0313:状態が「候補」から「フォロワー」に変更されました。
 4月22日14:38:11テストetcd [578]:[etcd] 4月22日14:38:11.547情報| f507c71154cc47b1804558c7298d0313:期間#9が開始されました。
 4月22日14:41:14テストetcd [578]:[etcd] 4月22日14:41:14.847情報| f507c71154cc47b1804558c7298d0313:インデックス10004での10004イベントのスナップショットが完了しました
 4月22日14:53:45テストetcd [578]:[etcd] 4月22日14:53:45.297情報| f507c71154cc47b1804558c7298d0313:警告:選挙タイムアウト近くのハートビート:359.350151ms 
 4月22日14:55:22テストetcd [578]:[etcd] 4月22日14:55:22.381情報| f507c71154cc47b1804558c7298d0313:警告:選挙タイムアウト近くのハートビート:1.574255587s 
 4月22日15:31:17テストetcd [578]:[etcd] 4月22日15:31:17.551情報| f507c71154cc47b1804558c7298d0313:インデックス20005での10001イベントのスナップショットが完了しました
 4月22日16:19:53テストetcd [578]:[etcd] 4月22日16:19:53.870情報| f507c71154cc47b1804558c7298d0313:インデックス30012での10007イベントのスナップショットが完了しました
 4月22日17:08:00テストetcd [578]:[etcd] 4月22日17:08:00.254情報| f507c71154cc47b1804558c7298d0313:インデックス40019での10007イベントのスナップショットが完了しました
 4月22日17:57:30テストetcd [578]:[etcd] 4月22日17:57:30.622情報| f507c71154cc47b1804558c7298d0313:インデックス50027での10008イベントのスナップショットが完了しました
 4月22日18:48:04テストetcd [578]:[etcd] 4月22日18:48:04.084情報| f507c71154cc47b1804558c7298d0313:インデックス60035での10008イベントのスナップショットが完了しました
 4月22日19:38:37テストetcd [578]:[etcd] 4月22日19:38:37.641情報| f507c71154cc47b1804558c7298d0313:インデックス70042での10007イベントのスナップショットが完了しました
 4月22日20:07:41テストetcd [578]:[etcd] 4月22日20:07:39.493情報| f507c71154cc47b1804558c7298d0313:状態が「フォロワー」から「候補」に変更されました。
 4月22日20:07:44テストetcd [578]:[etcd] 4月22日20:07:44.282情報| f507c71154cc47b1804558c7298d0313:リーダーが「fa61f58c81fd4e7abe9ac0b6585fafef」から「」に変更されました。
 4月22日20:07:44テストetcd [578]:[etcd] 4月22日20:07:44.895情報| f507c71154cc47b1804558c7298d0313:状態が「候補」から「フォロワー」に変更されました。
 4月22日20:07:44テストetcd [578]:[etcd] 4月22日20:07:44.899情報| f507c71154cc47b1804558c7298d0313:期間#13が開始されました。
 4月22日20:09:39テストetcd [578]:[etcd] 4月22日20:09:39.269情報| f507c71154cc47b1804558c7298d0313:状態が「フォロワー」から「候補」に変更されました。
 4月22日20:09:39テストetcd [578]:[etcd] 4月22日20:09:39.302情報| f507c71154cc47b1804558c7298d0313:リーダーが「fa61f58c81fd4e7abe9ac0b6585fafef」から「」に変更されました。
 4月22日20:09:39テストetcd [578]:[etcd] 4月22日20:09:39.631情報| f507c71154cc47b1804558c7298d0313:状態が「候補」から「フォロワー」に変更されました。
 4月22日20:09:39テストetcd [578]:[etcd] 4月22日20:09:39.632情報| f507c71154cc47b1804558c7298d0313:用語#15が開始されました。サービス:メインプロセスが終了しました、code = exited、status = 2/INVALIDARGUMENT 
 Apr 22 20:11:18 test systemd [1]:Stoppedetcd。
 Apr 22 20:11:18 test systemd [1]:ユニットetcd.serviceが失敗した状態になりました。
 4月22日20:11:18テストsystemd [1]:etcd.serviceが失敗しました。

以下にsystemctlcatetcd.serviceを表示します

 
/usr/lib64/systemd/system/etcd.service 
 [Unit] 
 Description = etcd 
 
 [Service ] 
 User = etcd 
 PermissionsStartOnly = true 
 Environment = ETCDDATADIR =/var/lib/etcd 
 Environment = ETCD_NAME =%m 
 ExecStart = /usr/bin/etcd
Restart=always
RestartSec=10s
LimitNOFILE=40000

これはCoreOSの問題ですか? CoreOSクラスター全体のほとんどが壊れています。マシンはリンクされなくなり、それらをリンクして戻す方法や、これを防ぐ方法がわからないようです。私はこれについて何もオンラインで見つけることができません。

2
mbejda

さて、何時間もデバッグした後、ドロップレットをオフにし、ドロップレットのサイズを変更し、ドロップレットをオンにすると、DigitalOceanはcloud-configを尊重しないという結論に達しました。各サーバーインスタンス内に別のcloud-configを作成し、次のコマンドを実行することで、インスタンスをクラスターに再度リンクすることができました。
Sudo coreos-cloudinit --from-file cloud-config.yml

2
mbejda