web-dev-qa-db-ja.com

DRBDとペースメーカークラスターのスプリットブレイン

アクティブ-パッシブクラスター(DRBD、Pacemaker、Corosync、PostgreSQL)で現在発生している次の状況を考慮に入れたいと思います。

OS:Ubuntuサーバー14.04 x64 DRBD:8.4ペースメーカー:1.1.10 Corosync:2.3.3 PostgreSQL:9.3

問題は次のとおりです。プライマリがダウンすると、セカンダリがプライマリとして選出されます。問題は、前のプライマリを再導入するときに発生し、代わりにセカンダリになる必要があるスプリットブレインの状況に直接移行します。イベントの詳細なシーケンスとそれぞれのログは次のとおりです。

A:プライマリ、B:セカンダリ

1-​​= Aがダウンします

2- Bがプライマリになります

- Aが再開します->スプリットブレイン(この場合、フェイルオーバーは自動的に実行できると想定しました)

Aからのログ:

Jan 28 16:15:11 node1 kernel: [  538.025422] block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0
Jan 28 16:15:11 node1 kernel: [  538.026185] block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0 exit code 0 (0x0)
Jan 28 16:15:11 node1 kernel: [  538.026194] block drbd0: Split-Brain detected but unresolved, dropping connection!

DRBDステータス:

service drbd status
drbd driver loaded OK; device status:
version: 8.4.3 (api:1/proto:86-101)
srcversion: F97798065516C94BE0F27DC 
m:res  cs          ro                 ds                   p       mounted  fstype
0:pg   StandAlone  Secondary/Unknown  Consistent/DUnknown  r-----

AFAISDRBDがこのノードの状態を壊したようです。

私の質問は次のとおりです。

1-イベント3で、戻るノードが自動的にクラスターに結合できるという私の仮定は正しいですか?

2-それができる場合は、その方法を教えてください。

1

1-イベント3で、戻りノードがクラスターに自動的に結合できるという私の仮定は正しいですか?

はい、これは可能です。リソース構成で指示されない限り、DRBDはそれ自体でプライマリに移行しないでください。 'startup {become-primary-on}'定義がリソース構成に設定されていないことを確認してください。

2-それができる場合は、その方法を教えてください。

以下が正しいことを確認してください。

a。 「drbd」は起動時に開始するように設定されていません(RHELでは「chkconfigdrbd off」、Debianでは「update-rc.ddrbddisable」)。

b。 DRBDは、それ自体でプライマリになるように構成しないでください(前述のとおり)。

DRBDユーザーガイドには、Pacemakerで使用するためのDRBDの構成に関するセクションがあり、上記の回答でうまくいかない場合に役立つ可能性があります: https://drbd.linbit.com/users-guide/ch-pacemaker。 html

2
Matt Kereczman