web-dev-qa-db-ja.com

Elasticsearchのホットバックアップ戦略

誰かがElasticSearchのための彼の最高の「ホットバックアップ」戦略を共有できれば面白いでしょう。

また、この問題に関連するツールやライブラリを自由に共有してください。

更新:@ javannaからの回答に感謝します。これは完全であり、今後のアクションの方向性を示しています。

私はまた、小さな調査を行い、誰かが興味を持っている場合に役立ついくつかの記事/ディスカッションを見つけました。

更新:Elasticsearch 1.0には「公式」バックアップソリューションがあります- Snapshot/Restore API これが唯一の正しい方法です今。 ElasticSearchはマスターシャードを識別し、一貫性に注意を払います。バックアップは段階的に実行されるため、非常に高速かつ何度でも実行できます。

20
gakhov

レプリカは一種のバックアップであり、elasticsearchは元のプライマリシャードと同じノードにレプリカを割り当てることはありません。ただし、クラスター内にあるシャード、レプリカ、ノードの数によっては、データが失われるリスクがあります。

Gateway モジュールを見て、インデックスとクラスターメタデータを保存できます。ゲートウェイにはさまざまな種類があります。たとえば、 Shared FS を見てみましょう。これにより、すべてのノード間で共有されるファイルシステムにインデックスとメタデータをコピーできます。 ゲートウェイスナップショットAPI を使用してスナップショットを手動で開始することもできます。

また、 index.translog.disable_flushインデックス設定 を使用してフラッシュを無効にすると、(すべてのノードで)データディレクトリのコピーを作成できます。そうすれば、コピー中にluceneコミットが発行されないようにすることができます。コピーを作成したら、フラッシュを再度有効にする必要があります。

[〜#〜]更新[〜#〜]

ローカルゲートウェイタイプを除くすべてのゲートウェイタイプは非推奨になり、将来のバージョンで削除される予定です。 Elasticsearch 1.0は、より優れたバックアップソリューションとともにリリースされます。

8
javanna