Elasticsearchのホットバックアップ戦略

Question

誰かがElasticSearchのための彼の最高の「ホットバックアップ」戦略を共有できれば面白いでしょう。

また、この問題に関連するツールやライブラリを自由に共有してください。

更新：@ javannaからの回答に感謝します。これは完全であり、今後のアクションの方向性を示しています。

私はまた、小さな調査を行い、誰かが興味を持っている場合に役立ついくつかの記事/ディスカッションを見つけました。

Elasticsearchバックアップ戦略
Elasticsearchインデックスのバックアップ/復元および github：Gistの関連スニペット
Elastic Search Backup and Recovery ディスカッション（Paul Smithのコメントを確認してください。また、彼は彼のインデックスを検証するためのツールへの有用なリンクを共有しました）

更新：Elasticsearch 1.0には「公式」バックアップソリューションがあります- Snapshot/Restore API これが唯一の正しい方法です今。 ElasticSearchはマスターシャードを識別し、一貫性に注意を払います。バックアップは段階的に実行されるため、非常に高速かつ何度でも実行できます。

javanna · Accepted Answer

レプリカは一種のバックアップであり、elasticsearchは元のプライマリシャードと同じノードにレプリカを割り当てることはありません。ただし、クラスター内にあるシャード、レプリカ、ノードの数によっては、データが失われるリスクがあります。

Gateway モジュールを見て、インデックスとクラスターメタデータを保存できます。ゲートウェイにはさまざまな種類があります。たとえば、 Shared FS を見てみましょう。これにより、すべてのノード間で共有されるファイルシステムにインデックスとメタデータをコピーできます。ゲートウェイスナップショットAPI を使用してスナップショットを手動で開始することもできます。

また、 index.translog.disable_flushインデックス設定を使用してフラッシュを無効にすると、（すべてのノードで）データディレクトリのコピーを作成できます。そうすれば、コピー中にluceneコミットが発行されないようにすることができます。コピーを作成したら、フラッシュを再度有効にする必要があります。

[〜＃〜]更新[〜＃〜]

ローカルゲートウェイタイプを除くすべてのゲートウェイタイプは非推奨になり、将来のバージョンで削除される予定です。 Elasticsearch 1.0は、より優れたバックアップソリューションとともにリリースされます。