web-dev-qa-db-ja.com

solrおよびhbaseからすべてのデータを削除する方法

コマンドでsolrからすべてのデータを削除するにはどうすればよいですか? solrおよびlilyとともにhbaseを使用しています。

Hbaseとsolrの両方からデータを削除するにはどうすればよいですか?

http://lucene.Apache.org/solr/4_10_0/tutorial.html#Deleting+Data

90
XMen

Solrインデックスをクリーンアップする場合-

http urlを起動できます-

http://Host:port/solr/[core name]/update?stream.body=<delete><query>*:*</query></delete>&commit=true

[core name]を削除するコアの名前に置き換えます)。または、データxmlデータを投稿する場合はこれを使用します。

<delete><query>*:*</query></delete>

必ずcommit=trueを使用して変更をコミットしてください

ただし、hbaseデータをクリアすることについてはあまり考えないでください。

170
Jayendra

このリクエストを使用してすべてのレコードを削除しましたが、時々これをコミットする必要があります。

そのためには、&commit=trueをリクエストに追加します:

http://Host:port/solr/core/update?stream.body=<delete><query>*:*</query></delete>&commit=true
90
Showtim3

次のコマンドを使用して削除できます。 delete by queryコマンドで「match all docs」クエリを使用します。

'<delete><query>*:*</query></delete>

削除を実行した後もコミットする必要があるため、インデックスを空にするには、次の2つのコマンドを実行します。

curl http://localhost:8983/solr/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'
curl http://localhost:8983/solr/update --data '<commit/>' -H 'Content-type:text/xml; charset=utf-8'

もう1つの戦略は、ブラウザーに2つのブックマークを追加することです。

http://localhost:8983/solr/update?stream.body=<delete><query>*:*</query></delete>
http://localhost:8983/solr/update?stream.body=<commit/>


SOLRからのソースドキュメント:
https://wiki.Apache.org/solr/FAQ#How_can_I_delete_all_documents_from_my_index.3F

9
Navjot Bhardwaj

JSONデータの投稿(例:curlを使用)

curl -X POST -H 'Content-Type: application/json' \
    'http://<Host>:<port>/solr/<core>/update?commit=true' \
    -d '{ "delete": {"query":"*:*"} }'
8
Frank R.

SolrJを介してSolrのすべてのデータを削除する場合は、次のようにします。

public static void deleteAllSolrData() {
    HttpSolrServer solr = new HttpSolrServer("http://localhost:8080/solr/core/");
    try {
      solr.deleteByQuery("*:*");
    } catch (SolrServerException e) {
      throw new RuntimeException("Failed to delete data in Solr. "
          + e.getMessage(), e);
    } catch (IOException e) {
      throw new RuntimeException("Failed to delete data in Solr. "
          + e.getMessage(), e);
    }
}

HBaseのすべてのデータを削除する場合は、次のようにします。

public static void deleteHBaseTable(String tableName, Configuration conf) {
    HBaseAdmin admin = null;    
    try {
        admin = new HBaseAdmin(conf);
        admin.disableTable(tableName);
        admin.deleteTable(tableName);
    } catch (MasterNotRunningException e) {
        throw new RuntimeException("Unable to delete the table " + tableName
        + ". The actual exception is: " + e.getMessage(), e);
    } catch (ZooKeeperConnectionException e) {
        throw new RuntimeException("Unable to delete the table " + tableName
        + ". The actual exception is: " + e.getMessage(), e);
    } catch (IOException e) {
        throw new RuntimeException("Unable to delete the table " + tableName
        + ". The actual exception is: " + e.getMessage(), e);
    } finally {
        close(admin);
    }
 }
8
RATabora

クエリによる削除コマンドで「すべてのドキュメントに一致」クエリを使用します。

削除を実行した後もコミットする必要があるため、インデックスを空にするには、次の2つのコマンドを実行します。

curl http://localhost:8983/solr/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'

curl http://localhost:8983/solr/update --data '<commit/>' -H 'Content-type:text/xml; charset=utf-8'
4
Nanhe Kumar

SolrNetを使用して、.Netフレームワークを介してsolrインスタンスからすべてのドキュメントを削除するためにここに来ました。ここに私がそれをどうやってできたかがあります:

Startup.Init<MyEntity>("http://localhost:8081/solr");
ISolrOperations<MyEntity> solr =
    ServiceLocator.Current.GetInstance<ISolrOperations<MyEntity>>();
SolrQuery sq = new SolrQuery("*:*");
solr.Delete(sq);
solr.Commit();

これにより、すべてのドキュメントがクリアされました。 (これを回復できるかどうかはわかりませんが、Solrの学習およびテスト段階にあるため、このコードを使用する前にバックアップを検討してください)

3
Habib

ブラウザでこれを起動します

http://localhost:8983/solr/update?stream.body=<delete><query>*:*</query></delete>&commit=trueこのコマンドは、solrのインデックス内のすべてのドキュメントを削除します

3
bittu

このクエリを使用して、すべてのレコードを削除しました。

http://Host/solr/core-name/update?stream.body=%3Cdelete%3E%3Cquery%3E*:*%3C/query%3E%3C/delete%3E&commit=true
2
Sufiyan Malek

すべてのデータを消去する必要がある場合は、コレクションを再作成する方が速い場合があります。

solrctl --zk localhost:2181/solr collection --delete <collectionName>
solrctl --zk localhost:2181/solr collection --create <collectionName> -s 1
1
Tagar

コマンドラインから次を使用します。

 bin/post -c core_name -type text/xml -out yes -d $'<delete><query>*:*</query></delete>'
1

上記のcurlの例は、cygwinターミナルから実行したときに失敗しました。スクリプト例を実行すると、このようなエラーが発生しました。

curl http://192.168.2.20:7773/solr/CORE1/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">0</int><int name="QTime">1</int></lst>
</response>
<!-- 
     It looks like it deleted stuff, but it did not go away
     maybe because the committing call failed like so 
-->
curl http://192.168.1.2:7773/solr/CORE1/update --data-binary '' -H 'Content-type:text/xml; charset=utf-8'
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">400</int><int name="QTime">2</int></lst><lst name="error"><str name="msg">Unexpected EOF in prolog
 at [row,col {unknown-source}]: [1,0]</str><int name="code">400</int></lst>
</response>

プロジェクトでコア名をすべて消去するには、コア名のループで削除を使用する必要がありました。

以下のこのクエリは、Cygwinターミナルスクリプトで機能しました。

curl http://192.168.1.2:7773/hpi/CORE1/update?stream.body=<delete><query>*:*</query></delete>&commit=true
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">0</int><int name="QTime">1</int></lst>
</response>

この1行により、データはなくなり、変更が持続しました。

1
ndasusers

Solrよくわかりませんが、以下のようなtruncateコマンドを使用してhbaseからすべてのデータを削除できます。

truncate 'table_name'

Hbaseテーブルからすべての行キーを削除します。

0
Kapil

Solrインデックスをクリアするときは、全削除クエリの実行後にコミットと最適化も行う必要があります。完全な手順が必要です(カールだけで十分です): http://www.alphadevx.com/a/365-Clearing-a-Solr-search-index

0
alphadevx

Solr管理UIに削除リンクを追加するJavaScriptブックマークを作成しました

javascript: (function() {
    var str, $a, new_href, href, upd_str = 'update?stream.body=<delete><query>*:*</query></delete>&commit=true';
    $a = $('#result a#url');
    href = $a.attr('href');
    str = href.match('.+solr\/.+\/(.*)')[1];
    new_href = href.replace(str, upd_str);
    $('#result').prepend('<a id="url_upd" class="address-bar" href="' + new_href + '"><strong>DELETE ALL</strong>   ' + new_href + '</a>');
})();

enter image description here

0
MyroslavN

Cloudera 5.xを使用している場合、このドキュメントでは、Lilyがリアルタイムの更新と削除も維持していることを説明しています。

Cloudera Searchで使用するためのLily HBase NRTインデクサーサービスの構成

HBaseはHBaseテーブルセルに挿入、更新、削除を適用するため、インデクサーは標準のHBaseレプリケーションを使用して、HBaseテーブルのコンテンツとSolrの一貫性を維持します。

Iftruncate 'hTable'も同じでサポートされているかどうかはわかりません。

それ以外の場合は、特定のイベントなどでSolrとHBaseの両方からデータを消去するトリガーまたはサービスを作成します。

0