web-dev-qa-db-ja.com

純粋なPython Luceneはありますか?

Ruby人々は Ferret を持っています。誰かがPythonの同様のイニシアチブを知っていますか?現在PyLuceneを使用していますが、純粋な=への移行を調査したいと思います。 Python検索中。

41
PEZ

Whoosh は、luceneに似ていますが、純粋なpythonである新しいプロジェクトです。

37
A. Coady

私が知っている唯一の純粋なPython(C拡張も含まない)検索ソリューションは Nucular です。それは遅く(PyLuceneよりもはるかに遅い)、まだ不安定です。

PyLuceneベースの自家製検索とインデックス作成から Solr に移行しましたが、YMMVです。

6
zgoda

最近見つけた pyndexter 。さまざまなバックエンドの全文検索エンジン/インデクサーへの抽象的なインターフェースを提供します。また、デフォルトの純粋なPython実装が付属しています。

これらのことは、Pythonでは悲惨なほど遅くなる可能性があります。

4
Ali Afshar

一部のアプリケーションでは、純粋なPythonが過大評価されています。Xapianを見てください。

XapianとPyndexterの回答に+1します。

フェレットは実際にはCで書かれており、その上にRubyバインディングがあります。純粋なRuby検索エンジンは、純粋なPython検索エンジンよりもさらに低速になります。 「他の誰か」がFerretへのPythonインターフェース用のCython/Pyrexレイヤーを作成するのを見たいのですが、XapianのPythonバインディングがあるのになぜわざわざするので、自分では作成しません。 。

2
Van Gale

純粋でないPythonの場合、 Sphinx Search with Python APIが最も高速に動作します。複数のブログのベンチマークから、Sphinx SearchはLuceneよりもはるかに高速で、使用するメモリもはるかに少なくなります。そしてそれはCにあります。

python and web2py をフレームワークとして使用して、それに基づいたマルチドキュメント検索エンジンを開発しています。

2
Phyo Arkar Lwin

lupy は純粋なPythonへのluceneポートでした。 lupyの人々はPyLuceneの使用を提案しています 。ごめんなさい。たぶん、Javaソースを Jython と組み合わせて使用​​できます。

2
Yuval F

これを数週間検索した後、私は素敵なPythonソリューション: repoze.catalog を見つけました。ストレージにZODBを使用しているため、厳密にはPythonだけではありませんが、 SOLRのようなものよりも私への依存度が高い。

1
Ali Afshar