web-dev-qa-db-ja.com

Javaクラスタリングライブラリ

Javaで軽量のクラスタリングライブラリを探しています。そのライブラリに何百ものクラスタリングアルゴリズムは必要ありません。5〜7個のアルゴリズムで十分です。

きっとあなたは「どんな種類のアルゴが必要で、どんな目的のために」と尋ねるでしょう:)。クラスタリングの助けを借りてデータの分類を行う必要があります。たとえば、Kはを意味します。

追伸:wekaについては知っていますが、クラスタリング専用ではないため、使用したくありません。

21
user238384

Apacheの Commons Math ライブラリの org.Apache.commons.math4.ml.clustering.KMeansPlusPlusClusterer を見てください。

6
Mark

Javaここで利用可能で、GPLの下で利用可能ないくつかのオープンソースクラスタリングアルゴリズムがあります。Java Coltライブラリ(行列用)が必要です) http://open.trickl.com/

0
Tim Gee

[〜#〜] elki [〜#〜] もあります。これは、WEKAに似たオープンソースの大学プロジェクトですが、機械学習アルゴリズムではなく、クラスター分析と外れ値の検出に重点を置いています。これはかなり高度で、効率を上げるためにインデックス構造を使用し、少なくとも12のクラスタリングアルゴリズムを備えています。

Scalaも機能する場合は、ScalaでこのバージョンのKMeansを確認することをお勧めします。

https://github.com/wspringer/kmeans

関連するブログ投稿はこちらです:

http://nxt.flotsam.nl/k-means-clustering.html

0

Javaでいくつかの基本的なクラスタリングアルゴリズムが必要な場合は、私のソフトウェアを確認できます。

http://www.philippe-fournier-viger.com/spmf/

KMeansの実装と階層的クラスタリングアルゴリズムを提供します。

提供される他のアルゴリズムは、パターンマイニング用です。合計で47のアルゴリズムがあります。ただし、クラスタリングの場合は2つだけです。もう1つは、アルゴリズムを起動するためのシンプルなGUIがあります。

0
Phil

[〜#〜] jung [〜#〜] を見てみましょう。 K-meansがその1つであるかどうかはわかりませんが、いくつかのクラスタリングアルゴリズムが実装されています。

もう1つのオプションは、Eclipseベースのワークフローエディターである Knime を確認することです。これには、K-meansを含む、ワークフローの一部として使用できる多数のクラスタリングプリミティブが含まれます。

0
Binary Nerd