web-dev-qa-db-ja.com

Aprioriアルゴリズムで最小サポートを見つける方法

サポートと信頼度のパーセンテージ値が与えられた場合、Aprioriアルゴリズムで最小サポートを見つけるにはどうすればよいですか。サポートと信頼度がそれぞれ60%と60%として与えられている場合の例として、最小サポートは何ですか?

8
Chanikag

サポートと信頼は、ルールがどれほど興味深いかを測定するための尺度です。

最小サポートと最小信頼度はユーザーによって設定され、アソシエーションルール生成のためのAprioriアルゴリズムのパラメーターです。これらのパラメーターは、それぞれ最小サポートおよび最小信頼よりも低いサポートまたは信頼を持つ結果のルールを除外するために使用されます。

それで、あなたの質問に答えるために、あなたが言うとき:「例えば、サポートと自信がそれぞれ60%と60%として与えられるとき、最小のサポートは何ですか?」おそらく、最小サポートと信頼度を60%に設定したことを意味します。

あなたはただ用語に混乱していると思います。

6
Phil

私の答えは少し遅すぎますが、Chanikagが求めているのは、「サポートしきい値が60%の場合にサポートカウントを最小化する方法」だと思います。最小サポート数はトランザクションの数になるため、トランザクションの総数の60%になります。トランザクション数が5の場合、最小サポート数は5 * 60/100 = 3になります。

6

Aprioriアルゴリズムの完全な説明と実際に使用できる例をここで確認してください。

http://www.codeding.com/articles/apriori-algorithm

新しいアイテムを追加し、最小サポートしきい値と最小信頼しきい値を入力して、デモのSilverlightウィジェットで即座に生成された結果の大きなアイテムセットを確認できます。

6
Prabu Arumugam

最小サポート数は、すべてのトランザクションの%です。60%のサポート数があり、5が合計トランザクションであるとすると、min_supportの数は5 * 60/100 = 3になります。

5
Rkb

あなたの質問が理にかなっているのかわかりません。あなたの例から、60%のサポートと信頼度で少なくとも1つのルールが返される場合、最小サポートは少なくとも60%であると確信できますが、それ以上になる可能性があります。

最小サポートは、結果の相関ルールのサポートメジャーの最小下限を指定することにより、候補ルールをプルーニングするためにAprioriアルゴリズムに提供されるパラメーターです。対応するMinimum-Confidenceプルーニングパラメーターもあります。

アルゴリズムによって生成された各ルールには、独自のサポートと信頼性の測定値があります。大まかに言って、サポートは、すべてのインスタンスの中でルールが真であるインスタンスの比率です。信頼度は、前件(含意のLHS)が真であるインスタンスの数のうち、ルールが真であるインスタンスの比率です。

より厳密な定義については、 Wikipedia を確認してください。

2
Dylan Hogg