web-dev-qa-db-ja.com

last.fm、grooveshark、pandoraなどの推奨サイトの背後にあるアルゴリズムは何ですか?

推薦制度をベースにしたプロジェクトを始めようと思っています。私はウェブ側でホットな話題のように見えるこの分野で自分自身を改善する必要があります。また、lastfm、grooveshark、Pandoraがレコメンデーションシステムに使用しているアルゴリズムは何か疑問に思っています。この種のアルゴリズムに関する本、サイト、またはリソースを知っている場合は、お知らせください。

42
Burak Dede

協調フィルタリング または レコメンダーシステム をご覧ください。

単純なアルゴリズムの1つは、 Slope One です。

30
Juha Syrjälä

ファッショナブルに遅い応答:PandoraとGroovesharkは、使用するアルゴリズムが大きく異なります。

基本的に、レコメンデーションシステムには2つの主要なアプローチがあります。1。協調フィルタリングと2.コンテンツベースです。 (およびハイブリッドシステム)

ほとんどのシステムは、協調フィルタリングに基づいています。これは基本的に設定のリストを一致させることを意味します):アイテムA、B、C、D、E、Fが好きで、他の何人かのユーザーがA、B、C、D、E、F、Jが好きなら、システムはJ私はこれらのユーザーと同じ趣味を共有しているという事実に基づいています(それはそれほど単純ではありませんが、それがアイデアです)。ここで分析される主な機能は、アイテムIDであり、ユーザーはこれらのアイテムに投票します。

コンテンツベースの方法では、手元のアイテムのコンテンツを分析し、他のユーザーの好みではなく、好きなアイテムのコンテンツに基づいてプロファイルを作成します。

そうは言っても、Groovesharkは協調フィルタリングに基づいています。Pandoraはコンテンツベースです(おそらく、いくつかの協調フィルタリングレイヤーが上にあります)。

Pandoraの興味深い点は、コンテンツが自動的にではなく、人間(ミュージシャン)によって分析されることです。彼らはそれをミュージックゲノムプロジェクト( http://www.Pandora.com/mgp.shtml )と呼んでおり、アノテーターは各曲に構造、リズムなどのいくつかの軸上のいくつかのラベルを付けています。調性、録音テクニックなど(完全なリスト: http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes )それが、推奨される曲を説明し、正当化するオプションを提供するものです。

21
ScienceFriction

集合知プログラミング は、この分野への素晴らしく、親しみやすい入門書です。

13
Dana

音楽コレクションのマッピングと視覚化 に説明付きの優れたデモビデオ(および著者の論文へのリンク)があります。このアプローチは、音楽自体の特性を分析することを扱います。 NetFlixやAmazonのような他の方法は、基本的なカテゴリフィルタリングだけでなく、同じような好みを持つ他のユーザーからの推奨に依存しています。

6
Bill the Lizard

Yehuda Koren(Netflix賞を受賞したチーム)による素晴らしい論文:Netflix大賞のBellKorソリューション(google "GrandPrize2009_BPC_BellKor.pdf" )。

カップルのウェブサイト:

4

マニングはまた、この主題に関する2冊の良い本を持っています。 インテリジェントWebのアルゴリズム および 集合知の実践

3
Saurabh Sharan

これらは2つの非常に異なるアプローチです。 Google Scholarは、文献に関する限り、あなたの友達です。

2
isomorphismes