web-dev-qa-db-ja.com

誰でも教師付き学習と教師なし学習の実際の例を挙げることができますか?

私は最近、教師あり学習と教師なし学習について勉強しました。理論から、教師ありはラベル付きデータセットから情報を取得することを意味し、教師なしはラベルを付けずにデータをクラスタリングすることを意味します。

しかし、問題は、与えられた例が私の学習中に教師あり学習であるか教師なし学習であるかを識別するために常に混乱することです。

誰でも実際の例を挙げてもらえますか?

35
krupal

教師あり学習:

  • あなたはたくさんの写真を手に入れますそれらに何が含まれているかについての情報とともにそして、あなたは新しい写真を認識するためにモデルを訓練します。
  • たくさんの分子があり、どの薬物に関する情報があり、新しい分子も薬物であるかどうかを答えるためにモデルを訓練します。

教師なし学習:

  • あなたは6人の写真をたくさん持っていますが、誰が誰であるかに関する情報なしで、divideこのデータセットを6つの山に分割し、それぞれが1人の写真を持ちます。
  • 分子があり、その一部は薬物であり、一部は薬物ではありませんしかし、どちらがどれであるかはわかりませんであり、アルゴリズムで薬物を発見する必要があります。
59
lejlot

教師あり学習:

  • 先生と学ぶようなものです
  • トレーニングデータセットは教師のようなものです
  • トレーニングデータセットはマシンのトレーニングに使用されます

例:

分類:マシンは何かをいくつかのクラスに分類するように訓練されています。

  • 患者が病気にかかっているかどうかを分類する
  • メールがスパムかどうかを分類する

回帰:マシンは、価格、重量、身長などの値を予測するようにトレーニングされています。

  • 住宅/不動産価格の予測
  • 株式市場価格の予測

教師なし学習:

  • 教師なしで学ぶようなものです
  • 機械は観察を通じて学習し、データ内の構造を見つけます

例:

クラスタリング:クラスタリングの問題は、データ内の固有のグループ化を発見する場所です

  • 購買行動による顧客のグループ化など

関連付け:関連付けルール学習の問題は、データの大部分を記述するルールを発見する場所です。

  • xを買う人もYを買う傾向がある

続きを読む: 教師ありおよび教師なし機械学習アルゴリズム

13

教師あり学習

これは簡単で、たとえば次のように何度も実行できます。

  1. Cortanaまたは携帯電話の音声自動化システムが音声をトレーニングし、このトレーニングに基づいて作業を開始します。
  2. さまざまな機能に基づいて(直接対決、ピッチ、トス、プレイヤー対プレイヤーの過去の記録) [〜#〜] wasp [〜#〜] は両チームの勝率を予測します。
  3. 手書き文字をOCRシステムにトレーニングします。トレーニングが完了すると、手書き画像をテキストに変換できるようになります(明らかにある程度の精度が得られるまで)
  4. いくつかの事前知識に基づいて(晴れのときは気温が高くなり、曇りのときは湿度が高くなるなど)、天気アプリは特定の時間のパラメーターを予測します。
  5. スパムに関する過去の情報に基づいて、新しい受信メールをInbox(normal)またはJunk folder(スパム)

  6. (生体認証ID-親指、虹彩、耳たぶなど)を数回入力した後、マシンをトレーニングするバイオメトリック出席システムまたはATMなどのシステムは、マシンが将来の入力を検証し、あなたを識別することができます。

教師なし学習

  1. 友人があなたを完全に見知らぬ人に会う彼のパーティーに招待します。次に、教師なし学習(事前知識なし)を使用して分類します。この分類は、性別、年齢層、服装、教育資格、または希望する方法に基づいて行うことができます。 この学習が教師あり学習と異なるのはなぜですか?あなたは人々に関する過去/事前の知識を一切使用せず、「外出中」に分類したので。

  2. NASAは新しい天体を発見し、星、惑星、小惑星、ブラックホールなど、以前に知られている天体とは異なる(つまり、これらの新しい天体についての知識がない)ことを発見し、希望する方法で分類します(天の川からの距離、強度、重力、赤/青シフトなど)

  3. 今までにクリケットの試合を見たことがなく、偶然にインターネットでビデオを見たとしましょう。今、あなたは異なる基準に基づいてプレーヤーを分類できます:同じ種類のキットを着ているプレーヤーは1つのクラスに、1つのスタイルのプレーヤーは1つのクラス(打者、ボウラー、野手)、またはプレイハンドに基づいて(RH対LH)、またはあなたがそれを観察する(および分類する)あらゆる方法。

  4. 大学の学生のIQレベルの予測に関する500の質問の調査を実施しています。このアンケートは大きすぎるため、100人の学生の後、管理者はアンケートをより少ない質問にトリミングすることを決定し、そのために [〜#〜] pca [〜#〜] のような統計的手順を使用します。それをトリムします。

これらの2つの例が、違いを詳細に説明することを願っています。

11

教師あり学習

教師付き学習は分類問題ではかなり一般的です。なぜなら、目標は多くの場合、コンピューターに作成した分類システムを学習させることだからです。再度、数字認識は分類学習の一般的な例です。より一般的には、分類学習は、分類を推測することが有用であり、分類を簡単に決定できるあらゆる問題に適しています。場合によっては、エージェントが自身で分類を実行できる場合、問題のすべてのインスタンスに事前に決定された分類を与える必要さえないかもしれません。これは、分類コンテキストでの教師なし学習の例です。

教師あり学習は、ニューラルネットワークと決定木をトレーニングするための最も一般的な手法です。これらの手法は両方とも、事前に決定された分類によって提供される情報に大きく依存しています。ニューラルネットワークの場合は、分類を使用してネットワークのエラーを特定し、ネットワークを調整して最小化します。決定ツリーでは、分類を使用して、解決に使用できる情報を最も多く提供する属性を特定します。分類パズル。これらの両方をより詳細に見ていきますが、今のところ、これらの例の両方が、事前に決定された分類の形で何らかの「監督」を持つことに成功していることを知るだけで十分でしょう。

隠れマルコフモデルとベイジアンネットワークを使用した音声認識は、通常のように、与えられた入力のエラーを最小化するようにパラメーターを調整するために、監視のいくつかの要素にも依存します。

ここで重要なことに注意してください。分類問題では、学習アルゴリズムの目的は、与えられた入力に関する誤差を最小化することです。多くの場合「トレーニングセット」と呼ばれるこれらの入力は、エージェントが学習しようとする例です。しかし、トレーニングセットを適切に学習することは、必ずしも最善のことではありません。たとえば、排他的論理和を教えようとしたが、1つのtrueと1つのfalseからなる組み合わせのみを示したが、両方ともfalseまたは両方がtrueにならない場合、答えは常にtrueであるというルールを学習できます。同様に、機械学習アルゴリズムでは、一般的な問題は、データを過剰適合させ、より一般的な分類手法を学習するのではなく、基本的にトレーニングセットを記憶することです。

教師なし学習

教師なし学習ははるかに難しいようです。目標は、コンピューターに、私たちがそれを行う方法を教えていないことを行う方法を学習させることです!教師なし学習には、実際には2つのアプローチがあります。最初のアプローチは、明示的な分類を与えることではなく、成功を示すために何らかの報酬システムを使用することによって、エージェントに教えることです。目標は分類を作成することではなく、報酬を最大化する決定を下すことであるため、このタイプのトレーニングは一般に意思決定問題のフレームワークに適合することに注意してください。このアプローチは、エージェントが特定のアクションを実行した場合に報酬を受け取り、他のアクションを実行した場合に処罰される現実の世界にうまく適用されます。

多くの場合、強化学習の形式は教師なし学習に使用できます。エージェントは、その行動が世界に与える正確な方法に関する情報を必ずしも学習することなく、以前の報酬と罰に基づいて行動します。ある意味では、報酬関数を学習することで、エージェントは実行できる各アクションに対して達成することが期待される正確な報酬を知っているので、エージェントは処理なしで何をすべきかを単に知っているため、この情報はすべて不要です。これは、すべての可能性を計算するのに非常に時間がかかる場合(世界の状態間の遷移確率がすべてわかっている場合でも)に非常に有益です。一方、本質的に試行錯誤によって学習するのは非常に時間がかかります。

しかし、この種の学習は、事前に発見された例の分類を想定していないため、強力です。たとえば、場合によっては、分類が最善ではない場合があります。驚くべき例の1つは、教師なし学習で学習した一連のコンピュータープログラム(ニューロギャモンとTDギャモン)が、単に自分でプレイするだけで最高の人間のチェスプレーヤーよりも強くなったときに、バックギャモンのゲームに関する従来の知恵が頭に浮かんだことです。何度も。これらのプログラムは、バックギャモンの専門家を驚かせるいくつかの原則を発見し、事前に分類された例で訓練されたバックギャモンのプログラムよりも優れたパフォーマンスを発揮しました。

教師なし学習の2番目のタイプは、クラスタリングと呼ばれます。このタイプの学習の目標は、効用関数を最大化することではなく、単にトレーニングデータの類似性を見つけることです。多くの場合、検出されたクラスターは直感的な分類と合理的によく一致すると仮定されます。たとえば、人口統計に基づいて個人をクラスタリングすると、あるグループの富裕層と別のグループの貧困層がクラスタリングされる可能性があります。

6
Amir

教師あり学習には入力と正しい出力があります。例:人が映画を好きかどうかのデータがあります。人々にインタビューし、映画が好きかどうかの回答を収集することに基づいて、映画がヒットするかどうかを予測します。

Raw Data

上記のリンクの写真を見てみましょう。赤い丸でマークされたレストランを訪れました。私が訪れたことのないレストランは青い丸でマークされています。

ここで、緑色のマークが付いたAとBの2つのレストランを選択する場合、どちらを選択しますか?

シンプル。指定されたデータを2つの部分に線形に分類できます。つまり、赤と青の円を分離する線を引くことができます。以下のリンクの写真を見てください。

Learned By supervised learning

これで、自信を持って、私がBを訪れる可能性はAよりも大きいと言えるでしょう。これは、教師あり学習の場合です。

教師なし学習には入力があります。予約を受け入れるか拒否するかを選択できるタクシー運転手がいるとします。私たちは彼の受け入れた予約場所を青い円で地図上にプロットしました。

Raw data for unsupervised learning

現在、タクシー運転手は2つの予約AとBを持っています。彼はどちらを受け入れますか?プロットを観察すると、彼の受け入れられた予約が左下隅にクラスターを示していることがわかります。それは次の図に示すことができます。

Unsupervised Learning

5
H-V

教師あり学習:簡単な用語では、特定の入力があり、いくつかの出力が期待されます。たとえば、以前のデータである株式市場のデータがあり、必要な出力を提供できるいくつかの指示を与えることで、今後数年間の現在の入力の結果を取得します。

教師なし学習:色、種類、何かのサイズなどのパラメーターがあり、果物、植物、動物など、それが何であるかを予測するプログラムが必要です。入力。

0
Ajith Tolroy