AI 強化学習 教師あり学習 教師なし学習 機械学習

機械学習とは?機械学習の3つの種類について

2022年1月2日

Ryo

 昨今のAIブームの火付け役となったのは、「機械学習(マシンラーニング)」の発明でした。本記事では、機械学習の概要と、主要な手法である「教師なし学習」「教師あり学習」「強化学習」について、解説していきます。

この記事のポイント
・機械学習とは、 あらかじめ用意されたデータを機械が学習することで、そのパターンやルールなどを発見する手法
・機械学習の学習結果を用いて、新たなデータに対し、「予測」を行うことが可能となる
・機械学習には、「教師あり学習」「教師なし学習」「強化学習」の3種類がある

機械学習とは?

機械学習(きかいがくしゅう、英: machine learning)とは、経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で、人工知能の一種であるとみなされている。「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこなす。

フリー百科事典『ウィキペディア(Wikipedia)』

 機械学習は、あらかじめ用意されたデータを機械が学習することで、そのパターンやルールなどを発見する手法で、学習結果を用いて、新たなデータに対し、「予測」を行うことが可能となります。例えば、通常のメールと、スパムメールの文章を学習データとして与えたとき、機械は「高額当選」「延滞金」「未払い」といった言葉のパターンを発見します。そして、新たなメールが来た際に、学習結果と照らし合わせることで、スパムメールかそうでないか「予測」することができます。

機械学習のイメージ図

 機械学習には、正解データを与え、新たなデータに対し正解か否かを予測する「教師あり学習」、正解となるデータ(上の例では、スパムメールの文章)を持たず、主にデータの分類を行う「教師なし学習」、機械の行動に対して報酬を与え、目的の行動をさせる「強化学習」の3種類があります。詳しく下記で解説していきます。

教師あり学習

 教師あり学習とは、正解データ(教師データ)を与え、新たなデータに対し、それが正解か否かを予測する手法で、上記のスパムメールの例が該当します。教師あり学習には、主に「回帰」と「分類」の2種類があります。

回帰

 複数のデータ(説明変数)から、目的となるデータ(目的変数)を予測する方法です。例えば、「身長」を目的変数とした場合、「年齢」「体重」「座高」などが説明変数として考えられ、それぞれの値から「身長」を予測します。実務では、不動産の価値や、病気の発生の予測など、幅広い分野で用いられます。

教師あり学習 回帰のイメージ図

分類

 教師データの傾向や特徴を学習し、「同じ傾向・特徴のあるデータ」を分類する方法で、上記スパムメールの分類や、手書き文字などの画像解析でも用いられます。

教師あり学習 分類のイメージ図

教師なし学習

 正解となるラベル(上の例では、スパムメールか否か)を持たず、主にデータの傾向や特徴を示すために使う手法で、主に「教師あり学習」を行う前の正解データ(教師データ)の前処理として行われます。ここでは、代表的な手法である「主成分分析 (Principal Component Analysis)」、「クラスタリング」について解説します。

主成分分析(Principal Component Analysis)

 教師あり学習にて、例えば「健康か否か」を予測する際に、「体重」は重要な変数だと考えられますが、同じ体重でも、「身長」が150cm か170 cm かで「健康か否か」に与える影響は異なってきます。このように、「体重」「身長」など複数の変数を、互いに関係しないそれぞれ独立な変数として扱ってしまうと、予測結果が悪くなってしまうことがあります。
 主成分分析は、既存の変数から、新たな変数を作り出す手法で、効率よく結果に結び付くデータを生成する手法で、学習コストの軽減や、予測結果の向上が期待されます。 上の例では、「体重」と「身長」の2つの変数を、「BMI(体重÷身長の2乗)」という1つの変数にすることで、変数が1つ減ることによる学習にかかる時間の軽減や、「健康か否か」を予測する精度の向上が見込まれます。

教師なし学習 主成分分析のイメージ図

クラスタリング

 教師あり学習にて、予測したい事柄に対して、収集したデータの意味をしっかりと理解し、効率よく学習に用いていくことは非常に重要になります。しかし、説明変数が数千にも及ぶものもあり、それぞれの意味を理解していくことは困難です。
 クラスタリングは、データの類似度に基づいて、データをグループ分けする手法で、主にマーケティング分野などで利用されています。

教師なし学習 クラスタリングのイメージ図

強化学習

 機械の行動に対して報酬を与え、目的の行動をさせる手法で、例えば、「サッカーの試合に勝つこと」を目的とした場合、ゴールを決めれば「+1」、ゴールを決められれば「-1」のように、行動に対して報酬と罰を与えていき、目的の行動をさせるようにします。
 2015年、Googleが開発した「AlphaGo」は、強化学習を応用したアルゴリズムを用いて開発され、複雑なルールと戦略があるゲーム性から、「機械が人間に勝つのは不可能」といわれた「囲碁」で、当時の世界チャンピオンを打ち破り、話題となりました。

強化学習のイメージ図

-AI, 強化学習, 教師あり学習, 教師なし学習, 機械学習