本記事では教師あり学習と教師なし学習と強化学習の違いについて勉強します。目次は以下の通りです。
そもそも機械学習とは?
機械学習は、大量のデータから自動的にパターンを学び、新しいデータに対する予測を行う方法です。種類としては3つあり、それぞれ教師あり学習、教師なし学習、強化学習です。
教師あり学習とは
教師あり学習とは入力データと正解データがセットになっており、そのセットの関係性を用いて新たな入力データから正解データを予測する方法です。つまり、過去のデータ(学習データ)から値を予測する学習方法です。販売予測や天気予測などは教師あり学習の代表例でしょう。
なお、教師あり学習で扱うタスクとして分類と回帰があります。
分類
分類とは各データが所属するカテゴリを推定するタスクのことです。画像データが犬か猫かを識別するものが代表例です。
回帰
回帰は分類と違って連続値を予測するタスクになります。なので、データの分布とかを表す予測になります。株価の予測とがいい例です。
教師あり学習の具体例
教師あり学習の手法として代表的なものは以下の通りです。
- ロジスティック回帰
- サポートベクターマシン
- 決定木
- ランダムフォレスト
教師なし学習とは
教師なし学習は教師あり学習と逆で正解データがありません。なので、入力データのみでパターンや構造を見つける学習方法です。ネット通販のレコメンドや画像認識などは教師なし学習の例と言えます。
なお、教師なし学習で扱うタスクとしてクラスタリングと次元削減があります。
クラスタリング
クラスタリングとは値の類似性をもとにデータをグループ化する作業のことです。似た特性を持つデータが同じクラスタに属し、異なる特性を持つデータは異なるクラスタに属します。このようにして、データを意味のあるグループに分類することができます。
次元削減
次元削減とは次元(変数の数)を減らす作業のことです。次元を減らすことにより高次元のデータからできるだけ情報を保存するように低次元のデータに変換することです。一言で言うと100項目の評価基準を10項目に減らしたいよね!っていうものです。
教師なし学習の具体例
教師あり学習の手法として代表的なものは以下の通りです。
- 主成分分析
- 階層型クラスタリング
- 非階層型クラスタリング
- k-means
強化学習とは
強化学習は、特定の状況で最も高い報酬を獲得するために適切な行動を学習するプロセスです。もう少しかみ砕くと「この状況でどんなことをすれば一番得かな」と考えながら学習する機械学習方法です。囲碁や将棋などのAIはまさしく強化学習の代表例といえるものです。
まとめ
本記事では教師あり学習、教師なし学習、強化学習の3つの学習方法について簡単に学びました。どの学習方法も適切なときと不適切なときがあるので、目的に合った学習方法を用いることが大事です。
コメント