0.はじめに

少し前からよく機械学習というキーワードを聞くことが多くなりました.

機械学習を学ぶ上では数学的知識が必要なことが多く,大学で数学を学んでいない方にとってはハードルが高いと思われがちです.

そこで文系エンジニア目線で機械学習について学んだことをまとめて見ました.

同じ文系エンジニアや機械学習初心者の助けになればと思います.

 

1.前提

以下の言語・ライブラリを利用しております.

python : 2.7.6

tensorflow : 0.11.0

 

2.機械学習の種類

教師あり学習(supervised learning)

学習に用いるデータの中に,正解となる値(予測したい)値が含まれているもの.

例えば有名なMNISTの場合,0-9の画像と共にその画像が表す数字がセットとなっているため,教師あり学習に分類される.

教師あり学習は以下のいずれかに分類できる.

分類(classification)

2種類以上に分類されているデータを用いて学習し,未分類のデータがどの分類に含まれるのかを予測する.別の見方をすれば,連続した値ではなく飛び飛びの値を用いた教師あり学習と考えることができる.

MNISTもこれに含まれる.(0-9のどの数字に当てはまるか分類するため)

回帰(regression)

出力結果(予測結果)として望む値の中に,1つ以上の連続的な値が含まれている場合,回帰と呼ばれる.

例えば,面積と高さから建物の価格を予測する問題がこれに該当する.

教師なし学習

学習に用いるデータに正解となる答え(target values)が含まれていない場合,教師なし学習と呼ばれる.

学習の用途としては以下の3つが考えられる.

  • クラスタリング: データを似た値同士でグループ分けする
  • 密度予測: 入力値からデータの分散度合いを予測する
  • 低次元化: 高次元のデータを2-3次元のデータに変換する.これはデータの可視化等に用いられる.

3.機械学習に用いるデータの考え方

機械学習ではデータをもとにアルゴリズムの学習を行い,その後新しい別のデータに対して学習したアルゴリズムを適用して評価を行う.

そのため通常の機械学習ではデータを学習用データ(training set)と評価用データ(testing set)の2つに分けて実施する.

 

Leave a Reply

Your email address will not be published. Required fields are marked *