はじめまして。ビッグデータ推進課のshimesaba_oishiです。
映画好きな社会人4年目、現在データ分析のお仕事をしています。
さて、今回は「機械学習」についてお話したいと思います。
1.機械学習について
今日、機械学習はニュースなどでも数多く取り入れられています。
私の業務経験上、主に機械学習の流れは以下と考えています。
- コンピュータにデータを読み込ませる。
- データからそこに潜む特徴やパターンを見つけ出す。
- その結果を元に判断や予測を行う。
例えばコンピュータにイヌかネコか判断させたい場合、すでに答えがあるイヌやネコの画像データをあらかじめ読み込ませ、特徴やパターンを学習させておきます。そうすることで新しい画像に対してイヌかネコか判断することができます。
迷惑メールなどもこの機械学習を用いて判定させることができます。
読み込ませるデータ量が多ければ多いほど、良い学習結果が得られるので、ビッグデータの拡大とともに機械学習への注目は今後も高まっていくのではないでしょうか。
2.機械学習の種類について
機械学習には次の3つの種類が存在します。
- 教師あり学習
- 教師なし学習
- 強化学習
今回は私が業務で経験のある「教師あり学習」と「教師なし学習」についてご紹介したいと思います。
教師あり学習
教師あり学習は、入力データに「答え」を付与して学習を行います。未知のデータに対して判断や予測をしたいときによく行われる手法です。さきほどのイヌとネコの画像は、「答え」を付与したデータで学習を行っているため、教師あり学習と言えるでしょう。
教師なし学習
教師なし学習は、入力データに「答え」を付与せず学習を行います。「答え」がないため、入力データそのものに対してグルーピングしたり、入力データ間の関係性などを見つけたいときによく行われる手法です。例えば下記は、あるお店の前月の顧客の「購入金額」と「来店回数」を属性としてクラスタリングを行っています。このように特徴が似ている顧客でグルーピングすると、各グループに応じたマーケティング施策を行うこともできます。
3.おわりに
ここでは機械学習のほんの一部分をお話しました。機械学習はとても便利ですが、どんな課題も解決できる万能手法ではありません。機械学習にも向き不向きがあり、どういう場合に機械学習を用いると適しているかを議論することは重要なことだと考えております。ご興味ある方は是非この辺りも調べてみてください!
次回はモデルの作成術についてご紹介いたします。是非ご覧ください!
当社問い合わせフォーム:https://www.css-net.co.jp/contact/