AIの学習とは?ディープラーニングとは?

IT
この記事は約5分で読めます。
  • AIに学習させる
  • ディープラーニングを活用した技術

このような文章をよく目にしますが、具体性に欠けています。AIの学習とは何をさしているのか。ディープラーニングとは具体的にどういったものなのかを説明します。

実は学習のようなだけで、実際は計算が行われている

実際は計算が行われている。計算過程が学習っぽいだけなのです。

例えば身長と体重を入れると男か女か判定してくれるAIをイメージしてみましょう。

https://gyazo.com/c5bc60474f66b73dbe7d41c46617bd46

まずAIに対して身長、体重、性別のデータを入れてあげる必要があるのです。

https://gyazo.com/fb68222d36967c9e67f38c503b039b69

具体的には下記のようなデータです。
データをグラフにプロットしていきます。

https://gyazo.com/46babbcdae786d839ed0d2564292dcdd

すると、下図のようにある境界線で男女を判断することができるのではないか?と推測することができます。
※今回は境界が直線ですが曲線になるケースもあります。

https://gyazo.com/31e3b364fae08b6c65658e3f6d48b21f

この境界線は、点と線の距離でベストな境界を算出します
これがコンピュータによる学習の実態です。
ではさらにデータを増やしてみましょう。
すると今まで適切と思っていた境界線(点線)よりも、あらたな境界線(実線)のほうが、境界としてより正しいのではないか?と推測することができます。

https://gyazo.com/cc7e4435c8d8db313667d4153c8ff934

さらに、身長と体重だけでなく、靴のサイズのデータを追加投入してみましょう。
下図のようにグラフは3次元となります。
そして今度は線でなく面が境界となります。
※今回は境界が平面ですが曲面になるケースもあります。

https://gyazo.com/a67904d5fdbef2e50f0f7166bc1d7af1

これらの境界のどちら側にあるかというルール(モデルとも呼ばれます)に基づいて、男女判断が行われるのです。
例えば、私の身長は171cmで体重は90kgです。
このデータは投入したデータには存在しませんが、
境界線の上側にあるので、と判断することができるようになるのです。

https://gyazo.com/c5bc60474f66b73dbe7d41c46617bd46

つまり学習とは?

そして投入データ数が多くなればなるほど、境界の精度はUPしていきます。
この精度UPの過程が人間の学習っぽいので、機械学習と呼ばれるのです。

AI(人工知能)で忘れてはいけないこと

また、データがないと境界も計算できないので、当然男女判断もできません。
さらに、いろいろな身長、体重、靴のサイズの男性、女性がいるので、たまにミスも発生します。

つまり、AIは、

  • 事前のデータがないと何もできない
  • ミスも当然発生する

ということを忘れてはいけません。

境界の算出からわかること

先ほどはグラフ上の線や面で境界を表現しましたが、数式っぽい感じで表現すると以下のようになります、

  • 身長×●+体重×●+靴サイズ×●>●であれば
  • 身長×●+体重×●+靴サイズ×●<●であれば

この数式のは、事前投入したデータによって変化します。
例えば、「身長×0.01+体重×0.03+靴サイズ×24」とかだと、靴のサイズが男女判断に大きく影響していることがわかります。
これを線の太さで表現すると下図のようになります。

https://gyazo.com/b13652d5b529979c259c2ffabcc2dd46

このような学習手法を線形分類と呼んだりします。
つまり、ディープラーニングはまた別の手法というわけです。

人間の脳について

話が少し変わりますが、人間の脳はもっとすごいと言われいます。
例えば男女の判断は、

  • 身長
  • 体重
  • 靴のサイズ
  • 髪の長さ
  • 髪質
  • 顔の大きさ
  • スリーサイズ
  • 体脂肪率
  • すね毛
  • 体臭
  • 好きな食べ物
  • ほくろ数
  • 顔のでかさ
  • 何頭身か
  • 過去の病気
  • 顔の形
  • 算数の得意さ
  • シャンプーなに使ってるか
  • 趣味

他にもいっぱいあると思います。

人間の脳には、たくさんのニューロンがあると言われています。
ニューロン同士が複雑に結合し、関係性が強ければ強い電流が流れます。

https://gyazo.com/ff1bda18032811c4e7ea2e8584f923c6

例えばですが、身長を認識するニューロンと体重を認識するニューロンから電流が流れ、その電流量によって、ふっくら度を認識するニューロンが刺激を受けるというイメージです。
あくまでもイメージで実際の脳内はもっと複雑です。

脳のニューロン構造を真似したのがディープラーニング

この人間の脳のニューロン構造を真似したのがディープラーニングと言われています。

私たちがディープラーニングを用いてAIに学習させる実際の方法は、

  • データを大量に用意(先ほどより項目がかなり多いので)
  • ニューロンを意味する丸いものの配置を決める

の2つです。
※細かい設定はこれ以外にもたくさんありますが、メインはこの2つです。

そして、以下のように事前に準備しておいたデータを投入します。
データはインプット情報である身長、体重、靴のサイズ、・・・とアウトプット情報である性別を1セットとして、大量のセット数を投入します。
※一例のみ示していますが、実際は数万データを投入したりします。

https://gyazo.com/6adcef398e72a9d8d6870561fb1ed99b

で、この投入したデータにつじつまが合うように、
線の太さをコンピュータが計算していきます。
(線の太さは、重要度を意味します。重要度でインプットされたポイントを調整して次のシナプスに情報を伝達するというイメージです)
最終的に以下のような構造になるとしましょう。

https://gyazo.com/6680b0df079ef9621612e30c858403e5

そして完成した構造(モデルと呼ばれたりします)身長、体重、靴サイズ、髪の長さなどのデータを投入することで、男女判断が可能になるのです。
しかし、間に位置する丸いものの意味する概念は分からないので、「なぜこのような性別判断となるか」は分からないというのがディープラーニングの特徴です。

つまりディープラーニングとは

なのでディープラーニングとは以下の特徴を持ちます。

  • データが大量に必要
  • とてつもない計算ができるコンピュータが必要
  • 間のニューロンが何を意味するものであるかはよくわからない
  • つまりAIによって「なぜその判断になるか」ではなく「結果」のみ知りたいときに活用される
  • とにかくデータを投入して、コンピュータパワーで計算し、判定ルールを導く超あらわざ

だからディープラーニングを使うために、近年ビッグデータが流行ってるのですね!

まとめ

  • 事前にデータを投入し、コンピュータが判断に持いられる境界線を計算で求める。これが学習の実態
  • データ投入量に応じて精度UPしていく過程が人間の学習っぽいので、機械学習と呼ばれる
  • AI判断は事前のデータがないと何もできない
  • AI判断はミスも発生する
  • 脳のニューロン構造を真似したのがディープラーニング
  • ディープラーニングは大量データと協力なコンピュータが必要
  • ディープラーニングは「なぜその判断になるか」ではなく「結果」のみ知りたいときに活用されやすい
  • ディープラーニングはとにかくデータを投入して、コンピュータパワーで計算し、判定ルールを導く超あらわざ

コメント

タイトルとURLをコピーしました