以下動画内音声書き起こし
どうもモッパーです。
今回は画像認識分野の一つである、画像分類について解説していきたいと思います。
まず画像分類とは、画像の中に一体何が映っているのかをコンピューターや機械などが識別する技術です。画像から色や形といった特徴を読み取り、その特徴をさまざまな学習機に入れて新たな画像を認識できるようにしたパターン認識技術のひとつです。
では具体例を見ていきましょう。
例えばこの画像は犬この画像は猫、この画像は猿、のように人間では簡単に識別することができます。これを人工知能で同じように行います。
どういうことかと言うと、例えばこの犬の画像を人工知能に与えます。そうすると人工知能がこの画像を識別して「犬」と返してくれます。画像分類という漢字の通り画像を分類することになります。もちろん動物の写真だけではなくて最近では車の種類なども区別できるようになっています。
では実際にどういう場面で使われているのかを見ていきましょう。
不動産屋においては物件の写真を自動でキッチン、リビング、トイレなどを分類し人間が分類作業を行う必要がなくなりました。医療現場では画像が癌であるかどうかの判別など現実世界での導入も進んでいます。
この動画では、後で実際に数字を分類する人工知能を見ていきたいと思います。
それでは今回、人工知能に与えるデータを見ていきます。今回使用するデータセットはMNISTというデータセットでインターネット上で無料で公開されており、誰でも使うことができます。MNISTのデータセットは手書きで書かれた数字が画像になった画像データと、その画像に書かれた数字の正解となるラベルデータで構成されています。
そして画像データとラベルデータのペアは学習用に6万個、検証用に1万個あります。データは0から9までの数字が書かれている画像と、その数字が何であるかのセットになっています。これは人工知能に正解を教えてあげる必要があるため、このような構造になっています。
それでは実際に人工知能が学習する様子を見ていきましょう。
実際に学習を進めていきたいと思います。ここに人工知能がプログラミングされたコードがあります。これを実行することによって先ほど紹介したMNISTというデータセットを使って、人工知能が学習する様子を見れます。
では実際に学習していきましょう。
学習がですね、進むとこのようにログが出てきます。では学習が終わるまで少し待ちましょう。
はい。学習が終わるとですね、このように精度が99%というふうな結果になりました。
以上でこの動画を終わりたいと思います。ご視聴ありがとうございました。
Leave a Reply
You must be logged in to post a comment.