動画像のシーン分類を可能にする新規特徴抽出法とそのニューラルネットワークアーキテクチャに関する研究
伊藤 健之
2015 年度 卒 /修士(工学)
修士論文の概要
本研究は、イメージセンサとイメージプロセッサを三次元積層し、これらの間でコイル間磁界結合による並列データ転送を行うことで、イメージセンサによって高フレームレートで撮影された動画像を高速にイメージプロセッサ転送し、画像処理を行う高バンド幅並列処理型イメージセンサ-イメージプロセッサの三次元集積システムを目標とし、そのイメージプロセッサに搭載する高速撮像を利用したアプリケーションとして、動画像のフレーム間差分から求められる動きベクトルをニューラルネットワークに学習させることにより、動画像分類を行うアーキテクチャに関するものである。この動きベクトルの機械学習システムは、その前段で推定される動きベクトルが1000fpsなどの高速撮像環境を前提としているため、それに合わせて高速かつ正確に分類する必要がある。動きベクトルの機械学習に関する研究は過去に例がなく、学習モデルおよび必要であればその前段処理について動きベクトルを学習することに適した物を見つける必要がある。
本研究では特に、非常に複雑な分類が可能であるDeep Learningのような学習モデルでも行われている特徴抽出の代わりになり、なおかつ簡単な演算で実現可能な特徴抽出法を提案することにより、Deep Learningのような複雑な学習モデルを用いることなく動画像の分類が可能になるかの検証、及びそのアーキテクチャ設計を中心として行った。