生体の視覚システムに学んだ動き検出および特徴抽出ビジョンチップに関する研究
幸谷 真人
2000 年度 卒 /修士(工学)
修士論文の概要
本研究は、生体の網膜から脳へわたる初期視覚システム(ノイズ除去・エッジ検出・動き検出等)の中で、特徴抽出、視覚対象の動き、そしてそれに続く情報処理機構を中心とした基本神経ネットワークのアナログ集積回路化に関するものである。これらの初期視覚システムを模倣した集積回路は、画像処理を行う逐次演算型計算機のプリプロセッサとして、コンパクトかつ実用的な演算速度を持つ必要がある。そこで本研究では、現在得られている生体の初期視覚システムの生理学的知見をもとに、そのシステムの機能および構造を模倣する基本アナログ回路およびネットワークの開発を目的とした。
ビジョンチップとは、画像入力センサを持ち、エッジ検出等の初期視覚アルゴリズムの超並列処理を行う画像処理用アナログCMOS VLSIである。初期視覚システムを模倣した集積回路は、アルゴリズムの新規性、光センサの埋蔵、MOSトランジスタのサブスレショルド領域動作という特徴を兼ね備えたコンパクトな構成をしている。
網膜は、眼底に位置する厚さ200〜300ミクロンの神経組織である。その組織の中には驚くほど緻密に細胞が配列されている。ビジョンチップへの応用を考える際、脊椎動物の中でも魚類、両生類等の下等動物の網膜は興味ある対象である。その理由は、下等動物では高次中枢いわゆる脳が高等動物に比べ貧弱なため、視覚の基本機能がむしろ網膜に存在するからである。また下等動物の網膜細胞は比較的大きく、生物学的な実験も容易であることから、ビジョンチップに結びつく重要なヒントが直接得られる可能性を秘めている。
最初に、昆虫の視覚システムに学んだ動き検出ビジョンチップを実現するニューラルネットワークモデルを示した。相関型ニューラルネットによる局所動き検出は、入射光の二値化層、エッジ検出層、相関層で構成される。視覚対象のエッジ検出は、網膜における最も初期的な情報処理である。エッジ検出を電子回路化するために、電流モードで動作する非同期デジタル回路を提案した。サブスレショールド領域の電流を二値化することで、ノイズ除去、低消費電力および後段に続く電流モード処理への円滑な連結を可能とした。動きの検出機構は、生体の初期視覚システムの中で、最も重要かつ基本的であると考えられている。昆虫を模倣した動き検出回路は、大規模集積化の阻害要因になる大きな容量を必要としないため、極めてコンパクトに設計することが可能となった。より高感度なセンサを目指し、各視細胞(PD)には、電流増幅器が付加された。
提案した生体様動き検出チップの基本的動作を数値計算およびSPICEシミュレーションにより確認した。さらに設計したレイアウトパターンのチップ作成を米国の半導体設計機関(MOSIS)に依頼し、その試作チップの測定結果を示した。試作チップは光入力を電気信号に変換し、遅れあり・なし信号の相関を出力として電気的に検出する回路構造になっている。
次に、視覚情報の特徴抽出を行う生体様ビジョンチップを実現するアルゴリズムを提案し、アナログ電子回路化を行った。局所速度ベクトルの線形和による動き特徴検出モデルは、上記の動き検出回路を二次元マトリクス状に配置したものであり、視覚対象の動き方向に対してニューロンが選択的に応答する。提案したモデルは、視覚対象の二次元オプティカルフロー算出に加え観測者自身の並進運動を検出する機能も兼ね備えている。
さらに上述したインテリジェント・センサタイプの集積回路のより高度な情報処理を目指し、特徴抽出モデルのアナログ・ディジタル混載CMOS回路化を行った。画像の基本特徴(直線)抽出機構は、高次視覚情報処理システムにとって極めて重要である。近年Hough変換に基づく特徴抽出機構を有するシステムが数多く提案されており、Hough変換を高速に行う専用プロセッサの需要が高まっている。また、生体の優れた視覚情報処理機能を解明するために、Hough変換に基づく視覚神経モデルも多数提案されており、Hough変換と生体が行う視覚情報処理の間の興味深い関係が次第に明らかになってきた。
一例として、ニューロンとHough変換の対応関係を以下に述べる。視細胞には、入力画像に含まれる直線成分にのみ発火する特定の単純細胞Aがある。その細胞の場所が位置と方位を示すことになり、これらはHoughパラメータ空間におけるθとρに対応する。次に別の単純細胞Bが、遅れあり・なし細胞A間の「時空間相関」を実行し、直線成分の一次元速度を検出する。これらの単純細胞Bを「集積」して、一群の複雑細胞Bがその細胞配列内で正弦波状に発火する。その正弦波の振幅と位相が、二次元速度の大きさと移動方向に対応している。このことはHough変換における投票・多数決を意味しており、Hough変換そのものが、画像入力における基本特徴抽出から動き検出に至る重要な橋渡し的役割であると言っても過言ではないことがわかる。
本研究では、生体の優れた視覚機能を模擬する人工視覚システムの実現に向けて「Hough変換を行うアナログ-デジタル混載型LSI」のアーキテクチャを提案し、高速かつコンパクトな画像処理システムの実現可能性を探った。
Hough変換による静止画・動画の特徴抽出モデルの提案およびアナログ電子回路化を以下の二つのアプローチにより実現した。1)並列型Hough変換チップ、2)局所画像の特徴検出に特化したHough変換チップ。1)のアプローチは、「二次元構造を保ったまま」脳が行う線分の特徴抽出処理を模擬し、イベント駆動型のインターフェースにより、神経パルスライクな応答をする。このような集積回路化のアプローチは、生体様ハードウェア技術と併せて、将来の「脳型コンピュータ」実現に向けて役立つものと言える。2)のアプローチはLSI化を目指した計算効率の良いアルゴリズムに基づいている。構造を簡略化することでチップ面積を有効利用できるため、高次情報処理における付加的な機能を混載可能である。これらのアナログ電子回路化を行い、シミュレーションおよび数値計算の結果を示した。次に試作チップのレイアウトパターンおよびチップの特性を示した。2)のアプローチによる測定結果では、シンプルな構造にも関わらず信頼度の高い直線検出が可能であることを示し、より汎用性の高い機能の追及を検討した。
最後に、以上に述べたアナログ画像処理用ニューロチップについての実現可能性を述べまとめとした。