next up previous
次へ: 重み付き最小2乗法によるレンジデータの微分幾何学的特徴の計算 上へ: 画像計測・認識実験 戻る: 既知対象による入力画面の計数

顔画像の認識

以上の実験は2値画像を対象としたものであったが、次に、濃淡画像(顔画像)を対象 とした認識実験を行った。

図 8.8: 顔画像の例
\begin{figure}\begin{center}
\psfig{file=k01.eps,width=5cm}\psfig{file=k04.eps,w...
....eps,width=5cm}\vspace*{0.5cm} \\
(c)
\vspace*{0.5cm}
\end{center}\end{figure}

まず、線形判別分析を用いた顔画像の認識実験を行なった。3人の顔をビデオカメラ で撮影し、それぞれ20枚の顔画像を画像データとして計算機に取り込んだ。各画像 は $300 \times 200$ ピクセルの解像度である。図8.8 (a) から (c) に画像データの例を示す。

図 8.9: 判別分析により得られた判別空間
\begin{figure}\begin{center}
\psfig{file=images/fig-8.9.eps,width=100mm}\end{center}\end{figure}

各画像から高次局所自己相関特徴を計算し、線形判別分析を行なった。この場合には、 判別するクラス数が $K=3$ であることから、判別空間の次元は高々 $2$ 次元である。 図8.9に判別分析で得られた特徴空間を示す。ここで、図の番号 は、それぞれ (a), (b), (c) の顔に対応している。ほぼクラスごとにまとまってい る様子がわかる。この判別空間の判別力 $\eta =
\mbox{tr}(\tilde{\Sigma}_T^{-1}\tilde{\Sigma}_W)$ は1.143 であった。ただし、 $\tilde{\Sigma}_T$ および $\tilde{\Sigma}_W$ は、それぞれ判別空間での全分散 共分散行列およびクラス内分散共分散行列である。

この判別空間で各画像を最も近い平均ベクトルを持つクラスに識別すると、 100% 正しく識別された。未知データに対する認識率を leave-one-out 法を用いて 推定すると、その識別率は 95% であった。

図 8.10: 解像度の違いによる判別空間の変化
\begin{figure}\begin{center}
\psfig{file=images/fig-8.10.eps,width=100mm}\end{center}\end{figure}

次に、画像の解像度の影響を調べるため解像度をいろいろ変えて認識実験を試みた。 もとの画像から画像ピラミッドを構成し、画像ピラミッド中の解像度の異なる各画像 から計算した高次局所自己相関特徴を抽出し、線形判別分析を行なった。各 解像度の画像に対する判別空間を図8.10 (a) から (f) に示す。また、各 解像度の画像に対する判別力および leave-one-out 法で推定した識別率を表 8.1に示す。画像の解像度により判別力および識別率が変化している様 子がわかる。


表 8.1: 解像度と判別力および認識率の関係
解像度 $1$ $\frac{1}{2}$ $\frac{1}{4}$ $\frac{1}{8}$ $\frac{1}{16}$ $\frac{1}{16}$ $\frac{1}{64}$
判別力 $\eta$ 1.14 1.46 1.40 1.29 1.29 0.84 0.67
認識率 $R (\%)$ 95 100 98 98 98 98 100

図 8.11: 画像ピラミッド中の異なる解像度の画像から抽出した特徴を全て使って構 成した判別空間
\begin{figure}\begin{center}
\psfig{file=images/fig-8.11.eps,width=100mm} \end{center}\end{figure}

次に画像ピラミッド中の異なる解像度の画像から抽出した特徴を全て使って判別分析 を行なった。判別空間を図8.11に示す。ある解像度の画像から抽 出した特徴だけを使う場合に比べて、各クラスがずっとまとまっている様子がわかる。 この場合の、判別力$\eta$は 1.917 であり、leave-one-out 法による識別率の推定値 は 100% であった。

最後に、ビデオインターフェースを持った汎用ワークステーション(SUN SparcStation)による実時間顔画像識別実験を行なった。統計的特徴抽出には最小2 乗線形判別を用いた。これにより、学習および識別のために必要な計算時間がかなり 短縮される。カメラからの画像の取り込みと画像の表示の時間を含めて、$1$ 秒間に $2$ 枚以上の画像に対する学習および識別が可能である。

まず、男性5人女性5人の合計10人の顔をビデオカメラで撮影し、ビデオテープに録 画した。ビデオで再生された画像をビデオインターフェースを通して計算機に取り込 み高次自己相関特徴を計算した。約1000枚の画像を学習サンプルとして、最小2乗線 形判別写像を構成した。同様にして、新たに約1000枚の画像をテストサンプルとして、 識別率を計算した。この場合の識別率は 99.4% であった。また、同様に、合計 50人の顔画像(学習サ ンプルおよびテストサンプルは約2500枚)に対して実験を行った結果、識別率は約 92.2% であった。



Takio Kurita 平成14年7月3日