顔画像の認識

以上の実験は２値画像を対象としたものであったが、次に、濃淡画像（顔画像）を対象とした認識実験を行った。

**図 8.8:** 顔画像の例
$\begin{figure}\begin{center} \psfig{file=k01.eps,width=5cm}\psfig{file=k04.eps,w... ....eps,width=5cm}\vspace{0.5cm} \\ (c) \vspace{0.5cm} \end{center}\end{figure}$

まず、線形判別分析を用いた顔画像の認識実験を行なった。３人の顔をビデオカメラで撮影し、それぞれ２０枚の顔画像を画像データとして計算機に取り込んだ。各画像は $300 \times 200$ ピクセルの解像度である。図8.8 (a) から (c) に画像データの例を示す。

**図 8.9:** 判別分析により得られた判別空間
$\begin{figure}\begin{center} \psfig{file=images/fig-8.9.eps,width=100mm}\end{center}\end{figure}$

各画像から高次局所自己相関特徴を計算し、線形判別分析を行なった。この場合には、判別するクラス数が

であることから、判別空間の次元は高々

次元である。図8.9に判別分析で得られた特徴空間を示す。ここで、図の番号は、それぞれ (a), (b), (c) の顔に対応している。ほぼクラスごとにまとまっている様子がわかる。この判別空間の判別力 $\eta = \mbox{tr}(\tilde{\Sigma}_T^{-1}\tilde{\Sigma}_W)$ は1.143 であった。ただし、 $\tilde{\Sigma}_T$ および $\tilde{\Sigma}_W$ は、それぞれ判別空間での全分散共分散行列およびクラス内分散共分散行列である。

この判別空間で各画像を最も近い平均ベクトルを持つクラスに識別すると、 100% 正しく識別された。未知データに対する認識率を leave-one-out 法を用いて推定すると、その識別率は 95% であった。

**図 8.10:** 解像度の違いによる判別空間の変化
$\begin{figure}\begin{center} \psfig{file=images/fig-8.10.eps,width=100mm}\end{center}\end{figure}$

次に、画像の解像度の影響を調べるため解像度をいろいろ変えて認識実験を試みた。もとの画像から画像ピラミッドを構成し、画像ピラミッド中の解像度の異なる各画像から計算した高次局所自己相関特徴を抽出し、線形判別分析を行なった。各解像度の画像に対する判別空間を図8.10 (a) から (f) に示す。また、各解像度の画像に対する判別力および leave-one-out 法で推定した識別率を表 8.1に示す。画像の解像度により判別力および識別率が変化している様子がわかる。

**表 8.1:** 解像度と判別力および認識率の関係
解像度		$\frac{1}{2}$	$\frac{1}{4}$	$\frac{1}{8}$	$\frac{1}{16}$	$\frac{1}{16}$	$\frac{1}{64}$
判別力 $\eta$	1.14	1.46	1.40	1.29	1.29	0.84	0.67
認識率 $R (\%)$	95	100	98	98	98	98	100

**図 8.11:** 画像ピラミッド中の異なる解像度の画像から抽出した特徴を全て使って構成した判別空間
$\begin{figure}\begin{center} \psfig{file=images/fig-8.11.eps,width=100mm} \end{center}\end{figure}$

次に画像ピラミッド中の異なる解像度の画像から抽出した特徴を全て使って判別分析を行なった。判別空間を図8.11に示す。ある解像度の画像から抽出した特徴だけを使う場合に比べて、各クラスがずっとまとまっている様子がわかる。この場合の、判別力 $\eta$ は 1.917 であり、leave-one-out 法による識別率の推定値は 100% であった。

最後に、ビデオインターフェースを持った汎用ワークステーション（SUN SparcStation)による実時間顔画像識別実験を行なった。統計的特徴抽出には最小２乗線形判別を用いた。これにより、学習および識別のために必要な計算時間がかなり短縮される。カメラからの画像の取り込みと画像の表示の時間を含めて、

秒間に

枚以上の画像に対する学習および識別が可能である。

まず、男性5人女性5人の合計10人の顔をビデオカメラで撮影し、ビデオテープに録画した。ビデオで再生された画像をビデオインターフェースを通して計算機に取り込み高次自己相関特徴を計算した。約1000枚の画像を学習サンプルとして、最小２乗線形判別写像を構成した。同様にして、新たに約1000枚の画像をテストサンプルとして、識別率を計算した。この場合の識別率は 99.4% であった。また、同様に、合計 50人の顔画像（学習サンプルおよびテストサンプルは約2500枚）に対して実験を行った結果、識別率は約 92.2% であった。