顔画像の認識でまず考えられるのは、目・鼻・口などの顔を構成する部品の形 状やそれらの配置の個人差に着目し、これらから特徴点を抽出して認識に利用 する方法である。しかし、顔画像からこれらの部品を精度よく抽出することは かなり難しい。また、各部品がうまく抽出できたとしても、類似した形状の差 を認識に利用することはそれほど容易ではない。そこで、このような顔に特有 の知識を用いるのではなく、顔画像そのものをパターンとして扱い、統計的パ ターン認識手法を適用する方向の研究が活発に行われている。
最も簡単なパターン認識手法は、パターン間のマッチングに基づく方法である が、画像そのものをパターンとして扱った場合には、パターンの次元が膨大に なってしまう。そのため、パターンを情報圧縮した後でマッチングを行う方法 がいくつか提案されている。パターンを情報圧縮すれば、入力条件の変動に対 して頑健な認識結果が得られると期待できる。Turk等 [77,78]が提案した固有顔(eigenface)による方法では、主 成分分析によりパターンを情報圧縮し、顔画像の識別に利用している。手法の 単純さと固有顔という名前の付け方の上手さから、顔画像の認識において最も 有名な手法のひとつとなっている。
今、 枚の学習用の顔画像のうちの 番目の画像を、各画素の値をなら べた 次元のベクトル として表現する。また、 枚の画像 の平均ベクトルを とし、 各画像から平均ベクトルを引いたベクトルを で表し、各画像から平均ベクトルを引いた画像の集合を行列 で表す。
学習用の画像集合を平均2乗誤差の意味で最適に近似する正規直交基底
は、主成分分析を用いて構成することができる。このとき、 の各固有ベク
トル
を、固有顔(eigenface)と呼んでいる。また、ある画像
に対する主成分スコア
の各成分は、画像
を表
現するための各固有顔の貢献度を表していると解釈できる。固有ベクトルの次
元 を小さくすることにより、固有顔 とスコア
を用いて、
もとの画像を
(44) |
また、2枚の画像
と
が与えれた場合、各画像の主成
分スコア間の距離は、
(45) |
Kirby等[30]は、100枚の顔画像に対して主成分分析を行い固有空間 の次元を50次まで取れば 95% 以上の情報が復元できることを示している。ま た、Turk等[77,78]は、16人の被験者から撮影した2500枚 の顔画像のデータベースを用いた認識実験を行い、向きや大きさが一定なら 96%の認識率を得ている。Pentland等[55]は、3000人から取っ た7562枚の顔画像のデータベースを用い、128枚の代表的な顔画像から主成分 分析により構成した20次元の固有空間を用いた識別で、95%の認識率を得てい る。さらに、目・鼻・口などの部品に対しても固有空間を構成し、それらと顔 全体の固有空間を組み合わせてた認識により、98% の認識率を得ている。