next up previous
次へ: 主成分分析 上へ: 自己回帰モデル 戻る: ジェスチャー認識のためのPARCOR画像

形の計測(複素自己回帰モデル)

平面図形(2値画像)の認識は、パターン認識における最も基本的な課題の一つ である。「形(shape)」は、本来、パターンの相似変換に不変な概念であり、 形の本質的な情報を担う外形(輪郭線)を相似変換に不変な形で記述することは、 認識や分類のために重要である。関田等 [66,67,33,37]は、輪郭点の座標値を複素数 で表現し、輪郭点列を複素数値列とみなして複素自己回帰モデルを当てはめ、 相似変換に不変な特徴量を抽出する方法を提案し、平面図形の認識や分類に適 用した。

図 6: 輪郭列の複素数表現
\begin{figure}\begin{center}
\epsfile{file=carm-data.eps,width=3cm}
\end{center}\end{figure}

平面図形の輪郭線(平面曲線)を追跡して得られる点列を $(x_j,y_j)$ $(j=0,1,\ldots,N-1)$ とし、その複素表現を $z(j)=x_j+i y_j$ とする。 このとき、$m$ 次の複素自己回帰モデルは、実数値列に対する自己回帰モデ ルと同様に、

\begin{displaymath}
z(l) = \sum_{i=1}^{m} a^m(k) z(l-i) + \epsilon_f^m(l)
\end{displaymath} (29)

のように輪郭点 $m$ 個前までの輪郭点の線形結合で近似するモデルとし て定義される。ここで、複素自己回帰係数 $\{a^(k)\}_{k=1}^{m}$ は、やは り、平均2乗予測誤差が最小となるように決められる。

輪郭点列が複素表現されている場合、原点まわりの回転は各輪郭点を $e^{i\theta}$ 倍することに対応する。回転された輪郭点列 $\{e^{i\theta}z(j)\}_{j=0}^{N-1}$ に対して複素自己回帰モデルを当てはめ る場合には、(30)式の両辺が単に $e^{i\theta}$ 倍されるだけで、 複素自己回帰係数には影響が及ばない。従って、複素自己回帰係数は原点まわ りの回転に不変となる。また、複素自己回帰係数の計算は、輪郭を追跡する際 の始点位置の選び方にも依存しない。これらの性質は、形の記述、表現という 意味で好ましいものである。さらに、興味深い性質として輪郭線の追跡方向 (時計回りか反時計回り)を変えると、得られる複素自己回帰係数が複素共役と なる。複素PARCOR係数は、$m$次の複素自己回帰モデルの $m$ 次の複素自己回 帰係数 $a^m(m)$と等しいので、複素自己回帰係数について成立する性質は同 時に複素PARCOR係数でも成り立つ。

これをさらに、平行移動に不変にするためには、重心を原点にとり輪郭点列を 表現する方法や隣り合う輪郭点の差分に対して複素自己回帰モデルをあてはめ る方法が考えられる。また、大小伸縮に不変にするためには、輪郭の全周長を $N$ 等分する区間に分割し、各区間内のデータ点を平均値で代表させ、輪郭点 $z(j)$ とすればよい(図6)。大きさの違う輪郭点列は $\{\rho z(j)\}$ と表現されるので、これらも、式(30)の両辺で 打ち消しあい、結局、複素自己回帰係数は大小伸縮に対しても不変となる。

図 7: 相似変換に不変な形の自動分類
\begin{figure}\begin{center}
\epsfile{file=shape-clst.eps,width=7cm}
\end{center}\end{figure}

形の認識のための特徴としては、複素自己回帰係数や複素PARCOR係数などを用 いればよいが、形の自動分類のためには、形の間の距離を定義する必要がある。 複素自己回帰モデルを利用すると、輪郭点列(形)間の相似変換に不変な距離を 定義することができる[33,37]。図7 に、複素パワーケプストラムに基づく形状間の距離を用いて、木の葉を自動分 類した結果を示す。



平成14年7月19日