next up previous
次へ: 印象語からの絵画データベースの検索 上へ: 正準相関分析 戻る: 正準相関分析

正順相関分析と新変量の統計量

今、$p$ 個の変量を含む計測ベクトル $\mbox{\boldmath$x$} = (x_1,\ldots,x_p)^T$$q$ 個の変量を含む計測ベクトル $\mbox{\boldmath$y$} = (y_1,\ldots,y_q)^T$ があると する。正準相関分析では、学習用のデータ集合 $\{(\mbox{\boldmath$x$}_i,\mbox{\boldmath$y$}_i)\}_{i=1}^N$ に対して、線形変換

$\displaystyle \mbox{\boldmath$s$}_i$ $\textstyle =$ $\displaystyle A^T (\mbox{\boldmath$x$}_i - \bar{\mbox{\boldmath$x$}})
= A^T \tilde{\mbox{\boldmath$x$}_i}$  
$\displaystyle \mbox{\boldmath$t$}_i$ $\textstyle =$ $\displaystyle B^T (\mbox{\boldmath$y$}_i - \bar{\mbox{\boldmath$y$}})
= B^T \tilde{\mbox{\boldmath$y$}_i}$ (63)

で写された2つの新変量群間の相関行列のトレースの絶対値が最大となるよう な係数行列 $A$ および $B$ を求める。最適な係数行列は固有値問題
\begin{displaymath}
\Sigma_{XY} \Sigma_Y^{-1} \Sigma_{YX} A = \Sigma_X A \Lambda^2 \ \ \ (A^T \Sigma_X A = I_L)
\end{displaymath} (64)

あるいは、
\begin{displaymath}
\Sigma_{YX} \Sigma_X^{-1} \Sigma_{XY} B = \Sigma_Y B \Lambda^2 \ \ \ (B^T \Sigma_Y B = I_L)
\end{displaymath} (65)

の解として求まる。ただし、$\Lambda^2$ は、固有値を対角要素とする対角行 列であり、
$\displaystyle \Sigma_X$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$x$}_i - \bar{\mbox{\boldmath$x$}}) (\mbox{\boldmath$x$}_i - \bar{\mbox{\boldmath$x$}})^T$  
$\displaystyle \Sigma_Y$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$y$}_i -
\bar{\mbox{\boldmath$y$}})(\mbox{\boldmath$y$}_i - \bar{\mbox{\boldmath$y$}})^T$  
$\displaystyle \Sigma_{XY}$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$x$}_i -
\bar{\mbox{\boldmath$x$}})(\mbox{\boldmath$y$}_i - \bar{\mbox{\boldmath$y$}})^T$  
$\displaystyle \Sigma_{YX}$ $\textstyle =$ $\displaystyle \Sigma_{XY}^T$ (66)

である。このとき、係数行列 $A$$B$ の間には、
\begin{displaymath}
\Sigma_{XY} B = \Sigma_X A \Lambda, \hspace*{10mm} \Sigma_{YX} A = \Sigma_Y B \Lambda
\end{displaymath} (67)

という関係が成り立つ。また、$L$ は、正準主成分 $\mbox{\boldmath$s$}_i$ および $\mbox{\boldmath$t$}_i$ の次元で、係数行列として固有値の大きいものから順に $L$ 個取 られる。

このとき、変量 $\mbox{\boldmath$s$}$ および $\mbox{\boldmath$t$}$ の統計量は、

$\displaystyle \bar{\mbox{\boldmath$s$}}$ $\textstyle =$ $\displaystyle \mbox{\boldmath$0$}$  
$\displaystyle \bar{\mbox{\boldmath$t$}}$ $\textstyle =$ $\displaystyle \mbox{\boldmath$0$}$  
$\displaystyle \Sigma_S$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$s$}_i -
\bar{\mbox{\bol...
...}})(\mbox{\boldmath$s$}_i - \bar{\mbox{\boldmath$s$}})^T = A^T \Sigma_X A = I_L$  
$\displaystyle \Sigma_T$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$t$}_i -
\bar{\mbox{\bol...
...}})(\mbox{\boldmath$t$}_i - \bar{\mbox{\boldmath$t$}})^T = B^T \Sigma_Y B = I_L$  
$\displaystyle \Sigma_{ST}$ $\textstyle =$ $\displaystyle \frac{1}{N} \sum_{i=1}^N (\mbox{\boldmath$s$}_i -
\bar{\mbox{\bol...
...ox{\boldmath$t$}_i - \bar{\mbox{\boldmath$t$}})^T = A^T \Sigma_{XY} B =
\Lambda$  
$\displaystyle \Sigma_{TS}$ $\textstyle =$ $\displaystyle \Sigma_{ST}^T = \Lambda$ (68)

となる。したがって、新しい変量 $\mbox{\boldmath$s$}$ から $\mbox{\boldmath$t$}$ へ、あるいは $\mbox{\boldmath$t$}$ から $\mbox{\boldmath$s$}$ への線形回帰式は、
\begin{displaymath}
\tilde{\mbox{\boldmath$t$}} = \Lambda \mbox{\boldmath$s$}, ...
...0mm} \tilde{\mbox{\boldmath$s$}} = \Lambda \mbox{\boldmath$t$}
\end{displaymath} (69)

で与えられる。



Subsections
next up previous
次へ: 印象語からの絵画データベースの検索 上へ: 正準相関分析 戻る: 正準相関分析
平成14年7月19日