next up previous
次へ: 距離について 上へ: 交差係数行列の固有値問題 戻る: 交差係数行列の固有値問題

数量化4類との関係

数量化4類は、対人関係の定量的表現法の研究から林により考案された多変量データ 解析手法である。データとして個体 $i$ と個体 $j$ の類似性の測度 $e_{ij}$ が与 えられた場合、似ているもの同士が近づき、似ていないもの同士が離れるように各個 体に数量を与え、その数量を用いて各個体をなるべく少ない次元のユークリッド空間 内の点として表すための手法である[47]。

集合 $\Omega$ の要素 $\omega_i$$\omega_j$ の類似性の測度として

\begin{displaymath}
e_{ij} = \gamma(\omega_i \wedge \omega_j) \ \ \ \ (i,j=1,\ldots,M).
\end{displaymath} (93)

を採用し、これに対して数量化4類を適用することを考える。

$\gamma$ の定義から、この測度は対称性

\begin{displaymath}
e_{ij} = e_{ji}
\end{displaymath} (94)

を持つことがわかる。

この時、数量化4類は、平均と分散に関する制約条件

$\displaystyle \bar{x}$ $\textstyle =$ $\displaystyle \sum_{i=1}^M p(\omega_i) x_i = 0$ (95)
$\displaystyle \sigma_X^2$ $\textstyle =$ $\displaystyle \sum_{i=1}^M p(\omega_i) x_i^2 = \mbox{一定}$ (96)

のもとで、評価基準
\begin{displaymath}
Q(\mbox{\boldmath$x$}) = - \sum_{i=1}^M \sum_{j=1}^M e_{ij}...
...$} + 2 \mbox{\boldmath$x$}^T \Gamma_\Omega \mbox{\boldmath$x$}
\end{displaymath} (97)

を最大とするような数量 $\{x_i\}$ を求める問題として定式化される。 評価基準 $Q$ を最大とする $\mbox{\boldmath$x$}$ は、$\eta$ をLagrange乗数として、
\begin{displaymath}
J(\mbox{\boldmath$x$})=2 \mbox{\boldmath$x$}^T P_\Omega \mb...
...x$}
- \eta \mbox{\boldmath$x$}^T P_\Omega \mbox{\boldmath$x$}
\end{displaymath} (98)

を最小とすることにより求められる。これを $\mbox{\boldmath$x$}$ で偏微分して $0$ とおくと、
\begin{displaymath}
4 P_\Omega \mbox{\boldmath$x$} - 4 \Gamma_\Omega \mbox{\boldmath$x$} - 2 \eta P_\Omega \mbox{\boldmath$x$} = 0.
\end{displaymath} (99)

となる。これを整理すると交差係数行列 $S_\Omega$ に関する固有値問題
\begin{displaymath}
S_\Omega^T \mbox{\boldmath$x$} = (1 - \frac{\eta}{2}) \mbox{\boldmath$x$}
\end{displaymath} (100)

が得られる。この固有値問題の最大固有値 $1$ に対応する固有ベクトルは、制約条 件 (2.95) を満足しないので、2番目の固有値に対応する固有ベクトルが求 める $\mbox{\boldmath$x$}$ の解である。

数量 $\{ \mbox{\boldmath$x$}_i \}$$L$-次元まで求めるには、固有値問題

\begin{displaymath}[\Gamma -\mbox{\boldmath$p$}_\Omega \mbox{\boldmath$p$}_\Omega^T]X = P_\Omega X (I - H/2)
\end{displaymath} (101)

を解けばよい。ただし、
\begin{displaymath}
H = \mbox{diag}(\eta_1,\ldots,\eta_L) .
\end{displaymath} (102)

である。

この固有値問題は、まさに、非線形の数量化2類や数量化3類であらわれた固有値問 題と同じものである。従って、非線形の数量化2類や数量化3類で得られる数量 $\{ \mbox{\boldmath$x$}_i \}$ は、二つの集合 $\Omega$$\Theta$ の確率的な関係を表す統 計量 $\{ \gamma(\omega_i \wedge \omega_j) \}$ を類似性の測度とする数量化4類 によって得られる数量と同じであると言える。

同様に、もし類似性の測度を統計量 $\{ \gamma(\theta_i \wedge \theta_j) \}$ と して数量化4類を考えると、数量 $\{ \mbox{\boldmath$y$}_j \}$

\begin{displaymath}[\Gamma_\Theta - \mbox{\boldmath$p$}_\Theta \mbox{\boldmath$p$}_\Theta^T]Y = P_\Theta Y (I - H/2) .
\end{displaymath} (103)

の解となる。


next up previous
次へ: 距離について 上へ: 交差係数行列の固有値問題 戻る: 交差係数行列の固有値問題
Takio Kurita 平成14年7月3日