次へ: 非線形の数量化2類と数量化3類の関係
上へ: 数量化法の非線形への拡張
戻る: 数量化1類とその非線形への拡張
数量化2類は、仮釈放の予測の問題を通して林によって考え出された多変量データ解
析手法である。受刑者は、その刑期の3分の1を過ぎた時点で、社会復帰しても問題
無いと判断された場合に仮釈放される。仮釈放された受刑者を追跡調査すると、社会
復帰しているグループと再び犯罪を犯したグループに分けることができる。数量化2
類は、受刑者の両親の状態、犯罪の種類、犯罪心理、社会に対する態度などの情報か
ら仮釈放すべきかどうかを決める問題に使われた[47]。つまり、数量
化2類は、質的データに基づく判別分析であると考えることができる。ここでは、ま
ず、通常の線形の数量化2類を概観し、次にそれを非線形に拡張する。
今、質的データとして与えられる説明変数を
とし、
個のクラスを
とする。ここで、各
に対応する事象を
とする。また、クラス
の先
験確率を
、ベクトル
の生起確率を
とし、
それらの条件付き確率を
および
とする。
この時、数量化2類では、各
を低次元のしかも
個のクラス間の分
離を平均的に最大限強調するような新しい変量
に写すような線
形判別写像
 |
(42) |
が構成される。
数量化2類や判別分析で用いられる判別写像のよさを評価する基準(判別基準)は、
 |
(43) |
で与えられる。ここで、
および
は、それぞれ、
判別空間
での全分散共分散行列および平均クラス間共分散行列であり、
のように定義される。ただし、
である。
判別基準
を最大とする係数行列
は、Lagrange 乗数行列を
として、
![\begin{displaymath}
Q(A) = \mbox{tr}(\hat{\Sigma}_B) - \mbox{tr}[(\hat{\Sigma}_T-I)\Lambda] .
\end{displaymath}](img174.png) |
(47) |
を最大とすることにより求められる。これを、
で偏微分し
とおくと、
 |
(48) |
となり、結局、この固有値問題を解くことにより最適な係数
が求まる。
次に、線形写像の制約を取り除いて数量化2類を一般の非線形写像を許すように拡張
する。これは、大津が求めた非線形の判別分析
[121,122,123,128]の特殊な場合になっている。非線形の数量化2
類は、判別基準 (2.43) を最大とするような非線形の写像
を求める問題として定式化できる。ここでも、写像
は一般
の非線形写像であるから、各
に対して、独立に最適な値
を
求めればよい。従って、判別基準は、
の関数として、
 |
(49) |
と書ける。
判別基準
を最大とするためには、Lagrange 乗数行列を
として、
![\begin{displaymath}
Q(\mbox{\boldmath$x$}_1,\ldots,\mbox{\boldmath$x$}_M) = \mb...
...}(\hat{\Sigma}_B) - \mbox{tr}[(\hat{\Sigma}_T - I_L)\Lambda] .
\end{displaymath}](img178.png) |
(50) |
を最大とする
を求めればよい。
の
に関する偏微分を求
めると、
 |
(51) |
となる。Bayes の公式
 |
(52) |
を用いると、上式は、
 |
(53) |
となる。ここで、右辺の第2項は、定数ベクトルである。定数ベクトルは、判別には
影響しないので、
に関して、条件
 |
(54) |
を考えることにする。
簡単化のため
を
で正規化したベクト
ルを、
 |
(55) |
とする。ここで、
である。この正規
化ベクトルを用いると、式 (2.53) は、
 |
(56) |
となる。つまり、最適な
は 条件付確率
を重
みとする
の線形結合で与えられる。
式 (2.56) から
の 平均ベクトル
は、
と書ける。ただし、
![\begin{displaymath}
Y = \left[
\begin{array}{c} \mbox{\boldmath$y$}_1^T \\ \vdots \\ \mbox{\boldmath$y$}_N^T \end{array} \right]
\end{displaymath}](img193.png) |
(58) |
である。
平均ベクトル
に関する条件 (2.54) から、
行列
は、条件
 |
(59) |
を満足しなければならない。
一方、式 (2.55) および (2.56) から、各
は、
を満足しなければならない。これは、行列
が交差係数行列
の
固有方程式
 |
(61) |
の解でなければならないことを示している。ただし、行列
は対角では
ないので、式 (2.16) に示した
と
の関
係を用いて変形すると、式 (2.61) は、
 |
(62) |
となる。ここで、付録 A.1. に示すように、この固有値問題の最大固有値は、常に
であり、対応する固有ベクトルは、
である。
従って、この固有ベクトルは、式 (2.59) の条件を満足しない。しかし、
それ以外の残りの固有ベクトルはこの条件を満足する(付録 A.2. 参照)。式
(2.62) から最大固有値に対応する固有ベクトルを取り除くと、
![\begin{displaymath}[\Gamma_{\Theta} - \mbox{\boldmath$p$}_{\Theta} \mbox{\boldmath$p$}_{\Theta}^T ]Y = P_{\Theta} Y \Lambda
.
\end{displaymath}](img202.png) |
(63) |
となる(付録 A.3. 参照)。
以上をまとめると、非線形の数量化2類の非線形判別写像は、
で与えられる。ただし、
![\begin{displaymath}[\Gamma_{\Theta} - \mbox{\boldmath$p$}_{\Theta} \mbox{\boldmath$p$}_{\Theta}^T ]Y = P_{\Theta} Y \Lambda
.
\end{displaymath}](img202.png) |
(65) |
である。また、
に関する正規化条件は、
 |
(66) |
とする。この時、
に関して、関係
 |
(67) |
が成り立つ。ここでも、最適な非線形判別写像は、もとの質的データの表現
に依存しないで、データの背後にある確率構造のみに依存して決まって
いる。これに対して、線形の数量化2類では、線形変換の制約のためにもとの
質的データをどのように表現するかに依存した線形判別写像が構成される。
次へ: 非線形の数量化2類と数量化3類の関係
上へ: 数量化法の非線形への拡張
戻る: 数量化1類とその非線形への拡張
Takio Kurita
平成14年7月3日