これまで、数量化1類および数量化2類を非線形に拡張し、最適な非線形写像を求め た。ここでは、これらの結果と数量化3類との関係について考察する。
数量化3類は、缶詰のレッテルの好みを調べる官能検査の結果を解析するために林に より開発された多変量データ解析手法である。官能検査では、何人かの女性被験者に 何枚かの缶詰のレッテルを見せて、好きなものに印を付けてもらった [47]。各被験者と各レッテルに数量を与え、どの被験者群がどのレッッ テル群を好むかを明らかにすることが解析の目的である。すなわち、数量化3類は、 表 2.1 のような相伴表あるいは2次元のクロス表が与えられた時、二つの集合間の 該当関係から、二つの集合間の関係を最も良く反映するように集合の各要素に数値を 与える手法である。
通常、データ は、印のある/なしにより、
あるいは
として与え
られるが、ここでは、これを一般化して、
は頻度を表す整数とする。この
とき、集合
と
の間の同時確率
は、与えられた相伴表から
![]() |
(68) |
数量化3類では、集合 の各要素
に与える数値
と集合
の各要素
に与える数値
を、それらの間の相関係数
![]() |
![]() |
![]() |
(70) |
![]() |
![]() |
![]() |
(71) |
![]() |
![]() |
![]() |
(72) |
式 (2.69) を
および
に関して偏微分して
とおく
と、
![]() |
![]() |
![]() |
(75) |
![]() |
![]() |
![]() |
(76) |
![]() |
![]() |
![]() |
(77) |
![]() |
![]() |
![]() |
(78) |
![]() |
![]() |
![]() |
(79) |
![]() |
![]() |
![]() |
(80) |
この時、
および
の定義から、
これらのベクトルは、条件
以上の議論では、各要素に与えられる数値 および
は
次元としたが、 固有方程式
![]() |
![]() |
![]() |
(87) |
![]() |
![]() |
![]() |
(88) |
![]() |
![]() |
![]() |
(89) |
![]() |
![]() |
![]() |
(90) |
スコア および
の正規化条件は、普通、
![]() |
![]() |
![]() |
(91) |
![]() |
![]() |
![]() |
(92) |
次に非線形の数量化1類および非線形の数量化2類と数量化3類との関係について考
察する。非線形の数量化1類の最適な非線形写像は、説明変数
のもとで
の従属変数
の条件付き平均値であった。また、非線形の数量化2類の最適な
非線形判別写像は交差係数行列
の固有値問題から得られるクラス代表
ベクトル
の Bayes 事後確率
を重み係数とす
る線形結合によって与えられた。従って、この非線形判別写像は、
を説
明変数とし、
を従属変数とする非線形の数量化
1類により得られる最適な非線形写像であるとみなすことができる。
一方、数量化3類のスコア
および
は、交差係
数行列の固有値問題の解として求まる。また、スコア
は、
の条件付き平均値であり、スコア
は、
の条件付き平均値でもある。
すなわち、非線形の数量化2類により得られる最適な非線形判別写像
と数量化3類のスコア
は、いずれも、交差係
数行列の固有値問題の解
の条件付き確率を重み係数とする線形結
合により与えられ、二つの集合間の確率的な構造のみから決まる。このことは、非線
形の数量化2類と数量化3類が二つの集合間の確率的な関係から情報を抽出する手法
として、全く同じものであることを意味する。また、数量化3類の
と
の双対性から、非線形の数量化2類の判別写像
は、直接、交差係数行列
の固有値問題を解くこと
によっても求まることがわかる。