これまで紹介した主成分分析、判別分析、サポートベクターマシン、ロジスティッ ク回帰は、全て線形あるいは準線形の手法である。したがって、本質的に非線形で複雑な識別課 題に対しては、必ずしも良い性能の識別器を構成できるとは限らない。本質的に 非線形な問題に対応するための方法として、特徴ベクトルを非線形変換して、そ の空間で線形の識別を行う「カーネルトリック」と呼ばれている方法が知られて いる。この方法を用いることでサポートベクターマシンの性能が飛躍的に向上し た。それがサポートベクターマシンを有名にした大きな要因である。
一般に、線形分離可能性はサンプル数が大きくなればなるほど難しくなり、逆に、 特徴空間ベクトルの次元が大きくなるほど易しくなる。例えば、特徴ベクトルの 次元が訓練サンプルの数よりも大きいなら、どんなラベル付けに対しても線形分 離可能である。しかし、高次元への写像を行うと、次元の増加に伴い汎化能力が 落ちてしまう。また、難しい問題を線形分離可能にするためには、訓練サンプル と同程度の大きな次元に写像しなければならないので、結果的に膨大な計算量が 必要となってしまう。
今、元の特徴ベクトル
を非線形の写像
によって変換し、
その空間で線形識別を行うことを考えてみよう。例えば、写像として、入
力特徴を2次の多項式に変換する写像を用いるとすると、写像した先で線形識別
を行うことは、元の空間で2次の識別関数を構成することに対応する。一般には、
こうした非線形の写像によって変換した特徴空間の次元は非常に大きくなりがち
である。しかし、主成分分析、判別分析、サポートベクターマシン等では、幸い
にも、目的関数や識別関数が入力パターンの内積のみに依存した形になっており、
内積が計算できれば最適な識別関数を構成することができる。つまり、もし非線
形に写像した空間での二つの要素
と
の内積が
(61) |
実用的には、は計算が容易なものが望ましい。例えば、多項式カーネル
(62) |
(63) |
(64) |