パターン認識を実現するためには、まず、認識対象から何らかの特徴量を計測
(抽出)する必要がある。一般には、特徴量は1種類だけではなく、複数の特徴
量を計測し、それらを同時に用いることが多い。そのような特徴量は、通常、ま
とめて特徴ベクトル
として表される。ここで、
は、ベクトル
の転置を表す。また、
は、特徴量の個数で
ある。認識対象のクラスの総数を
とし、各クラスを
と表す
ことにする。パターン認識における最も基本的な課題は、未知の認識対象を計測
して得られた特徴ベクトルからその対象がどのクラスに属するかを判定する識別
器を開発することである。そのためには、クラスの帰属が既知の訓練用のサンプ
ル集合から特徴ベクトルとクラスとの確率的な対応関係を知識として学習するこ
とが必要である。未知の認識対象の識別には、学習された確率的知識を利用して
それがどのクラスに属していたかを推定(決定)する方式を指定しなければなら
ない。その際、間違って識別する確率をできるだけ小さくすることが望ましい。
特徴ベクトルとクラスとの確率的な対応関係が完全にわかっている理想的な場合
には、理論的に最適な識別方式(ベイズ識別方式)が存在する。しかし、実際の
パターン認識問題では、特徴ベクトルとクラスとの確率的な対応関係が完全にわ
かっていることは稀で、そのような確率的な関係を訓練データから学習する必要
がある。