パターン認識(pattern recognition)は、認識対象がいくつかの概念に分類で きる時、観測されたパターンをそれらの概念のうちのひとつに対応させる処理 である。この概念をクラス(class)あるいは類(category)と呼ぶ。例えば、数 字の認識は、入力パターンを10種類の数字のいずれかに対応させることが目的 である。
パターンを認識する機械を実現するためには、まず、認識対象から何らかの特 徴量を計測(抽出)するための方法を考えなければならない。一般には、そのよ うな特徴量は1種類だけではなく、複数の特徴量を計測し、それらを同時に認 識に用いることが多い。例えば、文字認識の場合には、スキャナ等で取り込ん だ画像そのものを特徴とみなすこともあるが、文字の識別に必要な本質的な特 徴のみを抽出するのが一般的である。特徴量としては、例えば、文字線の傾き、 曲率、面積などが用いられたりする。そのような特徴量は、通常、まとめて特 徴ベクトル(feature vector) として表 される。ここで、 は、 の転置を表す。また、 は、特 徴量の個数である。一般に、特徴ベクトルによって張られる空間を特徴空間 (feature space)と呼ぶ。この場合、各パターンは、特徴空間上の1点として表 される。認識対象のクラスの総数を とし、各クラスを と表すことにする。もし、特徴ベクトルの選び方が適 切ならば、同じクラスの特徴ベクトルは互いに似ており、異なるクラスの特徴 ベクトルは互いに違っていると考えられるので、特徴空間上では、各クラスご とにまとまった塊となるはずである。このような塊をクラスタ(cluster)と呼 ぶ。
パターン認識における最も基本的な課題は、未知の認識対象を計測して得られ た特徴ベクトル からその対象がどのクラスに属するかを判定する識 別方法を開発することである。そのためには、まず、クラスの帰属が既知の学 習用のサンプル集合から特徴ベクトルとクラスとの確率的な対応関係を知識と して学習することが必要である。このような学習は、教師あり学習と呼ばれて いる。次に、学習された特徴ベクトルとクラスとの対応関係に関する確率的知 識を利用して、与えられた未知の認識対象の特徴からその認識対象がどのクラ スに属していたかを推定(決定)する方式が必要となる。その際、間違って識別 する確率(誤識別率)をできるだけ小さくすることが望ましい。このような識別 の問題は、認識対象に依存しないこともあって、パターン認識の初期において、 統計的決定理論(statistical decision theory)を援用したベイズ識別理論 [3]として理論的に研究され、様々な実際的な方式が考えられてい る。
特徴ベクトルとクラスとの確率的な対応関係が完全にわかっている理想的な場 合には、未知の認識対象を間違って他のクラスに識別する確率(誤識別率)をで きるだけ小さくするような理論的に最適な識別方式(ベイズ識別方式)が知ら れている。2章では、まず、その識別方式について概説する。し かし、実際の問題では、特徴ベクトルとクラスとの確率的な対応関係が完全わ かっていることは稀であり、実際にパターン認識装置を設計する場合には、そ のような確率的な関係をデータから推定(学習)する必要がある。 3章では、そのための確率密度分布の推定法について概説する。 このような推定法とベイズ識別方式とを組み合わせることにより、一応、実際 的なパターン認識器が実現できるようになる。
次に、4章では、近年、パターン認識にも盛んに利用されるよ うになったニューラルネットについて、特に、統計的パターン認識の観点から 述べる。