next up previous
次へ: 大津および Kittler らのしきい値選定法 上へ: クラスタリングのアルゴリズム 戻る: はじめに

最大尤度しきい値選定法

濃淡画像を2値化し対象領域と背景に分離したり、対象をある特性に基づいて自動分 類するためには、1次元のデータに基づくクラスタリングが必要となる。1次元のデー タに基づくクラスタリングは、クラスタリング手法の中では最も簡単であるが、どう いう基準で分類すべきかは個々の問題に依存することが多く、全ての問題に適用でき るような完全な解法は存在しない。

濃淡画像の2値化は、パターン認識における最も基本的な手法のひとつであり、画像 を対象領域と背景に分離するために用いられる。画像から濃淡値のヒストグラムを作 成し、それからしきい値を決定することにより、画像を2つの領域に分類することが できる。これまでにも多くの2値化法が提案されている[150,177]。

大津は判別基準によりヒストグラムからしきい値を決定する方法を提案した [126,127]。この評価基準は、2値化して得られる画像ともとの画像の平 均2乗誤差の最小化とも等価である。また、この方法は、比較的簡単に多値化へ拡張 することが可能であり、大津はそのためのダイナミックプログラミングによるアルゴ リズムを提案している [127]。この方法は、多くの実画像に対してかなり良 いしきい値を与えるので、2値化のための標準的な手法として使われている。しかし、 この手法で得られるしきい値は、対象領域の濃淡値の分散と背景の濃淡値の分散が極 端に異なる場合や対象領域の画素数と背景の画素数が極端に異なる場合には、バイア スを持つことが指摘されている(例えば、[70])。

一方、Kittler らは、対象領域の濃淡値と背景の濃淡値がともに正規分布に従うとい う仮定のもとで平均誤識別率に関する基準を最小とするしきい値選定法を提案した [70]。この方法では、対象領域の濃淡値の分散と背景の濃淡値 の分散が極端に異なる場合や対象領域の画素数と背景の画素数が極端に異なる場合で も妥当なしきい値が選ばれることが示されている[70]。大津は、 Kittler らの基準が平均条件付きエントロピー(Equivovation)の最小化と等価であ ることを示した [137]。

ここでは、尤度を最大とするようなしきい値を選択する方法について考察する [105]。これにより、大津の方法と Kittler らの方法が同じ枠組で統一的 に考察できるようになる。まず、大津の方法が、対象領域の濃淡値と背景の濃淡値が 共通の分散を持つ正規分布に従うという仮定のもとで、条件付き分布に関する尤度を 最大化することと等価であることを示す。これは、大津の方法がなぜ対象領域の濃淡 値の分散と背景の濃淡値の分散が極端に異なるときバイアスを持つかの説明を与える ものと解釈できる。さらに、同じ仮定のもので、同時分布に関する尤度を最大化する することにより、大津の方法を対象領域の画素数と背景の画素数が極端に異なる場合 にも妥当なしきい値を選定するように改良する方法を提案する。一方、Kittler らの 基準は、異なる分散を持つ正規分布の仮定のもので同時分布に関する尤度を最大とす ることと等価であることを示す。さらに、Kittler らの基準による多値化のためのダ イナミックプログラミングを用いたアルゴリズムを示す。



Subsections

Takio Kurita 平成14年7月3日