濃淡画像を対象領域と背景に分離する2値化は、画像処理あるいはパターン認 識の最も基本的な手続きの一つである。
濃淡画像の画素の集合を とし、各画素の濃淡値を とすると、し
きい値 による二値化は、各画素 が二つのクラス と の
どちらに属するかを
大津は、このようなしきい値選定の問題を教師なしの決定問題として捉え、判 別分析の立場から非常に簡単で、しかも汎用性をもった自動しきい値選定法 [49,50]を提案した。なお判別分析そのものは教師ありの (supervisedな)場合のノンパラメトリックな統計手法であるが、判別基準その ものは、教師なしの(unsupervisedな)場合へも有効に利用できる。
今、画像は 階調の輝度レベル
で表現されている
ものとする。レベル の輝度を持つ画素数を 、全画素数を
とすると、輝度の正規化ヒストグラムは、
今、 をしきい値として、区間
および
に属する画素をそれぞれ2クラス および
に分類するものとする。また、正規化
ヒストグラムに対して、次の二つの累計量
画像の輝度値をしきい値 により二つのクラスに分けたとき、クラスの
分離度がよければそのしきい値はよいしきい値であることが期待できる。そこ
で、しきい値 のよさを評価するために、判別基準