next up previous
次へ: 高次局所自己相関特徴と判別分析を用いた顔画像認識 上へ: 判別分析と判別基準 戻る: 判別分析と判別基準

判別基準に基づく画像の二値化

濃淡画像を対象領域と背景に分離する2値化は、画像処理あるいはパターン認 識の最も基本的な手続きの一つである。

濃淡画像の画素の集合を $\{x\}$ とし、各画素の濃淡値を $g$ とすると、し きい値 $k$ による二値化は、各画素 $x$ が二つのクラス $C_1$$C_2$ の どちらに属するかを

\begin{displaymath}
g(x) \le k \rightarrow x \in C_1,\ \ \ \
g(x) > k \rightarrow x \in C_2
\end{displaymath} (51)

のように決定する手続きである。ここで、$C_1$ および $C_2$は、それぞれ背 景と対象領域である。対象を背景から正確に分離するためには、適切なしきい 値を選ぶ必要がある。

大津は、このようなしきい値選定の問題を教師なしの決定問題として捉え、判 別分析の立場から非常に簡単で、しかも汎用性をもった自動しきい値選定法 [49,50]を提案した。なお判別分析そのものは教師ありの (supervisedな)場合のノンパラメトリックな統計手法であるが、判別基準その ものは、教師なしの(unsupervisedな)場合へも有効に利用できる。

今、画像は $L$ 階調の輝度レベル $S=\{1,2,\cdots,L\}$ で表現されている ものとする。レベル $i$ の輝度を持つ画素数を $n_i$、全画素数を $N=n_1+n_2+\cdots+n_L$ とすると、輝度の正規化ヒストグラムは、

\begin{displaymath}
p_i = \frac{n_i}{N} \hspace*{1cm} \Bigl(i \in S,\ p_i \ge 0,\ \sum_{i=1}^L p_i = 1\Bigr)
\end{displaymath} (52)

で与えられる。このとき、画像の平均輝度レベルおよび分散は、それぞれ
$\displaystyle \mu_T$ $\textstyle =$ $\displaystyle \sum_{i=1}^L i p_i$  
$\displaystyle \sigma_T^2$ $\textstyle =$ $\displaystyle \sum_{i=1}^L (i - \mu_T)^2 p_i$ (53)

で与えられる。

今、$k$ をしきい値として、区間 $S_1=[1,\cdots,k]$ および $S_2=[k+1,\cdots,L]$ に属する画素をそれぞれ2クラス $C_1$ および $C_2$ に分類するものとする。また、正規化 ヒストグラムに対して、次の二つの累計量

$\displaystyle \omega(k)$ $\textstyle =$ $\displaystyle \sum_{i=1}^k p_i \hspace*{1cm} (\omega(L)=1)$  
$\displaystyle \mu(k)$ $\textstyle =$ $\displaystyle \sum_{i=1}^k i p_i \hspace*{1cm} (\mu(L) = \mu_T)$ (54)

を定義しておく。このとき、$k$ をしきい値としたときの各クラスの生起確率 は、この累計量を用いて、
$\displaystyle \omega_1$ $\textstyle =$ $\displaystyle \sum_{i \in S_1} p_i = \omega(k)$  
$\displaystyle \omega_2$ $\textstyle =$ $\displaystyle \sum_{i \in S_2} p_i = 1 - \omega(k)$ (55)

で与えられる。また、各クラスの平均輝度は
$\displaystyle \mu_1$ $\textstyle =$ $\displaystyle \frac{\mu(k)}{\omega(k)}$  
$\displaystyle \mu_2$ $\textstyle =$ $\displaystyle \frac{\mu_T - \mu(k)}{1 - \omega(k)}$ (56)

で与えられる。これらの量の間には、しきい値 $k$ によらず常に、
\begin{displaymath}
\omega_1 \mu_1 + \omega_2 \mu_2 = \mu_T, \hspace*{10mm}
\omega_1 + \omega_2 = 1
\end{displaymath} (57)

のような関係が成立する。また、各クラスの輝度値の分散は、
$\displaystyle \sigma_1^2$ $\textstyle =$ $\displaystyle \sum_{i \in S_1} \frac{(i-\mu_1)^2 p_i}{\omega_1}$  
$\displaystyle \sigma_2^2$ $\textstyle =$ $\displaystyle \sum_{i \in S_2} \frac{(i-\mu_2)^2 p_i}{\omega_2}$ (58)

で与えられる。

画像の輝度値をしきい値 $k$ により二つのクラスに分けたとき、クラスの 分離度がよければそのしきい値はよいしきい値であることが期待できる。そこ で、しきい値 $k$ のよさを評価するために、判別基準

\begin{displaymath}
\lambda=\frac{\sigma_B^2}{\sigma_W^2},\ \ \ \
\kappa=\fra...
..._T^2}{\sigma_W^2},\ \ \ \
\eta=\frac{\sigma_B^2}{\sigma_T^2}
\end{displaymath} (59)

を用いる。ここで、
$\displaystyle \sigma_W^2$ $\textstyle =$ $\displaystyle \omega_1 \sigma_1^2 + \omega_2 \sigma_2^2$ (60)
$\displaystyle \sigma_B^2$ $\textstyle =$ $\displaystyle \omega_1\omega_2(\mu_1-\mu_2)^2$ (61)

は、それぞれ、クラス内分散およびクラス間分散である。クラス内分散、クラ ス間分散、および全分散の間には、
\begin{displaymath}
\sigma_W^2+\sigma_B^2=\sigma_T^2
\end{displaymath} (62)

の基本的関係が常に成立する。3種類の判別基準 $\lambda$$\kappa$、およ び $\eta$ は、すべて同値となるが、$\eta$ は、1次の統計量のみから計算で きるので、最適なしきい値 $k$ を探索するには最も簡単な評価基準となる。 これは、$\sigma_B^2$ を最大とする $k$ を最適しきい値とすることと同値と なる。


next up previous
次へ: 高次局所自己相関特徴と判別分析を用いた顔画像認識 上へ: 判別分析と判別基準 戻る: 判別分析と判別基準
平成14年7月19日