next up previous
次へ: しきい値選定実験 上へ: 最大尤度しきい値選定法 戻る: 複合分布モデル(Population Mixture Models)

最大尤度しきい値選定法

しきい値 $k$ によって各画素を2つのクラス $C_1$ および $C_2$ に分類すること を考える。パラメータ $\theta_i$ は、画素 $i$ の濃淡値 $g_i$ がこのしきい値 よりも大きいか小さいかによって決まるものとする。このとき、式 (3.16) ある いは (3.17) を最大とするようなパラメータ $\hat{\beta}_1,\hat{\beta}_2$ および $\hat{\pi}_1,\hat{\pi}_2$は最尤推定値と呼ばれている。最尤推定値を式 (3.16) あるいは (3.17) に代入した値は最大尤度と呼ばれており、それは しきい値の取り方によって変化する。最大尤度しきい値選定法では、最大尤度が最大 となるようなしきい値を選定する。

今、各クラスの分布が平均値は異なるが同じ分散を持つ正規分布であると仮定する。 つまり、クラス $C_j$ のもとでの $g$ の分布が

\begin{displaymath}
f(g\vert C_j) = \frac{1}{\sqrt{2\pi\sigma^2(k)}}
\exp(-\frac{(g-\mu_j(k))^2}{2\sigma^2(k)}) \ \ \ (j=1,2).
\end{displaymath} (171)

で与えられているとする。このとき、式 (3.16) の尤度は、
$\displaystyle L(G\vert\Theta;B(k))$ $\textstyle =$ $\displaystyle \prod_{i=1}^N \prod_{j=1}^2 [\frac{1}{\sqrt{2\pi\sigma^2(k)}}
\exp(-\frac{(g_i-\mu_j(k))^2}{2\sigma^2(k)})]^{\theta_{ji}}$  
  $\textstyle =$ $\displaystyle (2\pi\sigma^2(k))^{-\frac{N}{2}}
\exp\{-\frac{1}{2\sigma^2(k)}
\sum_{i=1}^N \sum_{j=1}^2 \theta_{ji} (g_i-\mu_j(k))^2 \},$ (172)

となる。ここで、$G$$\Theta$、および $B(k)$ は、それぞれ $g$ の集合、 $\theta$の集合、および パラメータ $\{\mu_1(k),\mu_2(k),\sigma(k)\}$ をあらわ す。上式の対数をとると、対数尤度は、
$\displaystyle l(G\vert\Theta;B(k))$ $\textstyle =$ $\displaystyle -\frac{N}{2}\log(2\pi)-\frac{N}{2}\log(\sigma^2(k))$  
    $\displaystyle -\frac{1}{2\sigma^2(k)}
[\sum_{i=1}^N \sum_{j=1}^N \theta_{ji} (g_i-\mu_j(k))^2]$ (173)

となる。このとき、対数尤度を最大とする最適なパラメータ $\hat{\mu}_1(k)$ $\hat{\mu}_2(k)$、および $\hat{\sigma}^2(k)$ は、
$\displaystyle \hat{\mu}_j(k)$ $\textstyle =$ $\displaystyle \bar{g}_j(k) \ \ \ (j=1,2)$ (174)
$\displaystyle \hat{\sigma}^2(k)$ $\textstyle =$ $\displaystyle \sigma_W^2(k)$ (175)

となる。従って、最大対数尤度は、
\begin{displaymath}
\hat{l}(G\vert\Theta;\hat{B}(k))=
-\frac{N}{2}\log(2\pi)
-\frac{N}{2}\log(\sigma_W^2(k))
-\frac{N}{2}
\end{displaymath} (176)

となる。定数項を無視すると、しきい値 $k$ に関してこの最大対数尤度を最大とす ることは、平均クラス内分散 $\sigma_W^2(k)$ を最小とすることと等価になる。す なわち、同一の分散を持つ正規分布の仮定のもとでの式 (3.16) の尤度を最大と するしきい値を選定する方法は大津のしきい値選定法と同じもとのなる。以下では、 この方法によって選ばれたしきい値を $T_O$ で表すことにする。

次に、同じ仮定のもとで式 (3.17) の同時分布の尤度を最大とするしきい値を求 めることを考えよう。この場合には、対数尤度は、

$\displaystyle l(G,\Theta;\Pi(k),B(k))$ $\textstyle =$ $\displaystyle \sum_{i=1}^N \sum_{j=1}^2 \theta_{ji} \log(\pi_j(k))
-\frac{N}{2}\log(2\pi)-\frac{N}{2}\log(\sigma^2(k))$  
    $\displaystyle -\frac{1}{2\sigma^2(k)}
[\sum_{i=1}^N \sum_{j=1}^N \theta_{ji} (g_i-\mu_j(k))^2]$ (177)

となる。ただし、$\Pi(k)$ は、パラメータ $\{\pi_1(k),\pi_2(k)\}$ をあらわす。最 適なパラメータ $\hat{\pi}_j(k)$ は、$\omega_j(k)$ となり、それ以外のパラメー タは上記の場合とおなじものになる。従って、最大対数尤度は、
$\displaystyle \hat{l}(G,\Theta;\hat{\Pi}(k),\hat{B}(k))$ $\textstyle =$ $\displaystyle N \sum_{j=1}^2 \omega_j(k) \log(\omega_j(k))
-\frac{N}{2}\log(2\pi)$  
    $\displaystyle -\frac{N}{2}\log(\sigma_W^2(k))
-\frac{N}{2}$ (178)

で与えられる。同様に、定数項を無視するとしきい値選択の基準として、
\begin{displaymath}
Q(k) = \sum_{j=1}^2 \omega_j(k) \log(\omega_j(k)) - \log(\sigma_W(k))
\end{displaymath} (179)

が得られる。この式の右辺の第2項は、大津の基準に等価である。一方、第1項は、 各クラスに割り当てられる画素数にのみ依存する量である。従って、これは、大津の しきい値選定法を対象の画素数と背景の画素数が極端に異なる場合に対する改良法を 与えていると考えることができる。以下では、この基準で選ばれたしきい値を $T_Q$ と表すものとする。

最後に、各クラスの分散が異なる場合について考える。この場合には、クラス $C_j$ のもとでの $g$ の分布は、

\begin{displaymath}
f(g\vert C_j) = \frac{1}{\sqrt{2\pi\sigma_j^2(k)}}
\exp(-\frac{(g-\mu_j(k))^2}{2\sigma_j^2(k)}) \ \ \ (j=1,2)
\end{displaymath} (180)

となる。従って、同時分布の対数尤度は
$\displaystyle l(G,\Theta;\Pi(k),B(k))$ $\textstyle =$ $\displaystyle \sum_{i=1}^N \sum_{j=1}^2 \theta_{ji} \log(\pi_j(k))
-\frac{N}{2}\log(2\pi)$  
    $\displaystyle -\frac{1}{2}\sum_{i=1}^N \sum_{j=1}^2 \theta_{ji}\log(\sigma_j^2(k))$  
    $\displaystyle -\sum_{i=1}^N \sum_{j=1}^N \frac{1}{2\sigma_j^2(k)} \theta_{ji} (g_i-\mu_j(k))^2$ (181)

で与えられる。最大対数尤度を求めると、
$\displaystyle \hat{l}(G,\Theta;\hat{\Pi}(k),\hat{B}(k))$ $\textstyle =$ $\displaystyle N \sum_{j=1}^2 \omega_j(k) \log(\omega_j(k))
-\frac{N}{2}\log(2\pi)$  
    $\displaystyle -\frac{N}{2} \sum_{j=1}^2 \omega_j(k)\log(\sigma_j^2(k))
-\frac{N}{2}$ (182)

となる。定数項を無視すると、これは、Kittler らのしきい値選定のための基準と同 じになる。つまり、Kittler らの基準は異なる分散を持つ正規分布の仮定のもとに同 時分布の尤度を最大とする基準と等価であるといえる。以下では、この基準によって 選ばれたしきい値を $T_K$ で表すことにする。

以上の結果は、大津のしきい値選定法とKittler らのしきい値選定法を最尤法の観点 から統一的に説明するものである。これにより、これらの手法をある特定の問題に利 用する場合に、どちらの手法を使うべきかの指針が得られる。例えば、2つのクラス の画素数がほとんど同じで、各クラスの分散も等しいと仮定できるなら、推定すべき パラメータ数のもっとも少ない大津のしきい値選定法がもっとも安定な結果を与える であろう。Sahoo の解説論文 [150] において、多くの実際の画像に対して 大津のしきい値選定法が相対的に良い結果を与えることが報告されているが、これは、 主にこの方法の安定性のためであると考えられる。しかし、もし各クラスの画素数 が極端に異なり、しかも各クラスの分散も異なるような場合には、大津の方法はバ イアスを持つため、推定すべきパラメータ数は増えるが Kittler らのしきい値選定 法を使うべきである。さらに、もし正規分布を仮定することができないなら、妥当な 分布を仮定して、同様に、その分布のもとで尤度を最大とするようなしきい値選定法 を開発して利用すべきである。


next up previous
次へ: しきい値選定実験 上へ: 最大尤度しきい値選定法 戻る: 複合分布モデル(Population Mixture Models)
Takio Kurita 平成14年7月3日