次へ: 階層型ニューラルネットワークの学習 上へ: クラスタリングのアルゴリズム 戻る: 画像のデータ圧縮への応用

本章のまとめ

本章では、「柔らかな情報処理」を実現する際の基本的な道具として利用されるであろうクラスタリングのアルゴリズムについて考察した。

まず、最も簡単な１次元データのクラスタリングの例としてヒストグラムの分割問題を最尤推定の枠組から考察し、大津により提案された判別および最小２乗基準に基づくしきい値選定法と Kittler らの最小誤差しきい値選定法が同じ枠組で統一的に考察できることを示した。それは、これらの手法の背後にある仮定を明確化するものであり、これらの手法をある特定の問題に利用する場合にどちらの手法を使うべきかの指針を与える。また、こうしたクラスタリングを最尤推定の枠組から考察することは、一般のクラスタリングに対しても可能であり、クラスタリングのアルゴリズムを理解するための有効な手段となると考えられる。

次に、一般の多次元データのクラスタリング手法のひとつである階層的クラスタリングアルゴリズムをクラスター間の類似度をヒープに蓄えることにより高速化する方法を示した。ヒープを用いることにより、個のデータに対して、の記憶領域が必要となるが、計算時間は従来法のから $O(N^2\log(N))$ に高速化される。その結果、従来法に比べてより多くの対象のクラスタリングが可能となり、画像のセグメンテーションなどのように大量のデータを分類する必要のある問題に対しても階層的クラスタリングが利用可能となると期待できる。

最後に、データが逐次的に与えられるような状況でのクラスタリングアルゴリズムを示した。このアルゴリズムは、例えば、ベクトルデータの情報圧縮のための適応的ベクトル量子化などに応用できるものと考えられる。

Takio Kurita 平成14年7月3日