next up previous
次へ: 2乗誤差 上へ: データが逐次的に与えられる場合のクラスタリングアルゴリズム 戻る: データが逐次的に与えられる場合のクラスタリングアルゴリズム

代表ベクトルの逐次更新アルゴリズム

ベクトルが次々と与えられる場合に、代表ベクトルの集 合を更新する方法について考える。

2乗誤差最小の意味で最適な代表ベクトルは、そのクラスターの平均ベクト ルであることが知られている。従って、ここでは各クラスターの代表ベクトルは、そ のクラスターの平均ベクトルとする。

あるベクトルをすでにクラスタリングされたデータの集合に追加することを考える。 ここでは、ベクトルの追加の方法として、すでに存在するクラスターのどれかに追加 する場合と、すでにあるクラスター対を統合しひとつのクラスターとし、追加された ベクトルのみからなるクラスターを新しく作る場合の2通りのみを考える。こうした 変更によって2乗誤差が最小になるようにベクトルを追加できれば、2乗誤差最小の 逐次クラスタリングアルゴリズムが構成できる [91]。



Subsections

Takio Kurita 平成14年7月3日