判別規準による分割

次へ: bottom-up mergingによるクラスタリング 上へ: 大まかな情報の抽出による方法 戻る: 多変量データ解析手法による大まかな情報の抽出

判別規準による分割

各項目のスコアを一次元の数直線上にならべると、数直線上での点の近さは項目間の類似性を表していると考えられる。従って、類似した該当ベクトルを持つ項目を同じクラスターに割り当てるためには平均クラスター内分散（級内分散）を小さくすればよい。また、数直線上での順序を無視してクラスターを割り当てると明らかに平均クラスター内分散は大きくなる。従って、数直線上の個の点を、各クラスターの点の数を以下にするという制約条件のもとで、平均クラスター内分散を最小にするように個のしきい値によって個のクラスターに分割すればよいことになる。この問題は本質的には、大津の多値化のための自動しきい値選定法 [127,128]と同じになる。日程表作成の場合には、しきい値の組は制約条件付きダイナミックプログラミングによって求めることができ、その手続きの手間はである。従って、全体としてクラスタリングに必要な手間は、数量化の手間を加えてとなる。

Takio Kurita 平成14年7月3日