ヒープ

次へ: ヒープを用いた階層的クラスタリングアルゴリズム 上へ: 階層的クラスタリングアルゴリズム 戻る: 階層的クラスタリングアルゴリズム

ヒープ

ヒープは、ソーティングの高速化のために、J.Williams [178]によって発明されたデータ構造であり、一次元の配列の中に木構造を埋め込んだデータ構造をしている。ヒープを使うことによって、ソーティングのアルゴリズムは、通常の木ソーティングアルゴリズムに比べ大きく改善された[179]。

ヒープは、以下に示すような制約条件を満たす一次元の配列として定義される。

$\begin{displaymath} H[1],H[2],\ldots,H[r] \end{displaymath}$

(190)

[制約条件]

$\displaystyle H[i]$	$\textstyle \leq$	$\displaystyle H[2i]$	(191)
$\displaystyle H[i]$	$\textstyle \leq$	$\displaystyle H[2i+1] \ \ \ for \ \ all \ \ i=1 \ldots r/2.$	(192)

この配列を二分木として表現すると図3.6にのようになる。

**図 3.6:** ヒープの二分木表現()
$\begin{figure}\begin{center} \begin{picture}( 330, 170) \small\tt\put( 186.5, 15... ...}} \put( 178.7, 54.1){\line(-2,-5){ 16.0}} \end{picture}\end{center}\end{figure}$

ヒープの特徴は、二分木で表現した時、木の根の要素、つまりが最小値となることである。ヒープソートでは、この性質を用いて、ヒープから次々と最小値を取り出し要素をソートしている。また、ヒープへの要素の追加、削除、値の変更は、 $O(\log(r))$ の手間で実現できる。従って、データが順次追加されたり削除される場合あるいは配列に蓄えられる値が順次更新されるような場合に、その時点での最小値（あるいは最大値）を見つけるには、非常に都合のよいデータ構造である。

以下、ヒープのこうした性質を利用して、階層的なクラスタリングを高速化することを考える。

Takio Kurita 平成14年7月3日