EMアルゴリズムは、混合分布モデルのパラメータの推定にも利用できる不完全 データからの学習アルゴリズムであり、最急降下法と同様に解を逐次改良する ことにより次第に最適な解に近づけて行く手法である。直感的にわかりやすく、 しかも初期段階での収束性が速いことが知られている。その基本的な考え方は、 統計学では古くから知られてたが、EMアルゴリズムの一般的な定式化は Dempster等によって行われた[56]。また、最近、AmariはEMアル ゴリズムの幾何学的な意味を明らかにし、なぜアルゴリズムがうまく働くかの 直感的なイメージを与えた[57]。
平均
、共分散行列
の正規分布の混
合分布の場合、もしデータがどの正規分布から生成されたのかが全て分かって
いれば非常に簡単になる。しかし、実際には、どの正規分布から生成されたの
かも含めて推定する必要がある。EMアルゴリズムを適用するためには、どの正
規分布から生成されたのか番号 を含めたもの
を完全デー
タとみなし、
を不完全データとみなす。この場合、完全データ
の分布は、
(53) |
(54) |
EMアルゴリズムでは、パラメータの適当な初期値 から 初めて、Eステップ(Expectation step)とMステップ(Maximization step)と呼 ばれる二つの手続きを繰り返すことにより、パラメータの値を逐次更新する。 今、繰り返し回数 でのパラメータの推定値を とす ると、EステップとMステップでは、それぞれ、
(55) |
平均
、共分散行列
の正規分布の混
合分布の場合には、
を最大とするパラ
メータは陽に求まり、EMアルゴリズムの繰り返し計算は、
(56) | |||
(57) | |||
(58) |
このような EM アルゴリズムは各繰り返しのステップで尤度を単調に増加させ ることから、他の同様な反復アルゴリズムに比べより数値的に安定な挙動を示 すことが知られている。また、逆行列の計算が必要なく、Newton 法等の非線 形最適化手法に比べて簡単である。しかも、多くの実例では他の手法に比べて 良い解に収束することが知られており、繰り返しの初期の段階では Newton 法 と同定度に速い。ただし、解の近くでは収束が遅くなるので、注意が必要であ る。また、大域的な収束は保証されていないので、初期値の選び方を工夫しな ければならない場合もある。