複数の対象があって、それぞれが確率分布の形であらわされているとする。複
数の対象全体はその(重み付きの)和
(82) |
そこで、もし仮に、各サンプル点がどの対象に属しているかがわかったとすれ ば、あとはそれぞれの対象ごとの確率分布の推定を行えばよくなる。どの対象 に属しているかというのを観測できない変数(または隠れた変数)とみなすと以 下で述べるように EM アルゴリズムが適用可能となる。
今、観測される変数を 、観測できない変数を とすると、EM アルゴリ ズムは、次の 2 つのステップの計算を に対して繰り返 し行なう。まず、パラメータを適当な値 に初期化し ておく。
(83) |
混合分布の場合に EM アルゴリズムを適用すると、 に関しては の 最大化が陽に解けて、 は各対象に関する重み付きの最適化問題とな り、対象ごとに独立に解くことができる。