上記の誤差逆伝搬学習法では、2乗誤差を最小とするような結合荷重を最急降 下法により求めた。ここでは、これを最尤推定の観点から見てみることにする。
今、教師信号
とネットワークの出力
との誤差
が、互いに独立な正規分布
に従うとする。この時、学習データ集合に対する教師
信号とネットワーク出力の誤差の尤度は、
次に、ネットワークに対するフィッシャー情報行列を具体的に計算してみる。
ここで対数尤度の微分に関する関係
(83) |
このフィッシャー情報行列 を利用してネットワークの結合荷重を学習す
るアルゴリズムを構成することができる。今、ネットワークの結合荷重をまと
めて
と書くとする。このとき、結合荷重の修正ベクトル
を
フィッシャー情報行列に関する線形方程式
この学習アルゴリズムではフィッシャーの情報行列を完全な形で用いているが、
大きなネットワークに対してそれを計算するのはかなり大変であり、また、式
(85) の線形方程式を解くのはさらに大変である。そのため、実用
的にはなんらかの方法でこれをさぼる必要がある。また、並列計算機を利用す
ることを考えると、各ユニットに関連する局所的な情報のみから学習できるこ
とが望ましい。そこで、フィッシャー情報行列のブロック対角線分のみを用い
て残りの部分を無視したアルゴリズムを考えてみる[17,18]。
この場合には、中間層の番目のユニットへ入る結合荷重
の更新式は、