多層パーセプトロンは任意の連続関数を近似するのに十分な表現能力をもって いるが、そうしたネットワークに望みの情報処理をさせるためにはユニット間 の結合荷重を適切なものに設定しなければならない。ユニットの数が増えると 結合荷重の数も増え、それらをいちいち設定することは難しい。一般には、そ れらは利用可能なデータからの学習によって求めらる。そのためのアルゴリズ ムとしては、最急降下法に基づく誤差逆伝搬学習法[6,7]が 有名である。
ここでは、中間層のユニットの入出力関数がロジスティック関数で、出力層の ユニットの入出力関数が線形の中間層が1層のみネットワークに対する誤差逆 伝搬学習法について説明する。
今、学習用のデータを
とする。また、学習のため
の評価基準として2乗誤差
上記のアルゴリズムは学習データ集合全体を見て結合荷重を修正しているが、 学習データ毎に および により結合荷重を更新することも可能であり、実際にはこちらの方 法を使うことが多い。
このような最急降下法を用いた学習法では、学習率をどのように決めるかによっ てアルゴリズムの収束の速さが影響を受けるので、学習率を適切な値に設定す るための方法がいくつかの提案されている(例えば、[13])。また、 学習の高速化に関しては、多くの方法が提案されている。例えば、 Quick Prop [34] は、多くのヒューリスティックを組み合わせて、学習 を高速化している。