図4.3のようなネットワークでは、入力信号 に対して、次式に従って出力信号 が計算される。
学習のためのデータの集合を、ニューロン1個のみのネットワークの場合と同様に、 とする。また、教師信号は対応するクラ スの要素は でそれ以外の要素は の 次元の2値ベクトルで与えられる ものとする。
今、出力の各要素の条件付き独立性を仮定すると、学習データに対するネットワーク の尤度は、