次へ: 謝辞 上へ: 柔らかな情報処理のための統計的手法の応用に関する研究 A STUDY ON 戻る: 本章のまとめ

結論

人間に近い高度で柔軟な知的情報処理を実現するためには、統計的手法が非常に重要な役割を担っているという認識から、多変量データ解析、クラスタリング、およびニューラルネットワークについて基礎理論およびアルゴリズムの改良を与え、それらをさまざまな実際問題に適用した。その結果を要約すれば次のようになる。

アンケート調査などの質的データを扱う多変量データ解析手法である数量化理論の各手法を非線形に拡張し、各手法がデータの持つ確率的な構造をどのように抽出しているのかについて明らかにした。そこでは、大津が交差係数と呼んだ２つの集合間の確率的な関係を表す統計量が重要な働きをしていることがわかった。さらに、その結果を量的データを扱う一般の多変量データ解析に拡張し、より一般的な形で統一的な解釈を与えた。また、通常の線形の手法が本論文で導出した究極の非線形手法のどんな近似になっているかについて明らかにした。
最も簡単なクラスタリングの例としてヒストグラムの分割問題について最尤推定の枠組から考察し、濃淡画像の２値化のためのしきい値選定法として有名な大津の判別および最小２乗基準に基づく方法と Kittler 等の最小誤差しきい値選定法が統一的に扱えることを示した。また、一般の多次元データのクラスタリングのための階層的クラスタリングアルゴリズムをヒープを用いて高速化する方法を示した。さらに、データが逐次的に与えられるような場合のクラスタリングのアルゴリズムを提案した。
階層型ニューラルネットの学習に関連する問題を統計的観点から考察し、最尤推定を用いたパラメータの学習アルゴリズムを示した。また、汎化能力の高いネットワークを構成するために情報量基準を用いる方法を提案した。
直接最適解を求めるのが難しい問題の準最適解を高速に求めるために統計的手法を利用する方法について考察し、日程表作成問題を例に多変量データ解析手法を用いてもとのデータから大まかな情報を抽出することにより難しい問題を簡単な問題に帰着させて近似的に解く方法を示した。また、同じ問題に対して階層的クラスタリングにより準最適解を求める方法を提案した。
統計的手法のデータ圧縮への応用の例として、カラー画像のデータ圧縮について考察し、カラー画像を小領域に分割し、各領域の色情報の主成分分析により１次元のスコアを求め、それに基づいて各画素を２色で近似する方法を示した。
パターン認識における最も基本的な課題のひとつである形の認識および分類への統計的手法の応用について考察し、輪郭点を複素表現し、輪郭点列に複素自己回帰モデルをあてはめると、その係数は輪郭の回転や始点位置の選び方によらない特徴となり、輪郭点の量子化法を工夫すると平行移動や大きさにも依存しない特徴が構成できることを示した。また、複素自己回帰モデルに基づいて複素 PARCOR 係数と呼ばれる形の相似変換に関して不変な量を定義した。これらの特徴を高速に計算するためのアルゴリズムを示した。さらに、複素自己回帰モデルに基づいて相似変換に不変な形の間の距離を定義した。
コンピュータビジョンへの応用例として、２次元画像の認識・計測について考察し、高次局所自己相関特徴と多変量データ解析手法を用いた並列学習的な画像計測・認識システムを示した。また、３次元世界の認識のためのレンジデータ（距離画像）の解析について考察し、曲面上の最小軌道長とその軌道上での平均法線角度差に基づく重み付き最小２乗法による微分幾何的特徴（ガウス曲率と平均曲率）の計算法を提案した。
商標・意匠図形を対象とするデータベースを対象として、画像を直接キーとして似た図形を検索する手法について考察し、利用者の主観的な類似性を反映した類似画検索手法を提案した。また、絵画を対象としたデータベースに対する利用者の主観を反映した印象からの検索手法を提案した。

以上の結果から、「柔らかな情報処理」を実現する上で統計的手法の有効性を示すという本研究の目的は、ある程度達成されたものと考える。

最後に今後の課題について述べる。２章の非線形多変量データ解析の理論では、データそのものよりもむりろデータの背後の確率的な構造が重要であることを示した。つまり、もしもデータの背後の確率が完全に推定できるなら究極の非線形多変量データ解析が実現できる。従って、データから確率を推定する方法が非常に重要になる。このためには、ニューラルネットを用いてデータから確率を推定することなども考えられる。３章のヒストグラムの分割と４章の階層型ニューラルネットのパラメータ学習に対して、最尤推定法が有効であった。それを多次元データのクラスタリングや他のタイプのニューラルネットに適用することなどは今後の課題である。また、本論文では、３章で述べた階層型ニューラルネットを実際問題に応用した例については述べなかったが、２章で触れたように階層型ニューラルネットはネットワークの構造の制約のもとで非線形の多変量データ解析を近似するものであると考えられるので、本論文で取り上げた応用例のうちで多変量データ解析を利用している課題に対してニューラルネットを利用することも可能であろう。

本論文で取り上げた例は、難しい問題に対して高速に近似解を求めるため、画像データの圧縮のため、形の認識・分類のための相似変換に不変な特徴の抽出のため、２次元画像の認識・計測のため、レンジデータの解析のためおよび利用者の主観を反映した画像データベースの検索のために統計的手法を利用するものであり、これらは一見かなり異なった問題領域と考えられるが、全てデータからいかにして有効な情報を取り出すかの問題であると考えることができ、多変量データ解析手法等の統計的手法が有効に働いた考えられる。統計的手法を応用できる課題は、これら以外にも無数にあると考えられるが、そうした課題に対する応用は今後の課題である。

Takio Kurita 平成14年7月3日