次へ: 謝辞
上へ: 柔らかな情報処理のための統計的手法の応用に関する研究 A STUDY ON
戻る: 本章のまとめ
人間に近い高度で柔軟な知的情報処理を実現するためには、統計的手法が非常
に重要な役割を担っているという認識から、多変量データ解析、クラスタリン
グ、およびニューラルネットワークについて基礎理論およびアルゴリズムの改
良を与え、それらをさまざまな実際問題に適用した。その結果を要約すれば次
のようになる。
- アンケート調査などの質的データを扱う多変量データ解析手法である数量
化理論の各手法を非線形に拡張し、各手法がデータの持つ確率的な構造をどの
ように抽出しているのかについて明らかにした。そこでは、大津が交差係数と
呼んだ2つの集合間の確率的な関係を表す統計量が重要な働きをしていること
がわかった。さらに、その結果を量的データを扱う一般の多変量データ解析に
拡張し、より一般的な形で統一的な解釈を与えた。また、通常の線形の手法が
本論文で導出した究極の非線形手法のどんな近似になっているかについて明ら
かにした。
- 最も簡単なクラスタリングの例としてヒストグラムの分割問題について最
尤推定の枠組から考察し、濃淡画像の2値化のためのしきい値選定法として有
名な大津の判別および最小2乗基準に基づく方法と Kittler 等の最小誤差し
きい値選定法が統一的に扱えることを示した。また、一般の多次元データのク
ラスタリングのための階層的クラスタリングアルゴリズムをヒープを用いて高
速化する方法を示した。さらに、データが逐次的に与えられるような場合のク
ラスタリングのアルゴリズムを提案した。
- 階層型ニューラルネットの学習に関連する問題を統計的観点から考察し、最尤
推定を用いたパラメータの学習アルゴリズムを示した。また、汎化能力の高い
ネットワークを構成するために情報量基準を用いる方法を提案した。
- 直接最適解を求めるのが難しい問題の準最適解を高速に求めるために統計的手
法を利用する方法について考察し、日程表作成問題を例に多変量データ解析手
法を用いてもとのデータから大まかな情報を抽出することにより難しい問題を
簡単な問題に帰着させて近似的に解く方法を示した。また、同じ問題に対して
階層的クラスタリングにより準最適解を求める方法を提案した。
- 統計的手法のデータ圧縮への応用の例として、カラー画像のデータ圧縮につい
て考察し、カラー画像を小領域に分割し、各領域の色情報の主成分分析により1次元
のスコアを求め、それに基づいて各画素を2色で近似する方法を示した。
- パターン認識における最も基本的な課題のひとつである形の認識および分類へ
の統計的手法の応用について考察し、輪郭点を複素表現し、輪郭点列に複素自己回帰
モデルをあてはめると、その係数は輪郭の回転や始点位置の選び方によらない特徴と
なり、輪郭点の量子化法を工夫すると平行移動や大きさにも依存しない特徴が構成で
きることを示した。また、複素自己回帰モデルに基づいて複素 PARCOR 係数と呼ばれ
る形の相似変換に関して不変な量を定義した。これらの特徴を高速に計算するための
アルゴリズムを示した。さらに、複素自己回帰モデルに基づいて相似変換に不変な形
の間の距離を定義した。
- コンピュータビジョンへの応用例として、2次元画像の認識・計測について考
察し、高次局所自己相関特徴と多変量データ解析手法を用いた並列学習的な画像計測・
認識システムを示した。また、3次元世界の認識のためのレンジデータ(距離画像)
の解析について考察し、曲面上の最小軌道長とその軌道上での平均法線角度差に基づ
く重み付き最小2乗法による微分幾何的特徴(ガウス曲率と平均曲率)の計算法を提
案した。
- 商標・意匠図形を対象とするデータベースを対象として、画像を直接キーとし
て似た図形を検索する手法について考察し、利用者の主観的な類似性を反映した類似
画検索手法を提案した。また、絵画を対象としたデータベースに対する利用者の主観
を反映した印象からの検索手法を提案した。
以上の結果から、「柔らかな情報処理」を実現する上で統計的手法の有効性を示すと
いう本研究の目的は、ある程度達成されたものと考える。
最後に今後の課題について述べる。2章の非線形多変量データ解析の理論では、デー
タそのものよりもむりろデータの背後の確率的な構造が重要であることを示した。つ
まり、もしもデータの背後の確率が完全に推定できるなら究極の非線形多変量データ
解析が実現できる。従って、データから確率を推定する方法が非常に重要になる。こ
のためには、ニューラルネットを用いてデータから確率を推定することなども考えら
れる。3章のヒストグラムの分割と4章の階層型ニューラルネットのパラメータ学習
に対して、最尤推定法が有効であった。それを多次元データのクラスタリングや他の
タイプのニューラルネットに適用することなどは今後の課題である。また、本論文で
は、3章で述べた階層型ニューラルネットを実際問題に応用した例については述べな
かったが、2章で触れたように階層型ニューラルネットはネットワークの構造の制約
のもとで非線形の多変量データ解析を近似するものであると考えられるので、本論文
で取り上げた応用例のうちで多変量データ解析を利用している課題に対してニューラ
ルネットを利用することも可能であろう。
本論文で取り上げた例は、難しい問題に対して高速に近似解を求めるため、画像デー
タの圧縮のため、形の認識・分類のための相似変換に不変な特徴の抽出のため、2次
元画像の認識・計測のため、レンジデータの解析のためおよび利用者の主観を反映し
た画像データベースの検索のために統計的手法を利用するものであり、これらは一見
かなり異なった問題領域と考えられるが、全てデータからいかにして有効な情報を取
り出すかの問題であると考えることができ、多変量データ解析手法等の統計的手法が
有効に働いた考えられる。統計的手法を応用できる課題は、これら以外にも無数にあ
ると考えられるが、そうした課題に対する応用は今後の課題である。
Takio Kurita
平成14年7月3日