まず、学習用画像集合として227枚の商標・意匠図形を用意した。それを被験者(画 像処理の非専門家11名)の主観に基づいて自由にグループ分けしてもらった。そのう ちの比較的細かく分割した被験者では、学習用画像集合は89グループに分割された。 各グループに含まれる図形の数の平均は 2.6 個、分散は 4.7 であった。自由な分類 のため1つの図形のみからなるグループもいくつか存在した。以下の実験では、この 被験者のグループ分けに基づいてSF空間を構成した。
グループ分けに用いた227枚の対象図形をカメラで入力し、大きさを正規化( 画素)した二値画像から画像特徴ベクトルを計算した。これとグループ
分けの結果に基づきSF空間を構成した。累積寄与率を 95% としてSF空間を構成する
と、その空間の次元は 32 次元であった。これは、画像特徴ベクトルの空間の半分の
次元で、検索時間はGF空間での検索に比べ約半分になる。
例示画として、SF空間の構成(学習)に用いた画像、学習用の図形を再度カメラで入 力しなおした画像および学習用の図形のうちの33種の図形の手書きスケッチをカメラ で入力した画像を用いてSF空間での類似画検索の実験を行なった。比較実験としては GF空間での距離による類似画検索の実験を行なった。
検索手法 | 例示画像 | 次元 | ||
学習に用いた画像 | 再入力画像 | 手書きスケッチ | ||
1) 画像特徴空間での検索 | 100.0 (%) | 98.2 (%) | 93.9 (%) | 64 |
2) 主観特徴空間での検索 | 100.0 (%) | 95.2 (%) | 51.5 (%) | 32 |
3) 入力条件の変動も学習した場合 | 100.0 (%) | 100.0 (%) | 63.6 (%) | 34 |
検索手法 | 例示画像 | 次元 | ||
学習に用いた画像 | 再入力画像 | 手書きスケッチ | ||
1) 画像特徴空間での検索 | 8.7 (%) | 7.7 (%) | 7.7 (%) | 64 |
2) 主観特徴空間での検索 | 40.4 (%) | 30.6 (%) | 26.9 (%) | 32 |
3) 入力条件の変動も学習した場合 | 29.5 (%) | 29.0 (%) | 19.2 (%) | 34 |
検索結果を表9.1に示す。表9.1 の (a) は,第1候 補に例示画と同じ画像が検索される割合(再現率)を示す。表中で、1) は GF空間で の検索結果であり、2) はグループ分けに基づき構成したSF空間での検索結果である。 学習に用いた画像に対しては、当然、100% 正しく検索できるが、新たに入力しなお した画像に対しては、必ずしも、例示画と同じ画像が検索されない場合がある。
表9.1の (b) は、第2候補が同じグループに入っている割合を示し ている。これは SF空間が利用者の主観的類似度をどれくらい反映しているか(適合 率)の目安を与えるものと考えられる。つまり、SF空間がどの程度個人性(主観的な 類似度)に適応しているかの目安となる。GF空間での検索では、同じグループの画像 をほとんど検索できていないのに比べて、SF空間では、かなり検索できるようになっ ていることがわかる。
図9.2に SF空間の構成に用いた 227枚の画像を画像データとして検索 した例を示す。GF空間で検索された候補(図9.2 (a))に対し、SF空間 で検索された候補(図9.2 (b))の方が、円のなかに小さな円が偏って 接している図形を検索できており、より人間の主観に合致していると思われる。ここ で、(b)の2、3、4、5と8番目に検索されている図形は、被験者が例示画と同じ グループにグループ分けした図形である。
次に、上記の実験と同様に構成したSF空間とそれへの写像を用いて、1600 枚の画像 データに対する検索実験を行なった。図9.2 と同じ図形を例示して検 索した結果を図9.3 (a) に示す。また、図9.3 (b)に学 習用画像集合に含まれていない図形を例示して検索した結果を示す。学習用画像集合 に含まれていない画像をキーとした場合にも、主観的に似た画像を検索できていると 思われる。
上記の再現率の実験では、新たに入力しなおした画像に対しては、必ずしも、例示画 と同じ画像が検索されない場合があった。これは、画像の入力条件の違いにより画像 特徴ベクトルが変化するためである。特に、手書きスケッチによる検索の場合、手書 きによる図形のゆがみ等によって画像特徴ベクトルが大きく変動するため再現率が下 がっている(表9.1 (a))。これは、SF空間の次元がGF空間の次元の 半分しかなく、しかも、利用者の主観を反映するように構成した空間であるため画像 特徴ベクトルの変動に対して弱い空間となっているためであろう。従って、画像特徴 ベクトルの変動を吸収するようなSF空間を構成する必要がでてくる。
上記の実験で用いたのと同じ227枚の商標・意匠図形を入力条件を変えて4回入力し、 その結果に基づいてSF空間を構成した。累積寄与率を 95% としてSF空間を構成する と、その空間の次元は 34 次元であった。上記の実験と同じ画像を例示して検索実験 を行った。
検索結果は表9.1に併せて示している。入力条件の違いによるパター ンの変動を吸収するような空間を構成した結果、再入力した例示画に対しても同一の 画像が100%検索できるようになっている。ただ、SF空間の構成に用いた画像を例示 画とした場合の第2候補の適合率が多少悪くなっている。手書きスケッチを例示して 検索した結果が必ずしも良くないのは、手書きスケッチを学習用データに含めなかっ たため手書き変動までは吸収できていないためである。これは、手書きスケッチも学 習用データに含めれば手書き変動もある程度吸収できるようになると考えられる。