next up previous
次へ: 類似度に基づく主観特徴空間の構成 上へ: 主観特徴空間(SF空間)の構成 戻る: 主観特徴空間(SF空間)の構成

グループ分けに基づく主観特徴空間の構成

画像データベース中の画像のある部分集合 $G=\{g_i\vert i=1,\ldots,N\}$ を学習用の画 像集合とする。これをデータベースの利用者(被験者)に見せて、似ていると感じる 画像は同じグループに入り、似ていないと感じる画像は異なるグループに入るように グループ分けしてもらう。この結果に基づいて、GF空間からSF空間への写像を構成す ることを考える。

学習用画像集合 $G$ の各画像 $g_i$ に対して、その画像的特徴を表わす $M$ 次 元の特徴ベクトル(GF空間での表現)を $\mbox{\boldmath$x$}_i$, $(i=1,\ldots,N)$ とする。ま た、学習用画像集合 $G$ は利用者の主観に基づいて、 $C_1,\ldots,C_K$$K$ 個のグループに分割されているとする。

GF空間からSF空間への写像を線形写像

\begin{displaymath}
\mbox{\boldmath$y$} = A^T(\mbox{\boldmath$x$} - \bar{\mbox{\boldmath$x$}}_T)
\end{displaymath} (399)

により構成する。ただし、$A^T$ は行列 $A$ の転置を表わす。また、
\begin{displaymath}
\bar{\mbox{\boldmath$x$}}_T = \frac{1}{N} \sum_{i=1}^N \mbox{\boldmath$x$}_i
\end{displaymath} (400)

は平均画像特徴ベクトルを表わす。式(9.1)により写された空間で、 同じグループの画像はなるべく近く、異なるグループの画像はなるべく遠くに配置で きれば、その空間は利用者の主観を反映した空間であるといえる。このためは、判別 分析を利用することができる。前述のように判別基準
\begin{displaymath}
J = \mbox{tr}(\hat{\Sigma}_W^{-1} \hat{\Sigma}_B)
\end{displaymath} (401)

を最大とするような変換行列 $A$ は、固有値問題
$\displaystyle \Sigma_B A$ $\textstyle =$ $\displaystyle \Sigma_W A \Lambda$ (402)
$\displaystyle A^T \Sigma_W A$ $\textstyle =$ $\displaystyle I$  

の解として求まる。ただし、
$\displaystyle \Sigma_B$ $\textstyle =$ $\displaystyle \sum_{k=1}^K \omega_k \bar{\mbox{\boldmath$x$}}_k \bar{\mbox{\boldmath$x$}}_k^T -
\bar{\mbox{\boldmath$x$}}_T \bar{\mbox{\boldmath$x$}}_T^T$ (403)
$\displaystyle \Sigma_W$ $\textstyle =$ $\displaystyle \sum_{k=1}^K \omega_k \Sigma_k$  
$\displaystyle \Sigma_k$ $\textstyle =$ $\displaystyle E_{C_k} \mbox{\boldmath$x$} \mbox{\boldmath$x$}^T - \bar{\mbox{\boldmath$x$}}_k
\bar{\mbox{\boldmath$x$}}_k^T \ \ \ \ \ (k=1,\ldots,K)$  
$\displaystyle \bar{\mbox{\boldmath$x$}}_k$ $\textstyle =$ $\displaystyle E_{C_k} \mbox{\boldmath$x$} \ \ \ \ \ (k=1,\ldots,K)$  
$\displaystyle \omega_k$ $\textstyle =$ $\displaystyle \frac{N_k}{N} \ \ \ \ \ (k=1,\ldots,K)$  

である。ここで、$E_{C_k}$ は、グループ $C_k$ に関する平均を表わし、$N_k$ は、 グループ $C_k$ に含まれる対象画像の数を表わす。

ところで、類似画検索を高速に行なうためにはSF空間の次元は小さい方が良い。 しかし、次元が小さすぎるとその空間で表現できる精度が悪くなる。ここでは、 (9.5)式の固有値問題において、固有値の大きさの順に対応する固有 ベクトルを適当にいくつか取って変換行列 $A$ とする。SF空間の次元を決定するた めの目安としては、例えば、累積寄与率

\begin{displaymath}
\alpha(m) = \frac{\sum_{j=1}^m \lambda_j}{\sum_{i=1}^R \lambda_i}
\end{displaymath} (404)

を使うことができる。ただし、 $R = \mbox{min}(K-1,M)$ である。つまり、SF空間の 次元として、累積寄与率があるしきい値以上になる次元 $m$ までを採用すればよい。

以上により、任意の対象画像に対して、その画像特徴ベクトルが得られれば、変換行 列 $A$ を用いて、(9.1)式からSF空間での表現が求まる。


next up previous
次へ: 類似度に基づく主観特徴空間の構成 上へ: 主観特徴空間(SF空間)の構成 戻る: 主観特徴空間(SF空間)の構成
Takio Kurita 平成14年7月3日