ノンパラメトリックな確率密度関数の推定のための基本的な考え方は、直観的 には比較的単純である。
今、あるベクトル
が未知の確率密度関数
からのサン
プルであるとすると、このベクトル
がある領域 の内側に入る確
率 は、
(24) |
(25) |
次に、独立な 個のサンプルが与えられた場合を考えよう。この場合、
このうちの 個が領域 に入る確率は、二項分布の定義から
(26) |
(27) |
これらの結果から、確率密度関数は、
ただし、このような近似が成り立つためには、次の様な相反する要請を満足す るように領域 を選ばなければならない。まず、領域 内で確率密度関 数 があまり変化しないためには、領域 は十分小さくなけれ ばならない。一方、二項分布が鋭いピークを持つためには、領域 に入る サンプルの数が十分多くなければならないので、領域 はある程度大きく なければならない。つまり、このような近似を成り立たせるためには適切な大 きさの領域 を選ぶ必要がある。