2つのデータがどれだけ似ているかを返す関数です。
非負実数を返し、似ていれば値は大きく、似ていないと小さいです。
以上!
カーネルトリックについて
たいてい回帰問題の文脈で現れると思いますが、元のデータ点を直線(もしくは超平面)で回帰することはそう一般にうまくいきません。
そのため、ある関数によって元のデータを高次元空間にマップしてから、超平面で回帰することを考えます。このときに適切な
を知ることは至難の業ですが、実は
を直接知らなくとも、さまざまな計算をうまく変形して行うと、
の内積(
の形とは限らず、より一般に
の形で現れます)さえわかれば多くの場合で事足りることがわかります。そして、
を定める代わりにこの内積関数をカーネルとして予め定めてあげることで、
を陽に扱わずこの問題が解けることになります。これがカーネルトリックです。
最後に
なんで本の説明はどれを見てもあんなに長々しいんや