SVM中点的代表物xi与yi的定义¶
- xi是前级由直方图获得的特征向量.关于g(x)=wx+b 这个表达式要注意式中的x 不是二维坐标系中的横轴,而是样本的向量表示,例如一个样本点的坐标是(1,2),则xiT=(1,2),而不是x=1
- 在进行文本分类的时候,我们可以让计算机这样来看待我们提供给它的训练样本,每一个样本由一个向量(就是那些文本特征所组成的向量)和一个标记(标示出这个样本属于哪个类别)组成。如下:
Di=(xi,yi) xi 就是向量(维数很高),yi 就是分类标记。在二元的线性分类中,这个表示分类的标记只有两个值,1 和-1(用来表示属于还是不属于这个类)。有了这种表示法,我们就可以定义一个样本点到某个超平面的间隔。
- δi=yi(wxi+b)这个公式是个定义,但变换就能看出一些有意思的东西。首先注意到如果某个样本属于该类别的话,那么wxi+b>0,而yi 也大于0;wxi+b<0,而yi 也小于0,因此其值与分类所得值是相同符号的。