SVM中比较方法的深入理解¶
- 所谓“一对ALL”的方法,就是每次解一个两类分类的问题。比如我们有5个类别,第一次就把类别1的样本定位正样本,其余的定位负样本,这样得到一个两类分类器,它能够指出一篇文章是还是不是第1类的;第二次把2定位正样本,其余定为负样本,得到一个分类器。如此下去,我们可以得到5个这样的两类分类器。需要分类时就每次不停的询问是哪个组的。
- 好处在于每个优化问题的规模比较小,而且分类的速度快
- 缺点在于,很有可能询问完成后发现有多个响应或者没有响应,前者选择样本离超平面最远的分组即可,后者则需要分类第6类,这会造成数据集偏斜的问题。
- “一对一”的方法可以避免数据集偏斜的问题。因为在询问时,第一个回答“是第一类还是第二类”,这样的问题总能得到答案,因此不会出现无响应的情况。
- 有点在于,虽然分组变多,但在训练阶段所用时间减少。最后通过每次询问结果统计票数,将样本投给票数最多的分组。缺点在于分类器需要很多,硬件开销变大。