Support Vector Machines for Histogram-Based Image Classification¶
Abstract:¶
- 高纬度的特点空间导致传统的分级器在图像分级上效果不好
- SVM针对高纬度histograms有优势
- Moreover, we observed that a simple remapping of the input xi ! xai improves the performance of linear SVM’s to such an extend that it makes them, for this problem, a valid alternative to RBF kernels.
Introduction:¶
- 文章中运用色彩柱状图作为图像的呈现,原因是其简单合理的特性。
- SVM的一大特点是,即使在很高的维度情况下,它仍然可以有很好的归一化表现,且不需要增加一个proiri knowledge。
- 通过分类的方法,寻找到一个超平面,如果成立的话,可以大大降低错误分级的概率。
SVM简介:¶
Optimal Separating Hyperplanes:
¶
- 寻找用来分隔的超平面
- 若存在,定义其为线性可分离
- OSH的定义是其离最近一个点的距离最远的一个平面就是OSH。
Linearly Nonseparable Case
¶
- 当其不是线性可分割时,需要引入小量的概念,它是用来允许错误的分级点的。
- C值对于penalty有影响,C值较大则会获得一个较大的penalty to error
Nonlinear Support Vector Machines¶
- 输入的数据会进入一个高维度的空间,会选择一个priori,并且OSH平面会建立
Multiclass Learning¶
- SVM仅仅能够针对2级分级器,当遇到多级分级时,需要寻找一个方法来实现,具体的方法有: 1 将多级分级器合成成两极分级器 2 用多个两级分级器组成一个多级分级器。
The Data And Its Representation:¶
- 文章中运用最简单全面,最low-level的方法来提取照片中的特点
- 最简单的方法是考虑图像的bitmap representation. 但是这样的一切缺点是它太大且在变换时它的稳定性很差。因此选用histogram representation。
Color Histograms¶
- 尽管其简单,但它表现很好,而且在针对提取特点这一点上,可以做到简单快速。同时由于空间特点无法提取,因此保证了整体的转换和旋转不变性。
- 选用HSV因为常用,并且因为它分割开了光强和色彩信息以及对光强变化的不敏感性。
- Note also that distances in the HSV space correspond to perceptual differences in color in a more consistent way than in the RGB space.
- 通过对比试验证明了HSV比RGB更好些,因为当信息转化成BIN时,没有多少色彩信息被包括在内,因此前者更好。
Selecting The Kernel¶
- KPLOY从一个拥有polynomial decision function的方程中获得, KGAUSSIAN给出了一个基本的GAUSSIAN RBF分级器。
Experiment
¶
- 试验中期待的差距并没有出现,RGB和HSV差不多,这是因为在适当的选用了RBF kernels,这样的差距会被缩小,事实上,其将GAUSSIAN RBF的错误率从3成降至了1.5成。
- 同时这样好的表现也要归功于SVM良好的归一性。同样算法的SVM和KNN性能差异很大,因此证明了SVM的优势。
- 从算法角度分析,当图像中的信息发生变化时,例如光强或颜色发生变化时,很可能会将BIN移动到下一个HISTOGRAM,而这时,在算法层面引起的误差,X2要比GAUSSIAN小得多,前者是线性的指数,而后者则是二次的指数。
Kernel Design Versus Input Remapping¶
- 之前已经验证了一个低于二次指数decay rate的非GAUSSIAN RBF kernels可以导致SVM有一个在图像上非常好的分级表现。现在来想办法降低它的指数rate
NON-GASSUIAN RBF KERNELS¶
- 在GAUSSIAN中降低AB的值会导致decay rate下降,同样的,在NON-GAUSSIAN中降低B的值也能得到良好的效果,
NONLINEAR REMAPPING OF THE INPUT¶
- A的作用在于其能降低由于规模变化而引起的增值变化。