Fast Human Detection Using a Cascade of Histograms of Oriented Gradients¶

Abstract:¶

相对于之前HOG中固定的模块大小和数量，本文章提出了用可变大小的模块来扫描图像，使得识别时间有显著改变。
老方法的缺陷在于：其只能处理320X240的图像，每幅图像的识别窗口固定为800个，且固定的窗口大小在第一次识别时难易捕捉到关键信息，而新方法则有800-1200个，在第一级时使用可变的（一般会大于之前的窗口）窗口来使得处理速度提高。
从算法角度看，这是通过合并cascade of rejector来实现。

The Dalal-Triggs Algorithm:¶

此算法将识别窗口分割成许多个块，每个块由2X2个单元组成，每个单元由3X3个像素组成，块与块之间可以相互重叠。
每个单元含有一个9-bin的HOG，每个模块包含一个链接所有单元的向量。因此一个模块可以被一个36-D的向量来表示。
它有三个关键部分：1 以HOG为基础模块 2 运用高密度的HOG来呈现一整个识别窗口 3 运用归一化使得相邻的单元相联系，而并非单独的绝对值。
它的缺点在于：模块规模相同，容易错失不同规模上的信息，并且窗口大小太小，容易错失较大的图像的信息。当添加不同规模的窗口时，

快速人物识别框架：¶

首先针对之前的缺点进行改进，增大特点空间，使得模块中可以有更多的模块可以选择，并且，在第一级中运用较大的模块，可以抓住更多的信息。
使用多规模模块的好处在于：1 图像本身有价值的图案可能是千变万化的，因此，不同规模的模块可以捕捉更多的信息。 2 在更多的模块中一定会有更多的模块与人物的某些部位匹配，例如人的腿，这样在识别时速度更快，而原先的小模块不一定能够做到。
先假设错误率为1，通过循环判断，找出最差的一个分级器，其就是整个的错误率。

实验结果和分析：¶

通过与老方法比较结果可得，其实际识别能力与老方法持平，在某些情况下计算机复杂度下降，其识别时间下降（通过一个识别窗口中的模块数量就可得之）。
对于不同窗口大小的实验分析中：小窗口包含了最少的信息，并且增大窗口对于获取识别信息有非常明显的帮助。
× 通过进一步的实验发现，在错误率最小的5个窗口中，表现最好的窗口的大小与人物外形的大小基本吻合，不仅如此，那些针对人物某一部分的模块，例如手脚等同样有较低的错误率。