Efficient HOG human detection¶
abstract:¶
- 通过两种办法来提高速度:重新利用模块中的特点来构建HOG特征,以此应用到交互的识别窗口上。第二种利用基于子单元的篡改插入来提高计算每个HOG模块的特征。
introduction:¶
- 人物识别的应用领域很广泛,包括了视频侦查,生物计量学,智能屋,驾驶辅助系统,社会治安和事件分析中。
- 静态的人物比动态的人物更难识别,因为动态的人物可以被考虑成动态的物体,可以区分出人物和背景,而静态的人物不能区分,通常需要去发掘其中更内在的特点来做判断。
- HOG主要集中突出与背景不同的人物黑色轮廓像,最终不同种类的特征可以被合并在一起来增强识别表现。
- 人物识别的第二步是设计分级器,宏观上的能力和更少的分类复杂度是两个非常重要的选择识别器的要求。
HOG & SVM¶
- HOG计算的第一步是计算幅度和角度的斜率值。第二步是形成柱状图。
- 每一个8*8的单元里有9个bin,分别是180的九均分,因此一个模块里有36个特征(4*9)。
- 三线过滤(降低同化效应):这是一种更复杂材质影像插补处理方式,会用到相当多的材质影像,而每张的大小恰好会是另一张的四分之一。例如有一张材质影像是512×512个图素,第二张就会是256×256个图素,第三张就会是128×128个图素等等,总之最小的一张是1×1。凭借这些多重解析度的材质影像,当遇到景深极大的场景时(如飞行模拟),就能提供高品质的贴图效果。一个“双线过滤”需要三次混合,而“三线过滤”就得作七次混合处理,所以每个像素就需要多用21/3倍以上的计算时间。还需要两倍大的存储器时钟带宽。但是“三线过滤”可以提供最高的贴图品质,会去除材质的“闪烁”效果。对于需要动态物体或景深很大的场景应用方面而言,只有“三线过滤”才能提供可接受的材质品质。
提出的算法:¶
基于HOG特征的高效识别窗口计算:¶
- 主要思想是:当识别窗口又部分重叠时,其中必然有block是重复利用的,那么在做新的一次识别时,是否可以将其中重复计算的block的结果合理利用起来,这样可以减少计算复杂度。
- 实际操作时,与传统方法不同的是,其将每个block中的特征提取后,放入堆栈中,将所有block的特征制作成一个更大的柱状图,而不是传统的每一个block都进行计算,最后再对大柱状图进行SVM处理。
- 数据计算只会获取一次,但是实际应用时,每次都会调用!
- 这一种方法的前提是每个block内的HOG特征都是给予的。
子单元三线过滤¶
- 将4个单元中的斜率信息平均分配,这样可以减小同化效应。但是计算复杂度会上升
- 减小复杂度的方法是:运用子单元,将一个8*8的模块分割成4个4*4的子单元,这样的子单元有三类,角单元,内部单元和边单元。
- 运用子单元后,实际复杂度由原来的16个降低为9个。
载入中...