Human Detection Using Oriented Histograms of Flow and Appearance¶
Abstract:¶
- 这篇文章的目的在于首先陈述在人物识别的过程中,仅仅通过外表识别并不稳定,错误率较高,而当将外表识别和动作识别结合在一起时,得到了非常好的效果,因为人物有些动作是非常带有特征的,因此通过动作识别可以大大提高正确率。
- 这项技术的最关键点就是在于寻找那些有特点的特征同时又可以避免背景、尤其是动态背景对于识别的影响。实验中运用了许多基于动作的识别器,并将与HOG技术结合,得到了非常好的效果。
Overall Architecture:¶
- 为了突出本文章基于动作的特点,在其他参数设置上从简处理,例如人物基本选取直立的或者基本直立的人物进行实验。
- 实验中运用Linear SVM 作为基准分级器,用它的原因有三:1 稳定性和可重复性 2 有效处理大型数据库 3 针对不同特点和参数的选择拥有良好的robustness。,另外不用nonLinear SVM 的原因是,虽然其能够得到更为低的错误率,但其花费的计算机复杂度的代价太大,远远大于其带来的优势。
- Learning Process: 通过选用一组training images,其中所有的positive images都被标记,而一组最初的negative images是通过在更大的一组NI中随机选取组成。一个预分级器用来对PI和NI进行寻找并通过遍历NI组来完成错误警报。
- 实际运用中,通过算法对图像每一个位置每一种规模都进行一次识别扫描,识别对每一张图片都是独立的。
Appearance Descriptors:¶
- 这一部分的识别主要运用HOG技术,其中识别窗口由大量的单元组成,单元中的每个像素中含有一个向量,用来涵盖图像的信息,并且进行计数,此外,通过归一化来使得图像的前后光强信息和色彩信息一致,为了减弱alias,在计数阶段运用一些技术可以做到,例如重叠计算单元的信息,可以有效的提高结果。
Motion Descriptors:¶
- 首先现金的一些技术有缺点,主要是虽然能够识别出移动的人物,但对于移动的背景其能力有限。
- 本文章介绍一种微分流量来实现在动态背景下的动态人物。
- 虽然说相机的抖动或者移动在大多数情况下都是很微小的,因此局部的微分波可以抵抗这样的波动,但剩余的一些由于1 相机和深度诱导的动作之间的视差 2 场景中独立的运动而造成的信号无法消除
- 运用基于波的识别好处在于,其不仅能够识别出人物的外形轮廓,更能捕捉人的手或者脚的动作。
Motion Boundary Based Coding¶
- 技术的关键在于抓住静态图像中的局部运动的方向性信息,运用HOG技术足够应付。
- MBH技术是在HOG技术上的改进,HOG技术强调单元之间的重叠,而MBH技术则相对隔离,这样在需要通过最小可能架构时,MBH明显优于HOG。
Internal/Relative Dynamics Based Coding¶
- 由于绝大多数的有效信息在第一步中已经被获取,因此这一步的主要任务是获得相对互补信息,可以通过一对之间的联系来获得信息。
- 实际运用中运用一对向量作为angular voting,其中的x y的推导被大规模的空间差异取代。
Descriptor Parameters¶
- 最多81个histogram bins per cell,再多会导致hard negatives数量减少,在re-sampling过程中会降低其精确度。
- bin size对不同的识别器影响不同,对综合识别器同样有影响。
- 归一化参数上,L2 normalization起到的效果最好。
载入中...