Accurate Human Detection by Appearance and Motion¶
Summary:¶
1. 这篇文章主要介绍了两个人物识别的新方法:基于外表的识别和基于动作的识别。- 基于外表的识别: 通过MB-HOT技术实现,集合灰度价值信息和斜率价值信息。
- 基于动作的识别: 通过光波领域实现。
2. 两个方法共同作用时,可以减小错误识别率,同时,利用GPU可以加速计算时间。
Introduction:¶
- 这项技术的实用性在于:通过运用此识别技术,其自动行人识别技术能大大降低行人遇到交通事故的几率。
- 在模块匹配,编码方法和基于知识的人物识别方法中,后者有更好的表现,其识别能力更强,更善于寻找特点和更有效的瞄准方法。
- 在识别特点时,运用到三方面的技术:特点信息,斜率信息和动作信息(相对于第一篇论文是新的信息)。
- 目前技术的瓶颈在于计算机复杂度。(子窗口数量过多)
- 利用GPU技术降低计算机复杂度,其原理是利用了图形芯片产品(显卡)。
相关工作:¶
- 基于知识的人物识别方法对人物识别非常有效,它通过对大量的瞄准图像提取信息,得到更为精确的结果,但过多的图像导致了识别时间的上升,因此,需要在这两者之间进行权衡。
- 基于编码的方法类似于前一篇论文,利用感兴趣点周边的补丁构成一个编码集,并通过这个编码集来寻找最合适的点,关键在于:1 如何寻找关键点。 2 补丁的大小需要慎重选取。
- 基于凹槽匹配,利用人形模板去图像中最适合,最匹配的边缘映射。(类似第一篇论文)
- 基于动作的识别技术,利用广播来直接瞄准。
MB-HOT 技术分析:¶
定义:¶
相对于HOT技术来说,两者同样是在中间级上进行图像处理和分析,但是HOT的中间级模块只能是3乘3,而MB-HOT技术中的模块可以进行任意的分割,即K乘K。这样通过不同等级的信息的汇合,从而得到更为精确的图像信息。
基于GPU的装置:¶
- 特点:
加速装置识别时间,使实际运用时更为实用。
- 模块介绍:
- 减小规模:目的是测量不同大小的人物形状,分成16级。
- 斜率计算:用来获取刻度金字塔中每个分级图像中像素的信息。
- 地形表格计算:通过方程和算法,确定每个模块的值,并将其填入表格中。
- 柱状表格计算:转换作用,用于将输入图像转换成柱状图,反应模块数量。
- 特点计算:通过不同字子窗口中的信息来计算图像特点。
- 线性 SVM:能够有效的处理大量的数据,并且能够处理多级的数据。
基于动作的特点技术分析:¶
- 通过当前帧和前一帧的信息,从光波中提取特点信息,与HOT不同,光波是二维的,此外,基于动作的特点关注抓取相关时刻人物的身体轮廓,原因有2:1 通过外形提取全局动作边界信息 2减少照相机摇动造成的光波消耗。
- 通常用来测量动作的方法是用高密度的光波,但前提条件是,前后两张图像中光强差异与动作差异要小,否则效果不好
- 针对测量动作对算法的改进:
- 由原先的一维变为二维,因为光波值是二维的。
- 由于基于外表的特点识别已经对动作边界信息进行了提取,这里不再重复工作,而是关注局部动作信息,假设脚的宽度是一个单位大小,那在动作变化不明显时,可以通过观察这一单元的变化来提取信息并区分与背景的差别,此外还可以减少由于相机抖动引起的误差。
实验记录与结果:¶
- 实验1:
主要进行对比实验,与HOG,HOT,MR-HOG和COV进行对比,发现其性能更高,虽然与COV近乎相似,但考虑到COV中运用了不同的瞄准方法和可变子窗口,会在一定程度上提高其效率,因此认为在相同条件下,MB-HOT会胜于COV。
- 实验2:
对比基于动作的特点提取和其他的特点提取后发现,此方法最佳。
- 实验3:
对录像中的人物进行识别,运用2个识别装置,一个是动作识别器,另一个是静态识别器,通过识别获取可能值,当可能值大于一个阈值时,则认为其有人。但这个方法在测量静态人物时,会有问题,因为静态识别器在测量静态人物时,会给出一个较低的可能值,从而发生MISS。
- 实验4:
主要关注测量时间,结果表明,MB-HOT技术可以满足要求。
心得体会:¶
- 这篇文章主要讲述如何通过外表和动作识别人物,方法与前一篇文章大致相同,都是通过斜率信息和特点信息进行识别,不同之处在于,其还对动作信息进行了提取。
此外MB-HOT技术相对于HOT技术而言,在算法上有明显区别,首先其模块不再是固定的3X3,而是一个随机的KXK的模块,这样在获取信息时,可以得到不同等级的信息,从而更全面的了解图像。
之前的HOT技术是一维判断,而MB-HOT中,运用到了二维判断,并且在提取特点时,不仅关注整体,还关注局部,强化了识别能力。