项目

一般

简介

Research on Robust Local Feature Extraction Method for Human Detection

Abstract:

  • 这篇文章的目的在于发现更为强大的特点分离算法,算法主要将图像视为高维度特征向量来编码,用来支持高精度的人物识别。
  • 第一种更为有效的方法是HOT,其通过斜率信息和特点信息进行识别,此外,它是通过中间级进行识别,比从像素级更为有效,因为其考虑了像素与像素之间的关系。
  • 第二种有效的方法是MB-HOT,其主体与HOT大致相似,不同之处在于其考虑了动作信息和外表信息,使得识别率更高,同时在原有中间级的基础上,改进了它的可变性,因此更为有效。当利用GPU单元时,可以满足实时需求的时间需要。
  • 另一种是静态人物识别器,其再识别级前,通过估计和提取信息,使得背景信息干扰降低。

介绍:

  • 图像认识和物体识别:
    1. 其目的在于解释图像信息和提取有价值的信息。它是一个高层次的视觉任务因为它包含了图像语义上的知识。低层次的图像处理针对原始图像数据比如光强度或者色度。而高层次的计算机视觉针对包括物体位置,大小,形状和其多元关系的具体信息。
    2. 图像认识主要关注:图像的表现,图像的认识和图像的识别。因此一个图像识别器主要分为两部分:一为图像特点;二为识别算法,用来确定分级。
  • 人物识别:
    1. 其实用性非常明显:可以运用在包括相机中的图片分类整理,智能汽车识别系统(避免事故),监视系统等。
    2. 其需要克服的困难包括:识别背景信息,在MISS率和错误率之间取平衡以及对于光照的适应能力。

HOT技术:

背景信息:

  • 目前人物识别技术面临的困难主要是:1 人物图像差异大 2 衣服和皮肤等因素 3 复杂的背景
  • 通过斜率信息和特点信息的结合可以更有效的识别人物,因此主要的研究方向就是从这两者开始入手
  • 人物识别算法可以被分成三类: 1 局部特点算法 2 局部表现算法 3 凹槽匹配算法。

HOT定义:

  • 在HOG和COV的基础上,加入了特点信息,算法上突出一个模块的作用,其可以反映出一个SHAPE的信息,而并非一个一个独立的点,当与图像进行对比分析时,通过两个公式来选择最匹配的模型和选择其基本像素。这样可以勾勒出人的大致轮廓。
  • 加入瞄准技术,提高识别效率, 其工作原理是在一组最差,最不匹配的模块中选择出相对最匹配的一块,并且同时采用级联否定方法,当一张图像进入时,必须同时满足所有的分级器才能通过,否则将被直接否定。

实验结果:

  • 结果与之间的文章中基本类似,这边不再赘述,针对一些不同以及补充的地方进行说明:
    1. 针对识别器的表现,这里运用了DET来进行评价,其大致评价方法通过对精确率,错误率,回叫率的数值统计是给出一个最终值,越高说明其识别器性能越好。
    2. 交互效度分析,用来选择C值和g值(对子窗口的大小和子窗口之间的线条数量有影响),只有瞄准的图像才会运用这种方法,因此对实验非常重要。

MB-HOT技术

  • 定义:
    在HOT技术的基础上,即在中间级的基础上进一步改善其技术,从原先的3X3像素,提高到3X3块,每一块中可以有SXS的像素,这样不仅具有原先的级别,更能通过改变块中的像素个数获得其他的级别,这样通过不同级别的信息的整合,获得更为精确的信息。

基于动作的识别器:

  • 定义:
    通过计算当前帧和前一帧的光波来识别。此外,其针对的往往是局部的信息,因为基于外表的识别技术已经将人物的大致轮廓进行识别,这里没有必要重复工作,因此更多的是针对细节信息,例如脚等。还有一个原因是抓相对动作可以减小由于相机的抖动造成的光波减少。

Mean Shift Clustering Method:

*定义:
由于使用了子窗口的识别技术,不同大小的子窗口在识别同一个人物时,或许会重复识别,因此需要运用此项技术来识别出人物是否重复。其主要算法是:1 固定一个窗口,其中包括了每一个数据点。 2 计算其中的数据的平均值。 3 对所有的窗口进行同样的处理,直到所有的窗口都一致。
MSCM将特点空间看成一个概率密度方程,高密度区域代表最大值或者最大模式,对每个数据点在局部估计密度上进行斜率测量,直到其一致。

加速方法:

背景和相关信息:

  • 由于在实际应用中,计算机复杂度仍然是最主要的限制因素,这是因为运用了子窗口扫描技术后,成千上万不同大小的窗口对同一帧进行扫描,因此需要运用某些手段使其复杂度降低。有许多方法能够实现这一目的,而这其中,GPU技术最优。

静态人物姿势特点:

  • 外形信息是这项技术中最关键的一点,作为最主要的区分线索。在识别级之前,我们可以通过模块匹配或者结构认识等方法来预测人形,获得边缘信息。
  • 人形预计被认为是一种多输出复原技术。oriented gradient是其中被广泛运用的技术,它的主要工作模式是将子窗口的数量减少。
  • axle line在特点提取中起到了非常关键的作用,它用来给出人形的大致形状。
  • 一般将root point定位在人的臀部,因为其是在人体的中间,更易于与其他部分进行联系,此外,臀部相对于其他部位更容易定位,因此也更容易将预计的root point的误差最小化。