项目

一般

简介

Fast Human Detection Using a Cascade of Histograms of Oriented Gradients

Abstract:

  • 相对于之前HOG中固定的模块大小和数量,本文章提出了用可变大小的模块来扫描图像,使得识别时间有显著改变。
  • 老方法的缺陷在于:其只能处理320X240的图像,每幅图像的识别窗口固定为800个,且固定的窗口大小在第一次识别时难易捕捉到关键信息,而新方法则有800-1200个,在第一级时使用可变的(一般会大于之前的窗口)窗口来使得处理速度提高。
  • 从算法角度看,这是通过合并cascade of rejector来实现。

The Dalal-Triggs Algorithm:

  • 此算法将识别窗口分割成许多个块,每个块由2X2个单元组成,每个单元由3X3个像素组成,块与块之间可以相互重叠。
  • 每个单元含有一个9-bin的HOG,每个模块包含一个链接所有单元的向量。因此一个模块可以被一个36-D的向量来表示。
  • 它有三个关键部分:1 以HOG为基础模块 2 运用高密度的HOG来呈现一整个识别窗口 3 运用归一化使得相邻的单元相联系,而并非单独的绝对值。
  • 它的缺点在于: 模块规模相同,容易错失不同规模上的信息,并且窗口大小太小,容易错失较大的图像的信息。当添加不同规模的窗口时,

快速人物识别框架:

  • 首先针对之前的缺点进行改进,增大特点空间,使得模块中可以有更多的模块可以选择,并且,在第一级中运用较大的模块,可以抓住更多的信息。
  • 使用多规模模块的好处在于:1 图像本身有价值的图案可能是千变万化的,因此,不同规模的模块可以捕捉更多的信息。 2 在更多的模块中一定会有更多的模块与人物的某些部位匹配,例如人的腿,这样在识别时速度更快,而原先的小模块不一定能够做到。
  • 先假设错误率为1,通过循环判断,找出最差的一个分级器,其就是整个的错误率。

实验结果和分析:

  • 通过与老方法比较结果可得,其实际识别能力与老方法持平,在某些情况下计算机复杂度下降,其识别时间下降(通过一个识别窗口中的模块数量就可得之)。
  • 对于不同窗口大小的实验分析中:小窗口包含了最少的信息,并且增大窗口对于获取识别信息有非常明显的帮助。
    × 通过进一步的实验发现,在错误率最小的5个窗口中,表现最好的窗口的大小与人物外形的大小基本吻合,不仅如此,那些针对人物某一部分的模块,例如手脚等同样有较低的错误率。