基于机器学习的行人检测

 2022-01-18 12:01

论文总字数:23534字

目 录

第1章 绪论 1

第2章 行人检测的流程及评价标准 2

2.1行人检测整体流程 2

2.2 实验采用的样本集 2

2.3行人检测的评判标准 3

2.4行人检测实验的环境 4

第3章 基于HOG特征的行人检测 4

3.1 HOG特征提取 4

3.1.1 HOG特征提取的流程 4

3.1.2 HOG特征提取代码实现 6

3.2支持向量机(SVM) 8

3.2.1 SVM的最优超平面 8

3.2.2 SVM核函数 10

3.2.3 训练SVM 11

3.2.4 线性SVM分类器检测 12

3.2.5 重叠块归一化对检测结果的影响 14

3.2.6 高斯核函数SVM分类器检测 15

3.2.7 提取难例后再训练 16

3.3 实验结果分析 16

第4章 总结与展望 17

4.1 实验总结 17

4.2 实验的不足与展望 17

参考文献: 19

致谢 20

附录 21

基于机器学习的行人检测

陈翔

,China

Abstract:Aiming at the problem of pedestrian detection in a single static image, a pedestrian detection method based on the feature extraction of Histograms of Oriented Gradients (HOG) is proposed in this paper. The method firstly classifies the training data sets of large samples into pedestrian positive sample sets and non pedestrian negative sample sets. Secondly, they are extracted hog feature respectively and then all extracted hog feature descriptors are used to train a linear support vector machine (SVM) classifier and a Gaussian kernel SVM classifier, Let these two SVM classifiers "learn" how to categorize pedestrian and non pedestrian images. Finally, the Hog feature descriptor of all the pictures in the test sample set is extracted, pass to these two trained SVM classifier and let them judge whether the picture is pedestrian picture or not pedestrian picture, at the same time calculate the detection rate, false alarm rate and compare linear SVM classifier and Gaussian kernel function SVM classifier in the detection of the advantages and disadvantages, Finally, the performance of the pedestrian detection method is evaluated.

Keyword:Machine Learning;Pedestrian detection;Histograms of Oriented Gradients;Support Vector Machines

第1章 绪论

行人检测作为物体检测的一个分支,如今已经成为计算机视觉领域研究的热门方向之一。毫无疑问,行人检测具有很大的价值。首先是它的应用价值与市场价值,这体现在以下方面:在交通领域中,可以在十字路口、事故多发地段、车站进出口等行人密集区域进行行人检测,对相应的工作人员或者行人进行预警,保障交通安全与行人的生命安全;在智能驾驶领域中,一个良好的行人检测技术有助于快速地检测出行人,能促进无人驾驶技术更好更快的发展,因此行人检测技术在人工智能领域中具有很大的市场价值;在公共安全领域,将行人检测技术应用于对小区、街道、公共场所的安全监控,有助于保障公共安全与人民的财产安全、人身安全。其次是研究价值,行人检测相比于其他的物体检测,具有更大的难度。复杂的行人姿势、千差万别的穿着、多变的背景情况、其他物体对行人的遮挡、行人之间的互相遮挡、图片拍摄的视角以及采集图片时的光照都给行人检测带来了很大的外部干扰,导致对静态图片进行行人检测经常会发生漏检和错检的现象。因此行人检测相比于其它的物体检测,更具有研究价值。

目前的行人检测方法主要分为以下三种:

第一种是基于特征提取的方法,这种方法的基本思想是:将行人看成一个整体,用一个矩形框把行人框出来,然后提取该矩形框图片的各种静态特征,如Harr小波特征、梯度方向直方图(HOG)特征、纹理特征(LBP)等,用这些静态特征组成的特征描述子来描述矩形框图片中的行人;检测的时候,利用一个与前面的矩形框大小相当的检测窗口,从被检图片的左上角依次向右、向下遍历整张图片,每得到一个检测窗口的特征描述子,就与之前提取的行人图片的特征描述子进行比较来判断被检图片中是否存在行人。这种基于特征提取的方法框架简单,易于实现。如果特征提取的比较好,最终得到的结果也将比较理想。但是这种方法将行人作为一个整体处理,忽略了人体呈现的非刚性特征(人的姿势多变),所以这种方法在处理遮挡、行人姿势多样等方面显得不够灵活,常常出现漏检。

第二种是基于多部位的方法,这种方法的基本思想是:由于整个人体呈现出非刚性的特征,但是人的各个部位,如头部、左臂、右臂、躯干、左腿、右腿等,却呈现出刚性的特征。所以可以通过把人体划分为各个部位,检测出每个部位的变化,然后再将每个部位的检测结果整合起来,从而得到了最终的检测结果。这种方法的典型代表是自适应增强算法。基于多部位的方法能够很好地解决在行人检测中经常出现的遮挡以及行人姿势复杂多样的难题。但是这种方法的不足之处在于各个部位应该如何定义以及如何整合来自各个部位的检测结果,从而生成最终整幅图像的检测结果。

剩余内容已隐藏,请支付后下载全文,论文总字数:23534字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;