基于语音的测谎技术研究

 2022-05-06 08:05

论文总字数:28924字

摘 要

基于语音的测谎技术是测谎技术的一个重要分支。随着人工智能的发展,对于测谎技术的研究是十分必要且重要的。测谎对于检查公安局、海关和机场等地的不法分子有着极为重要的意义,从而对于整个社会的长治久安也意义非凡。区别于基于脉搏、脑电和皮电活动等其他测谎技术,语音测谎属于非接触式测谎技术,实际应用方便,具有很大的优势。

本文主要完成了以下几个方面的工作:

1.建立了汉语测谎语料库。语音测谎与语音情感识别关系紧密,而跨语言情感识别与国家文化背景有关,是十分困难的,因此建立一个汉语测谎语料库是很有必要的。

2.介绍了提取语音情感特征的方法。深入研究了语音的时频特性,并提取了包含基因频率,共振峰,梅尔倒谱系数等在内的五种特征及其统计特征,详细说明如何在MATLAB下提取这些特征。

3.完成了基于支持向量机的语音情感识别和测谎系统。详细阐述了支持向量机的原理,以及如何在MATLAB中使用SVM完成多分类。可以使用命令行调用程序,输出与语音时长相关的语音情感向量,可以在基于自制的汉语测谎语料库下完成测谎。

关键词:语音测谎,构建语料库,语音情感识别,语音情感特征提取,支持向量机

Abstract

Voice-based lie detection technology is an important branch of lie detection technology. With the development of artificial intelligence, the research of lie detection technology is very necessary and important. Lie detection is of great significance to the inspection of illegal elements in public security bureaus, customs and airports, and thus to the long-term stability of the whole society. Different from other lie detection technologies based on pulse, EEG and skin electrical activity, voice lie detection belongs to non-contact lie detection technology, which has great advantages in practical application.

This paper mainly completes the following aspects:

1. A Chinese lie detection corpus has been established. Voice lie detection is closely related to speech emotion recognition, and cross-language emotion recognition is very difficult because it is related to the national cultural background. Therefore, it is necessary to establish a Chinese lie detection corpus.

2. The method of extracting emotional features of speech is introduced. The time-frequency characteristics of speech are deeply studied. Five features including pitch frequency, formant, Mel Frequency Cepstrum Coefficients and their statistical characteristics are extracted. How to extract these features in MATLAB is explained in detail.

3. The speech emotion recognition and lie detection system based on Support Vector Machine is completed. The principle of Support Vector Machine (SVM) and how to use SVM to accomplish multi-classification in MATLAB are described in detail. The command line calling program can be used to output voice emotion vectors related to the length of speech, and lie detection can be completed under the self-made Chinese lie detection corpus.

KEY WORDS: Phonological lie detection, Corpus construction, Speech emotion recognition, Speech Emotional Feature Extraction, Support Vector Machine

目 录

摘 要 I

Abstract II

第一章 绪论 3

1.1 项目背景及意义 3

1.1.1 测谎技术的研究意义 3

1.1.2 测谎技术的发展过程 3

1.1.3 各类测谎研究方法 4

1.2 语音测谎技术 5

1.2.1 语音测谎技术的优势 5

1.2.2 语音测谎技术的发展 5

1.2.3 语音测谎的难点 6

1.3 本文的主要工作与章节安排 8

1.3.1 主要工作 8

1.3.2 章节安排 8

第二章 测谎语料库的构建 9

2.1 测谎语料库的设计流程 9

2.2 测谎语料库的建立 10

2.2.1 测谎题库的设计 10

2.2.2 受试者的选择 10

2.2.3 录制细节 10

2.2.4 录制设备和场地 10

2.2.5 录制过程 10

2.3 语料库的加工处理 11

第三章 语音情感特征提取 12

3.1 语音信号预处理 12

3.1.1 预加重 12

3.1.2 分帧加窗 12

3.2 基本特征 13

3.2.1 基音频率 13

3.2.2 短时能量 15

3.2.3 短时平均过零率 16

3.2.4 共振峰 16

3.2.5 MFCC 17

3.2.6 语谱图 19

3.3 特征向量 20

第四章 基于SVM的语音情感识别和测谎 21

4.1 支持向量机原理 21

4.1.1 线性可分问题 21

4.1.2 线性不可分问题 22

4.2 SVM模型参数选择 24

4.2.1 核函数概念 24

4.2.2 常用核函数 24

4.2.3 模型选择 25

4.2.4 二分类和多分类 25

4.3 LIBSVM 27

4.4 基于SVM的语音情感识别与测谎方案 29

4.4.1 语音情感识别方案 29

4.4.2 语音测谎方案 30

第五章 实验与结果分析 31

5.1 基于MATLAB的语音情感识别 31

5.1.1 特征向量的提取 31

5.1.2 CASIA库数据集 31

5.1.3 训练与预测 31

5.1.4 实验结果 33

5.2 基于MATLAB的语音测谎 35

5.3 生成可执行文件 36

5.4 与测谎系统的对接实验 38

第六章 总结及展望 39

6.1 总结 39

6.2 展望 39

参考文献 40

致 谢 42

绪论

项目背景及意义

测谎技术的研究意义

机器自动检测欺骗性言语对执法部门和其他政府机构尤其有意义,例如,在评估来自世界各地大使馆和领事馆的举报人的报告时,在识别过境处的潜在欺骗行为时,以及作为一种反欺诈工具时。说谎是指有意隐瞒事实真相并误导其他人的行为。测谎,即测试被测人是否说谎,是对口头陈述的评估,目的是揭示可能的故意欺骗。它可以指使用询问技术以及记录生理功能来确定是否说谎的技术。

在特殊的情况下,去除善意的谎言或者礼貌的回答,例如评估一个人“你根本不胖”,撒谎在大多数情况下,这都是一种需要坚决抵制的行为。在人们的日常生活中,说谎意味着欺骗,这是不道德的,谎言会造成人与人之间的信任危机,谎言严重时会影响社会稳定。现在社会上很猖獗的微信诈骗和电话诈骗都对人们的日常生活造成了很大的困扰和危害,还有其他欺诈性的犯罪行为如传销,是部分人为了赚钱的说谎行为,被骗的人基本都会破产甚至家破人亡。另外在机场安检时犯罪分子走私和贩毒时的谎言如果无法被识破更是会严重影响到国家社会的长治久安。

剩余内容已隐藏,请支付后下载全文,论文总字数:28924字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;