基于高阶累积量的重叠语音分离的研究

 2023-04-15 09:04

论文总字数:16549字

摘 要

本篇毕业设计论文与语音信号有着密切的关系。主要研究的是重叠语音的分离。并对这项技术的研究背景和意义做了简要的介绍。

本文从汉语语音学的角度,阐述了语音的声学特性。并且从噪声这一方面,解释了重叠语音中所需要消除的那部分语音的特征。

本文介绍了高阶累积量的原理和性质。并且利用软件MATLAB以程序的形式将重叠语音的分离算法和数学方面的理论依据结合起来。

介绍了语音信号的产生,和语音识别寂声段和语声段的语音的方法,以及语音信号如何利用高阶累积量分离重叠语音。

最后介绍了实验过程和实验结果,并且对其进行了分析。

关键词:高阶累积量;语音识别;重叠语音

Abstract

This graduation design paper has close relationship with speech signal.The main research is the overlapping speech separation .And the research background and significance of this technology are introduced.This article from the perspective of Chinese phonetics

This article from the perspective of Chinese phonetics, expounds the acoustic characteristics of speech.and from this noise,Explains the overlapping speech needed to eliminate the part of speech.

This paper introduces the principle and properties of higher order cumulants.And using the software MATLAB to program in the form of the overlapping speech separation algorithm and combined with the theoretical basis of the mathematics.

This paper introduces the generation of speech signal,speech recognition silence segment and voice segment method of voice,and how speech signal using high-order cumulants overlapping speech separation.

Finally this paper introduces the experimental process and experimental results,And analyses it.

Key words: high-order cumulants ;speech recognition;overlapping speech

目录

摘要 III

Abstract IV

第一章 绪论 6

第一节 语音信号处理的简介 6

第二节 高阶累积量简介 7

第二章 语音信号 8

引言 8

第一节 汉语语音学 8

第二节 噪声简介 9

第三节 语音信号的统计特性及识别 9

第三章 高阶累积量 12

第一节 高阶矩高阶累积量定义 12

第二节 高斯过程的高阶累积量 14

第三节 高阶累积量的性质 16

第四章 实验及其分析 19

第一节 预处理 19

第二节 基于高斯过程的寂声段和语声段识别 19

(1)寂声段和语声段 19

(2)原理 20

(3)实验结果 20

第三节 重叠语音的分离 21

(1)分离原理 21

(2)分离算法 23

(3)实验结果 25

结论 28

致谢 29

参考文献 30

第一章 绪论

第一节 语音信号处理的简介

语音是人们在社会生活中交流的基础,人们通过语音传递着信息。而在日常生活中,不同的语音同时被人们接收时,往往会引起人们无法接受准确的信息。因此,就需要对语音进行处理。语音处理大致包括了研究语音发声过程,语音的自动识别,语音信号的统计特性等处理技术。

语音的信息主要是由语音的参数来表达,因此对于语音信号的处理,信号参数的分析就显的十分重要。这些参数体现了语音过程中的平均特性,但语音变化是十分迅速的,是一个非平稳随机的过程。[1]所以在20世纪80年代后,语音信号非平稳参数分析方法的出现就显的十分重要,并且在语音信号处理领域取得了一定成绩。

语音处理是一门比较庞大的学科,涵盖了许多方面的知识。总的来说,包含了语音信号的产生,语音信号的识别和分离处理等方面的技术。最早,人们从对人体发音器官的研究开始了解语音信号,并建立了一系列的模型。并且运用到了计算机之中,使语音信号的分析实现了跨越式的进步,更加方便和快速。其中比较关键的技术是语音信号的理解。最早出现的语音理解系统是HEARSAY,随着科技技术的发展,又出现了HAPPY理解系统。[2]运用到了一种叫做知识编译器的网络技术,可以集中各种知识。语音理解系统虽然已经运用到了人们的日常生活之中,但还有许多不足点,需要不断的完善。

对于语音的分析,目的是为了实现快速检索。而其本质是将语音的信息进行结构化处理,从而方便在计算机中对语音进行处理。对于语音分析,一般都是在能量比较集中的一些区域中进行,主要运用到了共振峰的幅度和其频率。[3]而语音分析中的共振峰参数可以由线性预测参数经过变换得到,线性预测参数则能体现语音信号的传输特性。

随着语音处理的发展,实用性的要求也逐渐提升。需要语音信号处理在噪声条件下依旧能够进行。因此,抗干扰的算法也涌现出来,例如快速搜索识别算法。

而在语音处理中,语音识别技术是重要的组成部分。语音识别技术可以将语音信息在计算机中可读。语音识别技术的经历了从基于标准模版匹配到基于统计模型即的过程。[4]目前对于语音识别比较流行的算法是矢量算法,它的特点是对于语音的识别速度较快。

Baum等人在1970年前后提出了HMM理论,随后HMM理论被广泛应用在语音处理方面。在九十年代,将HMM理论与神经网络技术相结合对于语音处理也具有一定的发展意义。[5]

现如今语音信号处理被广泛应用于通信和国防等部门。例如频响修正和补偿技术,噪声抵消和干扰抑制技术以及数据编码压缩技术就大大提升了通信质量。频响修正和补偿技术可以改善语音信号的质量;噪声抵消和干扰抑制技术可以改善通信条件;数据抵消和抑制技术可以提高效率。[6]

第二节 高阶累积量简介

最初对于语音信号的处理是认为语音信号是平稳的,服从高斯分布的。然而随着语音信号处理技术的发展,人们开始意识到在实际生活中,语音所包含的各种信号是非线性,非高斯的。对于这种非高斯信号的处理,就不能采用当初的方法,就需要用到高阶累积量。[7]运用高阶累积量对于非平稳的,变化速度快的,复杂的语音信号处理,具有十分显著的效果。人们可以利用高阶累积量从非高斯语音中把所需要的语音信息分离出来,这在过去是办不到的。

剩余内容已隐藏,请支付后下载全文,论文总字数:16549字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;