基于矢量量化的语种辨识技术的研究

 2023-02-21 08:02

论文总字数:17943字

摘 要

这个设计运用矢量量化知识使识别语种得到实现,对倒谱系数(LPC)和差值倒谱系数加以应用,辅以基音周期和与差值基音周期的混合特征参数,将他们合成为特征矢量集。识别实验是在一个语音库上进行的,语音库包含了中、英、俄、德4种语言。识别率平均水平为92%,

本篇文章分为四个方面:1.分析语音输入信号及提取特征参量;2.语种识别方法(VQ和HMM);3.软件的实现;4.实验成果。尽管近年来在语种识别领域获得了很多进展,但要找到更好的识别方案仍存在着一些困难。

关键词:语种识别;VQ;LPC;倒谱系数;基音

Abstract

A text-dependent language recognition system is researched on this paper, which is based on vector quantification (VQ) method. We choose cepstral coefficients(LPC), delta-cepstral coefficients, pitches and delta-pitches as the feature parameter set. The system is based on a speech library composed of 4 languages,Chinese、English、Russian、German. We get a high recognition rate with 92% .

This paper can be separated into four parts. First, we discusses the common used speech signal processing technology and how to get the feature parameters. Second ,we devoted to a discussion of some language recognition methods, including VQ and HMM-based recognition methods. The third part is about the realization of the language recognition system. Finally, we discuss the result of the language recognition research. Although many recent advances and successes have been achieved in the language recognition field, there are still many problems for which good solutions remain to be found. At the end of this paper, some possible improvements on the present system and the future possibilities are given.

Keywords: Language recognition; VQ; LPC; cepstral coefficients; pitches

目 录

摘要 I

Abstract 1

目 录 2

第一章 概述 3

第二章 语音信号分析及特征参数的提取 4

2.1 概述 4

2.2 预处理 4

2.3 语音信号的数字化 5

2 . 4 线性预测编码(LPC)分析 5

2.5 倒谱系数 7

2.6 本章小节 7

第三章 语种辨识方法 8

3.1 隐马尔柯夫模型(HMM) 8

3.2 矢量量化(VQ) 8

3. 2. 1 概述 8

3.2.2 矢量量化的基本原理 8

3.2.3 矢量量化的失真测度 11

3.2.4 LBG算法 11

3.2.5 初始码本的两种设置方法 12

3.2. 6 遗传算法优化码本——GAVQ算法 13

3.3本章小节 15

第四章 系统实现与实验结果 16

4.1 概述 16

4.2 系统的实现 16

4.2.1 语音库的建立 16

4.2.2 软件实现 16

4.3 实验结果及讨论 20

4.4 本章小节 21

结论 21

致谢 22

参考文献(References) 23

第一章 概述

自动语种识别(Automatic Language Recognition),一个困难又具有吸引力的课题。根据语音来推断语种是语言学中习以为常的现象。而如果使机器具有这种本领,则在相当广泛的范围内将会发挥作用。

然而。语种识别还面临很多问题。比如目前还无法探究能够唯一地携带语种识别所需的特征。根据所建立的模型来提取相应的语音参量,这是目前语种识别预处理方法的主要手段,与语音识别很是相似。若想短期内解决这些问题,是很困难的,需要靠突破科学基础研究领域、跨学科协作等等。困难虽多,自动语种识别在一些方面还是时有建树,在实用化方面有一定的进展。

目前这种技术主要分为两种:自动语种确认(Automatic Language Verification ,ALV)和自动语种辨认(Automatic Language Identification ,ALI)。从根本上讲,它们会根据一句或几句测试语种语句,提纯出能与参考模型比较的一些信息,这些信息和语种的本源特性相联系,由此便可以正确地判断。第一类是通过语言来确认,主要是通过特定参考模型和待识别模板的对比。系统仅会选择是或者不是。后者则不同,对系统的要求是辨认出输入语音是哪一种待考察语音。由于需要多次比较合判决,所以后者的误识率要大于前者。语种识别还有其他的分类方法,比如可以将语种识别分:文本(Text)无关、文本有关和文本指定型,划分依据是被输入的测试语音。文本无关语种识别不规定词汇,而文本有关则反之。当然这两种类型并不能囊括所有识别类型,比如如果把人无意识中的讲话内容事先纪录下来用来识别的话,很可能被装置错误识别。另外,在后者识别时,如果想要发音被系统接收,必须给定文本内容,这样当人对指定文本内容正确发音时,系统就会认可。

本设计属于与文本有关型的语种识别,并要求系统从待考察的多种语言中辨认出待识别的语音是哪一种。

目前自动语种识别的方法主要有基于参数模型的隐马尔科夫模型(Hidden Markov Models,HMM)方法和基于非参数模型的矢量量化(Vector Quantization,VQ)方法。[1]HMM在近年被广泛应用。如果训练的数据量较小时,两种方法之中后者(VQ)更为适合,实用性与简便性也比较突出。本次毕业设计,从语音信号预处理、语音识别的方法(主要为VQ)、识别系统的实现、实验结果的分析与讨论等方面,对语音识别进行研究与应用。系统可以基于语音库作语种识别,并能识别来自测试特征参数的效果。系统的语音库包括4种语言的语音文件。

第二章 语音信号分析及特征参数的提取

剩余内容已隐藏,请支付后下载全文,论文总字数:17943字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;