基于HMM语种辨识技术的研究

 2023-02-21 08:02

论文总字数:18713字

摘 要

在过去的十多年间,随着科研人员的不断研究探讨,语言辨别技术得到了飞速发展,开始从实验室走进人们的生活,体现在各种电子产品,工业,通信,医疗,家居智能等各个领域中。

通过语音辨别技术,人们可以与机器进行无障碍交流,这是一项极富有挑战性和充满前景的工作。作为一门综合性极强的学科,它不仅与语言学,声学息息相关还包括软硬件的实现可能。所以它经过60余年的不断研究和创新,语音辨别正逐步走向成熟。

本文是基于隐markov模型的基本原理而进行的一项初步研究。研究的最终目的是完成一个基于隐markov模型的小词汇量的孤立词的语音辨别流程。本文中介绍了语音辨别的发展历程,语音辨别的基础理论,和语音数据的前端采集,语音预处理,建立隐markov模型,并详细解释了HMM的三大基本算法(前向-后向算法,viterbi算法,baum-welch算法),文章最后经过作者的理解,解释了整个流程的不足之处,并提出了可以改进的地方。

在该流程中,第一步是要得到语音信号的LPC倒谱系数,第二步是对Mel进行变换得到Mel倒谱系数,最后建立隐markov模型,该系统的基本模型是采用四状态无跨越左右的连续密度HMM模型。

模型训练及测试的语音库包括23人,共3220个语音数据。测试结果表明,在相对安静的环境下,其平均识别率达到80%以上。本文最后对实验结果进行了讨论。

关键词 隐markov模型 语音辨别

A Speech Recognition Method Based On Hiddend Markon Model

Abstract

In the past 10 years, with researchers will continue to study, language identification technology has been rapid development, start from the laboratory into people"s life, reflected in a variety of electronic products, industrial, communications, medical, intelligent home fields in.
Through voice recognition technology, people can be barrier free communication with the machine, it is a very challenging and promising work. As a comprehensive discipline. It not only with linguistics, acoustics is closely related to the included software and hardware implementations may. So it after more than 60 years of continuous research and innovation, speech discrimination is gradually moving towards maturity.
This paper is based on the basic principle of hidden Markov model and a preliminary study. The ultimate purpose of this research is a based on Hidden Markov model for a small vocabulary isolated word speech recognition process is completed. This paper introduces the development of speech recognition, speech recognition based on the theory, data and voice of the front-end collection, pre speech processing, based on the hidden Markov model and explain in detail the HMM three basic arithmetic (before - after to algorithm, Viterbi algorithm. Baum Welch algorithm), finally after the author"s understanding, explain the whole process, and proposes the improvement.
In the process, the first step is to get the LPC cepstral coefficients for speech signal. The second step is the Mel transform Mel cepstrum coefficient is obtained, and finally establish the hidden Markov model, the basic model of the system is using four state across about continuous density HMM model.
Model training and testing of the speech database including 23 people, a total of 3220 voice data. Test results show that in a relatively quiet environment, the average recognition rate of 90% or more.

Keywords:speech recognition Hidden Markov Model Isolated word

目录

摘要 I

Abstract II

第一章 引言 4

1.1课题研究意义 4

1.2 语音识别技术的发展史概述 5

1.3语音识别方法简介 6

第二章 语音信号的前端处理 7

2.1输入端语音信号的特征采集 7

2.1.1语音信号的发音特征 7

第三章 隐马尔可夫模型 13

3.1markov链 13

3.2隐马可夫模型的基本概念 14

3.3 隐马尔可夫模型的基本算法 15

3.3.1 前向—后向算法 15

3.3.2 Viterbi算法 16

3.3.3 Baum-Welch算法 17

第四章 孤立词语音识别系统 19

第五章 语音识别系统的实验实现 21

第六章 总结 25

参考文献 26

第一章 引言

1.1课题研究意义

语音辨别技术(Automatic Speech Recognition,简称ASR)的应用已经成为一个具有竞争性的新兴高技术产业。语音辨别技术是追随现代科技的步伐,特别是计算机的发展,为语音识别提供了软件技术支持,在很大程度上解决了早期研究语音技术时出现的难题。在经过近几年语音识别技术的快速,语音识别技术已经广泛的应用到社会的各行各业,对于语音识别产品的需求表明了语音识别技术的关阔前景,而在国际社会,谁拥有较多的语音识别专利,就掌握更多的主导权。对语音识别技术的研究,各国特别是发达国家,都一直保持着高涨的热情,积极的投入人才和资金支持语音技术的发展。

对于国,对语音识别技术的研究更是刻不容缓,首先由于早期条件的限制,我国的语音识别技术工作一直处于缓慢的发展,而一些发达国家起步比我国要早,其研究成果一直处于国际领先地位,所以我们需要紧跟其后并超越之。其次,至80年代起,随着计算机应用技术的普及,汉字的键盘输入一直是国人起步学习计算机技术的硬伤,很大程度的阻碍了计算机在我国的普及应用,而语音识别的应用将会有效的缓解这种情况。我国作为制造大国,必须掌握其核心技术,才能不受制于人,从国际市场中获得最大的利益。 

剩余内容已隐藏,请支付后下载全文,论文总字数:18713字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;