语音交互系统的研究与设计

 2023-10-25 09:10

论文总字数:15620字

摘 要

语音识别技术是现代生产生活中一种不可或缺的技术,与众多领域密切相关,其中包括信号处理、模式识别和人工智能等领域。

本系统实现了一种语音交互系统。设计以51单片机作为整个设计的核心,控制整个系统的运行操作,采用语音芯片LD3320对语音信号进行采集和识别。当系统接收到人下达的语音指令时,可以做出相应的回答并开始运作。本系统实现简单,实用性较强。

关键词: 51单片机,LD3320,语音识别

Abstract: Speech recognition technology is an indispensable technology in the present era, including signal processing, pattern recognition and artificial intelligence.

This system realizes a voice interaction system. The design takes 51 single chip computer as the core of the whole design, controls the operation of the whole system, and uses the voice chip LD3320 to collect and recognize the voice signal.When the system receives voice instructions, it can respond accordingly and start to operate. The system is simple to implement and practical.

Keyword: 51 single chip compute,LD3320,speech recognition

目 录

1 引言 4

2 语音识别技术 4

2.1语音交互的构成 4

2.2系统的预期功能 5

2.3系统的设计方案 5

3 系统的硬件设计 5

3.1 单片机模块 6

3.2语音识别模块 10

3.3整体实物图 11

4 系统的软件设计 11

4.1语音识别模块 12

4.2模拟器件控制部分 14

结论 15

参考文献 16

致谢 17

附录A 18

附录B 18

1 引言

在如今这个快速发展中的时代,生活着的每一个人想要获得更好的生活,赢取更好的未来,因此每个人都在为这个目标而进行不懈奋斗和不断创新。正是人们的这种坚持奋斗和创新精神,不仅仅促进了个人的进步,更是极大地推动了社会的发展。自18世纪60年代英国发起第一次工业革命以来,机器作业开始发展并逐渐代替手工生产。到如今,机器人逐渐开始帮人们处理或简单或复杂的工作,节省了较大的人力物力资源。在长期的技术创新中,生活的智能化开始变成人们的追求。智能化的生活离不开人机交互,其中最为核心的就是语音识别技术[1,2,3]

语音识别技术,简单来说其实就是利用计算机将语音信号自动转换为文本的一项技术。这项技术同时也是机器理解人类言语的第一个也是很重要的一个过程。这一技术的研究开始于上个世纪五十年代,近60年来,随着世界各国的逐渐重视,新的研究理论以及成果不断被提出且运用于实际。我国的语音技术研究较之发达国家稍晚,但随着国家科技攻关计划等一系列计划的实施,我国的语音技术开始赶超并形成了一定的竞争力。语音识别技术在当今社会中必不可少,与很多领域都息息相关,例如信号处理、模式识别、人工智能等等。语音交互就是机器对人发出的自然语言指令进行理解并识别,将其转化成机器语言,最后再将机器语言进行自然语言的转化并输出的过程。

51单片机是所有与Intel 8031指令系统兼容的单片机的总称,其代表型号是ATMEL公司的AT89系列。该系列单片机抗干扰能力强,功耗低,且运行速度快,可以作为核心处理器来处理信息和控制其他设备,同时价格比较低廉,性价比很高,所以在很多系统中,都有其应用[4]。有了相应技术的配合下的51单片机,可以为成功地为此次语音交互系统的设计进行模拟。

智能化系统的出现,很大程度上提升了人们的幸福感,符合现代人的理念,相信在不久的未来,它将会普及到每一个家庭之中,真正让每一个人都享受到科技的服务,智能的生活。

2 语音识别技术

2.1语音交互的构成

语音交互系统主要由以下几个模块构成:

语音识别模块:把用户输入的语音文件转换成机器可理解的文本文件。

语言解析模块:分析语言识别的结果,理解文本信息的内涵。

语言求解模块:进一步分析理解后的文本信息,解决问题。

对话管理模块:记录语音数据,在语音数据库中进行比对

语言生成模块:语音数据匹配后,将其转换成文本信息。

语言合成模块:将文本信息转换成语音输出。

2.2系统的预期功能

本设计中要求语音识别采用LD3320,完成语音命令的采集与识别,并将结果传送给单片机,利用继电器模拟相应的器件;用单片机控制整个系统。可以达到预期的功能。

语音交互系统的预期功能是:当对着麦克风下达一个命令时,相应的继电器模块的指

示灯会亮或者灭并且语音回复“收到,马上打开/关闭”。同样应用到现实中,所实现的功能也应该是当要说出一个命令时,相应的器件会语音回复并自动执行相应的操作,极大地减少了人为操作,让生活变得智能化。

2.3系统的设计方案

本设计综合性相对比较高,要软硬件相结合。解决了软件问题,还需要知道系统的硬件是如何工作的。其工作过程:语音交互系统由单片机、语音芯片LD3320、麦克风以及语音播报和继电器等硬件组成。自然语音输出,经麦克风收集后,传入语音芯片之中,其内部已经放置完好语音列表,将新输入的语音与芯片中早已放置好的语音列表进行比对,如果语音比对成功,则推动相应的继电器开合,从而来模拟系统的实现过程。系统的设计框图如下图2-1所示。

图2-1系统设计框图

3 系统的硬件设计

系统的硬件设计重点关于两个方面:单片机模块、语音识别模块。单片机模块采用应用较为广泛且实用的STC89C52单片机,语音识别模块采用LD3320语音识别芯片,电源模块对整个系统进行供电,麦克风则负责收集语音信号并将之送入语音芯片之中,继电器模块则是负责模拟具体的器件控制,可外接器件。有了以上这些硬件的选择及设计,语音交互系统原理图如图3-1所示:

图3-1 系统原理图

3.1 单片机模块

3.1.1单片机的简介

单片机全称单片微型计算机,即将计算机的部分进行微型化,使其可以形成集成电路,集成在一块芯片上,便于操作。单片机内含微型处理器、存储器、I/O端口、中断系统、复位系统等。它本身就是一个嵌入式系统,同时也是其他嵌入式系统的核心[5,6,7]。关于其内部结构的简介如表3-1所示。

表3-1 单片机内部结构简介

名称

简介

微处理器(CPU)

8位,其中包括了运算器和控制器

数据存储器(RAM)

可以放数据,内存128B。最大外扩为64KB

程序存储器(ROM/EPROM)

用来放程序,最大外扩64KB。

并行I/O口

有4个8位并行I/O口(P0、P1、P2、P3)

串行口

有4种工作方式。可以与其他单片机进行连接,实现更加复杂的操作

定时器/计数器

有2个16位定时器/计数器。

中断系统

具有5个中断源,2级中断优先权。

特殊功能寄存器(SFR)

一共有21个。

上图介绍了单片机的内部结构,在这里值得说明的是51单片机有很多种不同的型号。它们的主要分别在于存储器的不同。例如,8031芯片内是没有程序存储器的,但是其他型号的芯片里有程序存储器。

剩余内容已隐藏,请支付后下载全文,论文总字数:15620字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;