基于深度学习的神经网络机器翻译

 2022-07-11 08:07

论文总字数:33716字

摘 要

随着计算机学习领域的不断发展,越来越多的人关注了以机器学习,深度学习为背景的计算机视觉处理,语音识别技术,自然语言处理等领域都发生了重大的突破,越来越多的以此为基础的研究得以进展,人工智能已经渗透到生活中的方方面面。自然语言处理作为人工智能和语言学分支的学科,在语言工程和数据处理方面都有着广泛的运用,其中,机器翻译的研究在于将一种源语言转换到另一种目标语言。

本文首先阐述了机器翻译的背景知识,介绍有关机器翻译的发展和各类现有的机器翻译模型,并分析其中优劣,重点分析深度学习与机器翻译领域的交叉内容,介绍神经网络技术在机器翻译中的应用。

本文在了解神经网络机器翻译的基础上,基于序列到序列(Seq2seq)模型训练出一个机器翻译系统,详细介绍内部网络结构和编码解码方式,语料库首先选用测试英文-法文(en-fr)和英文-中文(en-zh)平行语料库,对系统进行测试,旨在了解原理的基础上加以实践证明,并贴出训练过程和结果分析。

最后,选用不同的网络结构进行试验,研究不同网络结构,超参数,不同大小的语料库对实验结果的影响,分析实验可以改进的部分,对机器翻译进行进一步评估,结合机器翻译历史,指出可以改进的部分。

关键词Seq2seq、神经网络、机器翻译、深度学习

Abstract

With the continuous development of the field of computer learning, more and more people have paid attention to computer vision processing, speech recognition technology, natural language processing and other fields in the field of machine learning and deep learning. Major breakthroughs have taken place. More and more The research based on this has progressed and artificial intelligence has penetrated into all aspects of life. As a branch of artificial intelligence and linguistics, natural language processing has been widely used in language engineering and data processing. The research of machine translation is to transform one source language into another.

This article first elaborated the background knowledge of machine translation, introduced the development of machine translation and various existing machine translation models, analyzed the advantages and disadvantages, and focused on the analysis of cross-domain content in the field of deep learning and machine translation, and introduced neural network technology in the machine. Translation applications.

Based on the understanding of neural network machine translation, this paper trains a relatively simple machine translation system based on the sequence-to-sequence (seq2seq) model, introduces the internal network structure and the encoding and decoding methods in detail. The corpus is first tested in English-French (en-fr). ) and English-Chinese (en-zh) parallel corpora, testing of the system, aimed at understanding the principles based on practice, and posting training process and results analysis. Finally, experiments were conducted using different network structures to study the effect of different network structures, hyperparameters, and different corpus on the experimental results, analyze the parts that the experiment can improve, and further evaluate the machine translation. Combining with the machine translation history, we can point out the parts that can be improved.

Key words:Seq2seq; neural networks; machine translation; deep learning

目 录

摘要 1

Abstract 2

第一章 绪论 5

1.1 引言 5

1.2 深度学习问题综述 5

1.3 机器翻译问题综述 6

1.4 本文主要研究内容 7

1.5 本章小结 8

第二章 理论分析和方案设计 9

2.1 深度学习与机器翻译 9

2.2 词嵌入(Word Embedding) 9

2.2.1 Word2Vec模型 10

2.3 Seq2seq模型 14

2.3.1神经网络基础 14

2.3.2 循环神经网络(RNN)介绍 16

2.3.3 长期依赖神经网络(LSTM)介绍 17

2.3.4 卷积神经网络(CNN)介绍 19

2.3.5 编码解码(encode-decode)机制 20

2.3.6 注意力(Attention)机制 21

2.4 网络训练 23

2.4.1 前向反向传播原理 23

2.4.2 基于时间(BPTT)反向传播 24

2.5 本章小结 26

第三章 系统软件设计 27

3.1 数据预处理 27

3.2 网络结构搭建 27

3.2.1 深度学习框架Pytorch介绍 28

3.2.2 编码器(encoder)结构及实现 28

3.2.3 解码器(decoder)结构及实现 30

3.2.4 超参数及训练结果 32

3.3 本章小结 34

第四章 系统评估 35

4.1 机器翻译评估指标 35

4.2 测试数据集和超参数 35

4.3 实验结果 37

4.4 实验结果分析 42

4.5 Seq2seq翻译模型的评估 43

4.6 本章小结 44

第五章 总结与展望 45

致 谢 46

参考文献 47

绪论

引言

随着社会的不断发展,人工智能逐渐走向普及,以机器学习、深度学习为基础的计算机行业不断发展,给未来的生活带来了无限的可能。

其中,在机器视觉与图像识别方面就有目标识别,运动检测,3D重构,图片语义转换等不同领域,在数据处理方面就有数据挖掘,文本提取等相关领域,将此类技术应用于生活中,出现了无人自动驾驶,人脸检测,用户需求预测等各种便利的功能,极大地提高了人民的生活水平,传统科技正在向新兴科技产业不断转变,而本文主要集中在于机器学习和自然语言处理之间的交叉内容,以机器翻译为例,介绍自然语言处理和神经网络的相关知识。

剩余内容已隐藏,请支付后下载全文,论文总字数:33716字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;