基于深度学习的金融领域命名实体识别

 2022-07-25 10:07

论文总字数:27138字

摘 要

命名实体识别是抽取信息、句法分析、机器翻译、问答系统等应用领域中重要的一个工具,也是自然语言处理技术进行实用化的关键一步和不和缺少的必要部分。在金融领域中,人和各种不同机构建立起相互关系,所以对这些实体的识别也就是在金融领域对于不同成分进行相互关系发现的基础,也是从金融文本中抽取有用信息的关键技术。

本文在事先对不同数学模型进行选择和评估的基础下选择LSTM后接CRF这一模型来实现本文的实体识别任务。本文接下来选取了合适的开发工具和函数库,并基于此在代码中定义、搭建了一个有一定可移植性的神经网络模型文件。而后,对于需要读入的数据集,定制了数据的输入和输出的操作函数,以及相关的持久化文件。在工程搭建的最后,本文设置了一个功能健全并有一定鲁棒性的神经网络驱动程序,这个程序可以进行相关的超参数设置、一系列的环境路径设置以及神经网络的功能调用的实现。

基于本文开发的工程文件,使用一系列金融类单句用例对LSTM后接CRF神经模型进行测试,并进行错误分析。同时对不同几种神经网络进行了批量化的测试评估,评测结果证明了此模型在金融类文本预测任务中的先进性和可行性。

关键词:自然语言处理,双向长短期记忆网络,条件随机场,命名实体识别

Abstract

Named entity recognition is an important tool in extracting information, syntactic analysis, machine translation, question answering system and other application fields, and it is also a key step and an indispensable and necessary part of the practical application of natural language processing technology. In the financial field, people and various different institutions establish mutual relations. Therefore, the identification of these entities is the basis for discovering the mutual relations between different components in the financial field, and is also the key technology for extracting useful information from financial texts.

This paper selects LSTM followed by CRF model to achieve the entity recognition task of this paper, based on the selection and evaluation of different mathematical models in advance. This article next selects the appropriate development tools and libraries, and based on this, defines and builds a neural network model file with certain portability. Then, for the data set that needs to be read in, the input and output operation functions of the data and the related persistent files are customized. At the end of the project construction, this paper sets up a neural network driver with robust functions and robustness. This program can perform related hyperparameter settings, a series of environment path settings, and the implementation of neural network function calls.

This article is based on the development of the project file, using a series of single-sentence use cases to test the LSTM followed by CRF neural model, and error analysis. At the same time, several kinds of neural networks were tested and evaluated in batches, and the evaluation results proved the advanced nature and feasibility of this model.

KEY WORDS: Natural Language Processing,Long Short-Term Memory Network,Random Conditional Field,Named Entity Recognition

目录

摘要 I

Abstract II

第一章 绪论 1

1.1 研究背景 1

1.2 国内外研究现状 1

1.3 关键问题及难点 2

1.4 本文主要工作 3

1.5 技术路线 4

1.6 本文组织结构 5

第二章 神经网络模型及其实现 6

2.1 命名实体识别主要的算法 6

2.1.1 条件随机场模型 6

2.1.2 循环神经网络模型 7

2.1.3 双向长短期记忆网络加条件随机场模型 7

2.2 TensorFlow介绍 9

2.3 神经网络模型搭建 11

2.4 神经网络驱动程序 13

2.4.1 驱动程序参数设置 14

2.4.2 程序运行环境及路径设置 15

2.4.3 神经网络功能调用实现 15

2.5 小结 16

第三章 数据处理 18

3.1 数据集的预处理 18

3.2 词向量的生成和处理 19

3.3 数据的其他处理 20

3.4 小结 20

第四章 实验 22

4.1 实验设置 22

4.2 实验评价指标以及测试用例 22

4.3 实验结果和分析 23

4.3.1 测试集上的实验结果分析 23

4.3.2 单句用例测试输出和分析 24

第五章 总结以及展望 26

致谢 27

参考文献 28

绪论

研究背景

计算机科学在金融领域的应用愈发的广泛,在决策者或是投资者面对大量的数据时,如何高效的发现有用的信息是一个很重要的问题。例如在发生某一事件之后,这一事件对其他的决策者投资人会有如何的影响,再如行业的近况对公司股票的影响方式以及相关性等问题,以及不同公司机构之间的相互行动等。为了发现这些有用的信息,在金融文本中进行信息抽取是一个必不可少的步骤。而命名实体识别是在信息抽取时的基础部分。

金融领域命名实体识别是指从给定的数据源中抽取出需要的实体信息,进行信息抽取前的重要工作,它的重要作用是从文本中准确地识别出人名 、地名 、机构名、公司名、产品名等信息。判断一个金融类命名实体的标注是否正确包括两个方面的评测:实体的边界是否被标注正确;实体的标注类型是否被判断无误。最初的实体识别主要是基于人工定义好的规则进行识别和检测,但是随着实体识别的工作逐渐复杂化,手动定义规则的难度也逐渐加大。所以近些年中随着深度学习库的开发和硬件算力水平的增长,基于统计方法或机器学习(machine learning)的方法也被用来处理命名实体识别的任务。

剩余内容已隐藏,请支付后下载全文,论文总字数:27138字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;