基于机器学习方法的图章识别系统

 2022-12-23 10:12

论文总字数:17427字

摘 要

当前企业对图章和印文的风险控制能力较弱,盖章后的文件多为人力审核和归档,具有较多的不可控因素。本课题主要研究基于机器学习的图章识别方法,是结合企业应用需求,进行图章识别。为了提高图章识别准确率而引入机器学习技术。设计和实现一个基于机器学习方法的图章识别系统。

本文的工作包括基于机器学习的图章识别算法设计(智能AI模块)和以图章识别为核心的图章识别系统设计与实现。对于图章识别,基于了YOLOv3深度学习网络模型。首先是进行YOLOv3深度学习网络模型参数的训练,然后,通过训练好的YOLOv3深度学习网络模型进行图章图片识别,再通过OCR技术获得其中的文字。对于图章识别系统设计与实现,是采用B/S架构。

论文提出了通过人工智能管理印文图章的理念,通过人工智能识别图章位置和内容,改进了普通印文图章管理系统中纯人工的归档与管理。人工智能识别图章识别率高,但图章文字内容识别率很低,图章图像预处理部分仍需进一步改进。

关键词:图章识别;深度学习;YOLOv3;JAVAEE;图章识别系统

Stamp recognition system based on machine learning

Abstract

At present, enterprises have weak ability to control the risks of stamps and seals. Most of the documents after stamping are reviewed and archived by humans, which has many uncontrollable factors. This subject mainly studies the stamp recognition method based on machine learning, which is to combine the application requirements of enterprises to carry out the stamp recognition. In order to improve the accuracy of stamp recognition, machine learning technology is introduced. Design and implement a stamp recognition system based on machine learning methods.

The work of this paper includes the design of a stamp recognition algorithm based on machine learning (intelligent AI module) and the design and implementation of a stamp recognition system with stamp recognition as the core. For stamp recognition, it is based on the YOLOv3 deep learning network model. The first is to train the parameters of the YOLOv3 deep learning network model. Then, the stamp image recognition is performed through the trained YOLOv3 deep learning network model, and then the text is obtained through the OCR technology. For the design and implementation of the stamp recognition system, the B / S architecture is adopted.

The thesis puts forward the idea of ​​managing stamp seals by artificial intelligence, and identifying the position and content of stamps by artificial intelligence, which improves the pure manual filing and management of common stamp seal management systems. The artificial intelligence recognition stamp recognition rate is high, but the stamp text content recognition rate is very low, and the stamp image preprocessing part still needs further improvement.

Keywords:stamp recognition; deep learning; YOLOv3; JAVAEE; stamp recognition system

目录

摘 要 I

Abstract II

第一章 绪论 1

1.1 论文工作背景与意义 1

1.2 相关研究现状 2

1.3 主要工作内容 3

1.4 论文组织结构 3

第二章 相关技术基础 4

2.1 从人工智能到深度学习 4

2.2 神经网络 5

2.3 本章小结 5

第三章 系统需求分析 6

3.1 系统功能需求分析 6

3.2 系统非功能需求分析 6

3.3 本章小结 7

第四章 系统设计 8

4.1 系统总体设计 8

4.1.1 系统分层结构设计 8

4.1.2 系统功能模块结构设计 8

4.1.3 系统总体工作流程设计 9

4.1.4 系统数据库设计 11

4.2 系统详细设计 13

4.2.1 前端交互模块设计 13

4.2.2 后端业务处理模块设计 13

4.2.3 智能AI模块设计 14

4.2.4 数据存储模块设计 14

4.3 基于机器学习的图章识别算法设计 15

4.4 本章小结 17

第五章 系统实现与测试 18

5.1 系统实现工具与环境 18

5.2 核心代码分析 18

5.3 系统主要运行界面 20

5.4 系统测试 20

5.4.1 系统测试环境与工具 20

5.4.2 系统功能测试 21

5.4.3 系统非功能测试 21

5.5 本章小结 21

第六章 总结与展望 22

6.1 总结 22

6.2 展望 22

第一章 绪论

1.1 论文工作背景与意义

图章是鉴别金融票据、政府企业相关文件合法性的重要手段之一。目前图章印文的管理方法多为人工管理,而如何实现印文图章的自动化管理,面临其独特挑战。根据国内法律法规的规定,完成图章加盖后的印文是具有法律效力,并得到法律保护。所以为了保护企业的各种资产,企业的各类印文图章必须妥善保存、科学管理。

当前企业对图章和印文的风险控制能力普遍较弱,图章无法完成自动化管理,盖章后的文件也多为人力审核与归档,具有较多的不可控因素。企业图章印文的管理混乱,源于公司内部图章众多,不同的合同需要加盖不同的图章,同时对盖章后文件的管理方式单一。互联网还未完全普及前,图章印文无法有效地与企业办公网络进行整合,调取与查看困难且繁琐;现在即使能与互联网相结合,也只能单方面的将文件拍照上传,只有对文件进行简单的电子化保存的功能,形成的电子档完全由人工归档,虽然方便了调取和查看,但是无法确保真实性与准确性。无法结合互联网发挥自动审核或更大的作用。

人工管理印文图章存在很多局限性。首先就是合同文件的归档与管理人员具有一定流动性,人员的离职、升迁、岗位调动都会使得人工整理出来的合同存档无法有效调取。当印文图章异常需要回溯问题时,无法具体的定位异常文件的产生环节。即使如今结合互联网功能对印文合同进行电子化存储,也同样由于人工的过多介入,必然也会导致合同与文档的存储与管理存在漏洞,所以结合相关图像处理与识别的功能加以辅助识别与管理的功能必不可少。

在市场经济蓬勃发展的今天,合同与图章的高效管理对大型公司而言是一个巨大的挑战,所有合同与图章的管理智能化对大型公司而言势在必行。截止2018年,国内上市公司已超过3500家,经济的迅速发展必定会产生大量的合同与相关合作文件。由于印文图章的管理不规范带来的企业危机的案例也屡见不鲜。2020年4月,知名的综合性网上购物商城当当,由于企业内部原因导致公司几十枚公章、财务章无法正常使用,导致合同无法正常签署。无法正常的签署合同与甚至无法完成内部文件的正常发布,势必会对公司业务的开展造成影响。

即使是规模较小的公司,纯人工管理印文图章会给企业带来更多财务风险,同时也会带来更多的法律风险。截止2018年,国内规模以上企业销售额超2千万,销售额超10亿。不加以印文图章智能化管理的企业就是在内部埋下了一颗随时会爆炸的炸弹。

综合以上种种,印文图章的去人工化与智能化管理势在必行。如果将印文图章与人工智能应用相结合,对加盖公章的文件加以自动识别图章的功能,既可以降低一部分人力审核与归档的成本,还可以减少人力审核出现的错误以及一些不可控因素,进一步加强企业的风险控制能力。智能图章识别与管理,定义了一套全新的图章使用模式。可以有效地与网络相结合,未来依托万物互联的5G网络还可以与其他的企业应用系统的结合。智能图章识别与管理几乎完美的取代了人工管理印文图章的时代,是企业增加自身风控能力的不二选择。

要实现印文图章管理自动化,首先就是要完成图章定位与识别。本课题主要研究基于机器学习的图章识别方法,设计和实现一个图章识别系统。

该课题是结合企业应用需求,进行的图章识别。为了提高图章识别准确率,引入机器学习技术。设计和实现一个基于机器学习方法的公章识别系统。技术方面,自动将图章的位置识别出来并将公司名识别出来。将结果与归档文件一并存入数据库,更方便管理。减少了人工干预的风险,进一步降低人工成本,提高效率。加以人工智能改进后,将会在人工录入与人工归档之间,加上自动识别文件图章,自动识别图章内容两大功能。为归档和将来供相关人员查看提供了便利,通过AI的加持进一步减少了企业风险。

1.2 相关研究现状

如今印文图章管理方式单一,早前属于纯纸质管理,无法有效地与企业OA平台整合。当前普遍使用的企业印文图章管理系统功能简单,大多也只是与企业OA系统做简单的结合,功能主要是完成印文图章的显示、人工审核与电子化保存,无法完成主动识别图章印文中的重要信息,如图章的来源,印文中是否含有的借款、敏感语句等影响公司利益的语句,系统功能有待提高。这样虽然是以网络为载体的平台,但这样的系统并没有任何自动化的功能,都是由人工加以分类与归档管理。

图章的自动化识别功能的引入,一方面可以增加原系统的自动化水平并完善企业自身的管理方式,另一方面还为将来实现全面的智能图章印文管理奠定了基础。在不久的将来,即使纸质合同会被新技术的电子合同取代,也需要很长的时间才能被接受。所以从当前的状况来看,从现在开始的很长一段时间也都会以纸质合同为主。

实现智能化、自动化的印文图章管理,第一步就是要定位图章的位置并识别图章的内容。图章定位功能指的是定位到公章在文件中的位置,提取出此区域的图形图像。市面上的图章形状、外形、尺寸、内容各有不同,有效定位出形态各异的图章是图章文字识别功能正常实现的前提。图章文字识别功能指将图章中包含的文字再转为纯文本文字以方便整理和归档。由于图章形状尺寸各一,所以图章中的文字在实际印文中为不规则的分布,如何有效的将文字进行正确识别是图章识别功能能否完成的关键步骤。

机器学习是当前炙手可热的人工智能领域中实际应用在商业中的技术,通过机器学习完成本次图章识别功能的设计与实现,是实现高效准确识别图章的不二方案。机器学习相关技术发展已有多年,具有很多优秀的可供开发者使用的用于机器学习的神经网络和机器学习程序的开发框架。从1994年Yann Le Cun发表的经典卷积神经网络LeNet5至今,几乎每两年就会有一到两个优秀的神经网络结构被公开发表。本论文将基于这些优秀神经网络的运用实现基于机器学习的图章识别功能,快速的实现机器学习应用程序的开发与应用。

JAVAEE技术是当前制作企业应用普遍使用的技术,是经典的B/S结构的应用。通过JAVAEE的成熟理论与技术可以规范的设计与开发企业应用的前后台处理模块,完成前台与后台的完美衔接。得益于java面向对象等特性,JAVAEE项目兼顾性能、安全与开发成本,并且后期维护方便,是网页应用系统常用的解决方案。

国内智能图章的解决方案起步于2015年左右,当前已具有成熟的商业使用场景。本课题将企业公章与深度学习相结合,将原本需要人力进行处理的印文分类与归档工作交由计算机辅助处理。既使人从繁琐重复的劳动中解放,又增加了归档工作的可靠性。通过这种计算机管理图章印文的方式,进一步提高了企业的风险控制能力。图章的定位和识别模块是图章识别系统的核心组件。也是深度学习的重要成果。图章的定位和识别模块的准确性、可靠性。决定了图章识别系统的准确性、可靠性。在云计算、大数据和人工智能的当下,“智能图章”将会变的更智能,本系统旨在将图章印文与AI人工智能相结合,完成一个以机器学习为核心技术的人工智能图章识别系统。

本论文主要是运用机器学习相关技术通过合适的神经网络结构设计与实现印文中的图章定位与识别功能,制作相应训练集并经过训练完成基于机器学习的图章识别模型,并结合最新的JAVAEE后端SpringBoot框架与前端Vue.js框架相关技术以图章的定位与识别功能为核心完成一个可以通过网页进行交互的印文图章识别系统。

1.3 主要工作内容

本系统有两点主要工作:基于机器学习的图章识别算法设计、以图章识别为核心的图章识别系统的设计与实现。主要工作内容如下:

  1. 了解人工智能的基本概念,学习深度学习、机器学习之间的区别与联系,了解机器学习的相关知识与技术。
  2. 选定机器学习的相关开发工具与相应环境。
  3. 选定图章识别算法的神经网络结构。
  4. 搜集相应图章数据并完成数据集的制作。
  5. 完成图章识别模型的训练实现图章目标识别与图章文字OCR。
  6. 根据已完成的智能图章识别功能结合JAVAEE技术完成图章识别系统的整体设计与开发。

1.4 论文组织结构

参考软件工程中的软件开发步骤的特性,本论文共分为六章:

第一章为绪论。主要介绍本图章识别系统开发的目的,本次工作的背景与意义,为完成图章识别系统设计与实现将要做哪些工作。

第二章为相关技术基础介绍。主要介绍人工智能、深度学习、机器学习、神经网络的联系和区别。机器学习其相关历史、重大事件的介绍。经典神经网络结构的介绍。本文拟选用的神经网络模型的介绍。数据集相关概念介绍。机器学习相关开发工具与环境的介绍。

第三章为图章识别系统的需求分析,包括对系统功能需求分析和在基础功能完成的前提下的非功能需求分析。非功能性的需求分析包含对图章识别系统性能、安全等方面的需求分析。

第四章为软件工程中的系统设计。系统总体设计分为分层结构设计、功能模块设计、工作流程设计、数据库设计四部分。着重设计图章的智能识别功能。介绍神经网络的选择,数据集的收集、分配与使用,模型的训练,图片的预处理,JAVAEE应用系统的相关设计与数据库设计。

第五章为系统实现与测试。主要介绍系统实现机器学习开发工具与JAVAEE开发工具,核心代码设计,系统前端运行页面介绍以及系统测试。在完成核心功能的设计后,进一步的分析并编码实现。最后对项目进行测试环境的部署,进行系统整体调测。

第六章为总结与展望。主要是总结已完成系统的优点与缺点。并对已完成的图章识别系统再做进一步的反思,找出未来有进一步优化必要的部分。

第二章 相关技术基础

2.1 从人工智能到深度学习

全民人工智能热潮始于2016年的一场特殊的围棋比赛。当时人工智能机器人AlphaGo战胜了人类职业围棋世界冠军棋手李世石,此消息一出轰动世界,使得当年的“阿尔法围棋”一词入选了2016年年度中国媒体十大新词。2019年,人工智能Open AI战胜游戏“DOTA2”的TI8冠军战队OG后,之后“DOTA2”还开启了一段短暂的Open AI全民挑战热潮,最终Open AI取得了7215胜42负的战绩,普通人的胜率通常为50%,而人工智能胜率超过99%,几乎就是做到了逢打必赢。如今人工智能已经走到了我们生活中,诸如个人日常使用的“你画我猜”、“画图红包”、“聊天机器人”等都或多或少的使用到了人工智能的相关技术。

人工智能是一个非常广泛的研究领域,主要研究如何让机器表现出人类的认知能力。主要研究如何使机器在不必额外编程的情况下学习特定任务。有人表示,人工智能是目的,是结果,是一个宏观的概念;深度学习、机器学习是方法,是工具,是具体的应用实现。三者的关系如图2-1所示。

图2-1 人工智能、机器学习、深度学习三者的联系

人工智能分为强人工智能和弱人工智能。简而言之,强人工智能几乎就是一个人,是具有如“终结者”甚至超越“终结者”的一类智能计算机,能产生自我意识可以主动的去做某项事情,是人工智能领域的终极目标。然而当前广泛研究与应用的均为弱人工智能,能达到的功能类似于某某专家系统,只在某一个具体的领域达到与人类相似的智能。无法从多个领域多方面考虑,无法像人类一样拥有宏观整体多方面的思考判断与选择。

当前主流的机器学习框架有CNTK、PyTorch、TensorFlow等,分别是由微软、Facebook、Google三家公司主导发布,国内的机器学习框架有paddlepaddle等,诸如百度、阿里等公司也是AI的积极参与者。每种框架都有各自的特点,并且对编程语言的支持程度各不相同,因此选择机器学习框架须慎重。然而在机器学习编程语言的选择方面,Python语言以压倒性的优势排在第一位。

深度学习,深度可以理解为多层次,多维度的学习。深度学习模拟人类对物体的认知方式,从实践结果可以看出,深度学习网络的计算方式更复杂,计算次数更多,网络层次更深。

2.2 神经网络

当前主流的目标检测算法如表2-1所示。除此之外的LeNet-5堪称是深度学习入门的“HelloWorld”程序,后续模型大多以经典的LeNet-5为理论基础建立,截止当前已有几十个经典的神经网络模型被应用在各行各业。

表2-1 深度学习主流目标检测算法现状

深度学习主流目标检测算法现状

one stage系列

two stage系列

multi-stage系

主要算法

YOLOv1、SSD、YOLOv2、RetinaNet、YOLOv3

Fast R-CNN、Faster R-CNN

R-CNN、SPPNet

检测精度

较低

较高

极低

检测速度

较快

较慢

极慢

鼻祖

YOLOv1

Fast R-CNN

R-CNN

状态

已淘汰

根据上表可知,目前正在使用的基于深度学习的目标检测算法有one stage系列和two stage系列。One stage系的检测为一次完成,是标准的端到端的实现。输入为原始图片,输出为对象的类别和区域。Two stage系列是两步完成目标检测的算法,所以在实际应用中先要训练分类网络,再训练定位识别部分的网络,不是真正的端到端的实现。

鉴于two stage的网络需要先训练出物体识别的模型,然后再进行物体定位模型的训练。one stage的网络一次即可完成识别与定位,训练时也只需要训练一次。本次毕设尝试使用one stage系列的yolov3网络模型。Yolov3的输入通常为416×416,具有多达108层的网络结构,除了普通的卷积网络之外,yolov3还引入了残差网络。残差网络有效的缓解了多数模型由于网络层次过深而引起的计算资源的消耗、模型容易过拟合、梯度消失/梯度爆炸等问题。

2.3 本章小结

本章主要介绍了什么是深度学习和神经网络,介绍了神经网络的概念,对神经网络相关基础知识进行介绍。本章为接下来系统需求分析的可行性、合理性打了预防针,防止在接下来的系统需求中出现机器学习技术难以实现的需求。

第三章 系统需求分析

3.1 系统功能需求分析

本系统的用户角色主要为合同归档管理员,相应的用例图如图3-1所示。

图3-1 用例图

可见系统的主要操作者为合同管理员,此系统的主要需求如下:

  1. 系统需要有登录功能。在用户尚未登录之前,所有用户均无法对合同内容进行查看和相关操作。
  2. 管理员将文件扫描或拍照形成图片上传至系统,完成文件合同的录入。
  3. 管理员登录系统后可以查看相关合同信息,合同(文件)图片上传完成后即可预览合同内容。
  4. 智能图章识别,完成识别后,给客户直观的看到识别出的结果。
  5. 返回了结果之后用户可以对返回的结果结合实际文件情况进行修改。
  6. 无用合同信息的删除。

3.2 系统非功能需求分析

界面显示友好。web页面中能简单直接的展示出结果,在图片质量不降低的情况下快速的展示给客户结果。

安全性要有保障,在未登陆前不能进入系统操作与查看。

快速响应,上传速度,定位速度,识别速度,一般文件从上传到出结果总用时低于5秒。接口响应时间不超过100ms。

持续保持高并发。除智能AI模块外,其它模块每个接口均要能承受超过1000次每秒的并发。

对于图章识别准确,快速。智能AI模块识别准确率超过85%。

可见虽然需求数量不多,但所涉及的技术多,所以各个不同的代码所集成的不同模块要协调好。对于智能AI模块而言,此模块一定要、准确率高、速度快,尽量保持高并发。但是三者不可能都保持高标准。权衡利弊三者取其轻,首先要保证准确率高、其次是速度快,最终的单机并发量有待考量。

3.3 本章小结

本章提出了本系统应完成的基础功能需求和部分非功能需求。在系统基础功能实现的情况下,非功能需求是评价本系统可用性的额外标准。系统设计将根据本章的系统需求分析得出的相应需求,进行系统的总体设计和详细设计。

第四章 系统设计

4.1 系统总体设计

4.1.1 系统分层结构设计

本系统的分层结构将系统分成三层:交互层、核心业务层和数据层。相应的系统分层结构图如图4-1所示。

图4-1 系统分层结构图

交互层包括,前端用户交互界面。核心业务层包括,业务控制层,业务处理层,数据交互层以及智能识别模块。数据层包括MySQL数据库,图片存储服务。

剩余内容已隐藏,请支付后下载全文,论文总字数:17427字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;