图像图形敏感文字识别系统的设计与实现

 2022-01-17 11:01

论文总字数:18404字

目 录

1 绪论.....................................................1

1.1图像文字识别简介……………………………………………………………………..….1

1.1.1 图像文字识别的发展与现况……………………………………………………..1

1.1.2 图像文字识别常用方法与工具………………………………………………......1

1.2 开发工具的选择和介绍…………………………………………………………………..2

1.2.1 WPF框架简介……………………………………………………………………...2

1.2.2 C#简介………………………………………………………………………….….2

1.2.3 MODI中的OCR模块……………………………………………………………….3

1.3 图像文字识别系统的目的和意义…………………………………………………….….3

1.4 本章小结…………………………………………………………………………………..3

2 图像文字识别系统的分析...................................3

2.1系统概述…………………………………………………………………………………...3

2.2可行性分析………………………………………………………………………………...4

2.3需求分析…………………………………………………………………………………...4

2.3.1 功能性需求………………………………………………………………………..4

2.3.2 非功能性需求…………………………………………………………………......5

2.4 本章小结…………………………………………………………………………………..5

3 图像文字识别系统的设计...................................5

3.1 系统整体架构………………………………………………………………………...…...5

3.2 各模块设计…………………………………………………………………………….….6

3.2.1 图像文件识别模块…………………………………………………………….….6

3.2.2 识别核心模块…………….……………………………………………………….7

3.2.3 关键字导入模块…………………………………………………………………..8

3.2.4 图像文字匹配模块………………………………………………………………..8

3.3 模块界面匹配……………………………………………………………………………..9

3.4本章小结………………………………………………………………………………….10

4 图像文字识别系统的实现..................................10

4.1软件界面………………………………………………………………………………….10

4.2 图像文件识别模块的实现………………………………………………………………11

4.2.1 图像文件识别模块的具体实现…………………………………………………11

4.2.2 图像文件识别模块相关界面展示………………………………………………11

4.3 识别核心模块的实现……………………………………………………………………12

4.3.1 识别核心模块的具体实现………………………………………………………12

4.3.2 识别核心模块相关界面展示……………………………………………………13

4.4 关键字导入模块的实现…………………………………………………………………13

4.4.1 关键字导入模块的具体实现……………………………………………………13

4.4.2 关键字导入模块相关界面展示…………………………………………………14

4.5 图像文字匹配模块的实现………………………………………………………………15

4.5.1 图像文字匹配模块的具体实现…………………………………………………15

4.5.2 图像文字匹配模块相关界面展示………………………………………………15

4.6 本章小结…………………………………………………………………………………17

5 总结....................................................17

参考文献..................................................18

致 谢....................................................19

附 录....................................................20

图像文字识别系统

尤晋卿

,China

Abstract:Graphic character recognition technology is such kind of technology that people can identify the image information into text with a computer media . This technology has been widely used in communications, biology, medicine, artificial intelligence . Therefore, it is necessary to design a effective graphic recognize system. This project uses visual studio 2013 as development tools ,WPF as framework and C# as programming language. By using and extending office character recognition module, people can use it to read the picture, input the keyword and recognize the text of images. It can also match the result and build a reflex between the keywords and recognition results of image files. The structure of each module and the functions are on clear. The system also has a simple software interface and the operating mode is friendly, which means the user can get good feedback.

Key words: Read Picture; Input Keyword; Graphic Character Recognition; Match Result; C#

1 绪论

1.1 图像文字识别简介

图像文字识别是指通过计算机对包含文字的图片进行关键字的提取工作,并将所提取内容转化成数字信息进行保存。图像处理的一般过程是先通过如照相机,扫描仪,摄影机等电子设备获取图像,接着利用计算机对选定图像进行处理,之后在显示器等显示设备上显示处理结果。可以看出,计算机在整个识别过程中扮演了最重要的角色,因此,计算机图像文字识别技术的迅猛发展也为文字识别结果的可信度提供了重要保障[1]

图像文字识别技术在许多领域被广泛应用,根据特定领域对于图像识别不同的精度需求,衍伸出了许多识别方法。通过使用图像文字识别技术,节省了人工识别的时间,同时,利用计算机快速运算的能力,人们能够高效处理大量的图片信息,无形中也节省了许多间接成本。

一个图像文字识别系统优劣与否,有多种判断指标,最常见的有图像拒绝识别率、识别结果正确率、文字识别速度、用户界面友好与否、是否易操作、系统稳定性等。

1.1.1 图像文字识别的发展与现况

图像文字识别的概念是由光学文字识别(optical character recognition) 发展而来的,最初由德国学者Tausheck于上世纪二十年代末提出。上世纪六十年代,图像文字识别技术有了突破性进展,利用该项技术人们已经可以识别常用的阿拉伯数字,此技术很快被投入邮政编码的识别工作。在此基础上,用于识别字母文字的图像文字技术设备和相关技术也在不断发展,而最早进行汉字图像识别工作的则是IMB公司,该公司在1966年就已经取得相关成果[2]

中国在图像文字识别技术方面起步较晚,直到七十年代末才开始进行相关工作,不过由于设备昂贵,文字识别正确率低,以及汉字识别方法明显不同于西方文字等实际困难,我国科研人员始终不能突破图像文字识别的瓶颈。不过随着近些年相关产业的蓬勃发展,我国在此领域已经取得了不小进步,和他国之间的差距也正在逐渐缩小,根据数据统计,截至2015年一月,百度公司的超级计算机系统已将文字识别正确率提升至94.02%。

1.1.2 图像文字识别常用方法与工具

图像文字识别过程一般如下,首先对需要分析识别的图像进行区域划分,完成文字检测工作(在被分割出的区域中寻找文字),给出有无文字的结果;之后进行文字定位,确定文字的位置,将其记录;最后根据相应文字的特征和种类对被记录的文字进行文字识别工作[3]

尽管图像文字识别技术已经取得不小成绩,但它仍然是一项正在发展的技术,新的识别方法也不断被提出,常见的有神经网络识别法、水滴图像分割法、Fisher判断法等。

与此同时,各种带有图像文字识别功能的工具也应运而生,如Google Googles的光学字符识别工具,微软Office内置的OCR识别等。本毕设通过集成微软MODI(Microsoft Office Document Imaging)的OCR模块,实现了一个独立的图像文字识别系统。

1.2 开发工具的选择和介绍

开发一个特定的图像文字识别系统,最先需要关注的的就是各种软硬件条件以及开发环境,开发工作开始之前不但需要考虑操作系统、开发软件等开发条件,为了达到提高文字识别速率的目的,还需考虑诸如CPU的性能等硬件因素。综合考虑之后,确定了该系统的开发需要以下环境和设备支持:Window7操作系统、Visual Studio 2013、.net framework 4.0或更高版本,硬件方面则要求机器配有2GHz处理器或更高,1G内存或更高。

1.2.1 WPF框架简介

WPF是Windows Presentation Foundation的缩写,是一个基于Windows的开发框架,从属于.NET Framework 3.0。它为编程人员提供了一系列编程模型和语言框架,让软件界面开发人员和代码逻辑实现人员能够分工合作,它还提供了崭新的UI交互界面。由于.NET Framework 3.0的支持,它能够调用大量功能完善的基类,这使得编程人员的工作效率大大提高。WPF同时支持DirectX 9/10技术,这就使得它可以绘制三维界面,其图像渲染特效也远远超过了传统界面。

1.2.2 C#简介

C#是一款由Microsoft公司于2000年发布的面向对象的编程语言,可以说它是C 的延续,因为两者之间具有明显相似性,但是它又吸收了JAVA语言的优点,最终形成了自身特殊的风格。由于其可视化和运行效率高的特点,使得它成为.NET平台编程的一个优先选择。它在基本数据类型、string类和object类的定义、参数传递等方面并没有特别之处,但是它实现了与Microsoft公司的Win32组件技术的无缝集成,使得人们能够在任意.NET框架下对COM客户端和服务器端进行实现。C#自从发布以来,受到了人们广泛的好评,因为它集中了几乎所有软件研发成果,如版本控制、面向对象、信息安全控制、类型保障技术、系统构造技术、智能释放内存技术等,但是它也有明显的不足之处,由于过度依赖于.NET运行库,导致编程人员除了这些运行库之外,无法随心所欲的调用第三方程序库,而且用C#编写的程序只能运行的Windows上,可移植性较差,对于老版本的一些Windows系统甚至会有无法兼容的问题。由于这些限制,使得C#并没有能够取代C 和JAVA,只是对它们产生了一些轻微的冲击。C#能不能在未来取得编程语言的主导地位,还等待着时间的检验。

1.2.3 MODI中的OCR模块

MODI(Microsoft Office Document Imaging)中的OCR模块是整体图像文字识别系统的核心模块,它提供了从指定图片中识别出相关文字的功能。整个MODI可以看做是对Scan Soft API的一个封装,而Scan Soft API则封装了不同种类的带识别语言,MODI在此封装基础上通过名为mspview的可执行文件提供了OCR应用。在实际应用过程中,微软Office2007以及Share Point Designer 2007已经对MODI模块进行了集成,软件开发过程中需要将所需的.dll文件复制移动到C盘指定文件夹中,之后修改相应注册列表,通过在工程中调用MODI.dll,就可以使用OCR模块的图像识别功能了[6]

1.3 图像文字识别系统的目的和意义

步入信息时代,人们获取信息的渠道越来越多,通过这些渠道,人们更是能获取到不同种类的多媒体信息,其中,图像图片俨然已经成为重要的信息传递媒介。图中的文本内容体现了丰富的高层语义,提取出这些文字,对于图像高层次的语义的理解、索引和检索非常有帮助。

图像识别可用于打印文件的识别、订单的识别、广告牌的识别、学生证等证件的识别等方面。另外,报纸刊发、邮政、图书馆、印刷厂等部门单位使用的计算机需要克服大量文字输入的问题,所以文字识别研究的突破将为这些部门提供不小的便捷。因此,相对应的图像文字识别系统的开发就显得尤为重要。

剩余内容已隐藏,请支付后下载全文,论文总字数:18404字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;