电子文件管理信息系统的研究与实现

 2022-01-17 11:01

论文总字数:19346字

目 录

1绪论 …………………………………………………………………5

1.1 研究背景及意义………………………………………………………………………5

1.2 课题提出的目的及意义………………………………………………………………5

1.3 国内外研究现状………………………………………………………………………6

2电子文件管理系统 …………………………………………………6

2.1 电子文件概念…………………………………………………………………………6

2.2 管理信息系统…………………………………………………………………………7

2.3 电子文件管理系统……………………………………………………………………7

2.4 电子文件管理的意义…………………………………………………………………7

3系统设计分析与实现 ………………………………………………8

3.1 可行性分析……………………………………………………………………………8

3.2 需求分析………………………………………………………………………………9

3.3 数据库设计……………………………………………………………………………10

3.3.1 数据库概念 ……………………………………………………………………10

3.3.2 系统E-R图 ……………………………………………………………………10

3.3.3 数据库结构 ……………………………………………………………………11

3.3.4 数据库部分功能代码 …………………………………………………………12

3.4 系统功能模块…………………………………………………………………………15

3.5 系统整体规划…………………………………………………………………………15

3.6 系统实现及部分代码…………………………………………………………………15

4分类算法………………………………………………………………24

4.1 朴素贝叶斯算法 ……………………………………………………………………24

4.2 EM算法 ………………………………………………………………………………27

4.3 基于EM算法的贝叶斯分类 …………………………………………………………28

4.4 分类器的实现 ………………………………………………………………………28

4.5 朴素贝叶斯分类算法的实现 ………………………………………………………27

5结论 …………………………………………………………………29

参考文献 ………………………………………………………………33

致谢 ……………………………………………………………………30

电子文件管理信息系统的研究与实现

王妍

,China

Abstract: With the development of computer technology, more and more low-cost electronic office, a little-scale enterprises have been out of the traditional office, turn toward electronic office trend. However, the ensuing also brought a lot of problems, along with the operation of the enterprise tends to produce a large number of electronic documents, such as a lot of important information statements, contracts, documents, customer information, etc., these are the companies. Because the amount of information the rapid growth of electronic documents, only there is a big drawbacks by manual sorting files not only waste a lot of manpower, financial and material resources, and the classification result is not satisfactory, since it is artificial classification, there are bound to subjective factors will affect the classification The results have some differences. Some existing automatic text classification system because the text does not ensure that all complete, some deletions and did not take into account the classification system which, so the accuracy of the classification results is also problematic. So in the face of a large number of text messages jumbled how effective organization and management is a major challenge for the current information technology. Therefore, the design of an electronic document management information system to solve the problem of text classification is currently required. The text, taking into account the existence of the missing, the classifier design, the use of EM algorithm gives the maximum likelihood estimate of the missing to complete the fill attributes, and then use Naive Bayesian classification algorithm to classify the complete data set, use this ways to improve the accuracy of classification, to design a modern electronic document management information system.

Keywords: information management system; EM algorithm; missing data; Naive Bayesian classification algorithm; thematic studies: Automatic Chinese Text Classifier

1 绪论

1.1 研究背景及意义

近几年,Internet发展迅速,在互联网上,电子文件每一天都在急剧的增加,人们通过网络,可以便利的及时的获得各种需要的信息资源,来满足生活的需求,也丰富了业余生活。同样,我国电子政务、企业信息化、社会信息化的不断向前推进,大多数企业、单位选择电子办公,日积月累,不可避免的就会产生大量的电子文件。面临网上日益增加的电子文件,传统的思想和办法是对它们进行人工分类,再加以整理、组织,来为需求者更快更准确的提取到所需的信息。然而,这种对电子文件分类的方法存在很多缺陷:首先,消耗大量的人力、物力、精力。其次,由于是人工分类,就一定会出现差异,即时工作职员拥有较高的语言水平和素质,由于是不同的人来做分类工作,它的结果也会出现不同。甚至是同一个人做这项工作,在每个时期也可能会出现不同结果,所以会有分类结果与要求不一致的现象出现。鉴于一方面网络信息、文件的极速增加;另一方面,现有人工分类方法又存在一定弊端,同时,目前企业对电子文件的管理问题上没有给予足够的重视,所以研究实现一款能够快速的,基于中文文件自动分类的电子文件管理信息系统是很有必要的。

电子文件管理信息系统的自动分类功能目的在于有序组织文本集,把在内容结构等方面相关性大的文本整理一起自成一类。它能够提供有效地,准确的服务,使用户对繁杂错乱的文件信息进行有效合理的组织分类。按照一定的主题类别对大量的自然语言文本进行自动分类的过程,是一项非常有前景的文本挖掘技术。文本自动分类技术对信息检索、信息过滤、文本数据库、搜索引擎等领域的研究做出很大贡献,它具有较大使用价值,深得广泛关注,有着广阔的应用前景。

1.2 课题提出的目的及意义

虽然现在信息科技飞速发展,大多数企业都已进入信息化办公阶段,企业内都是信息化用办公软件,但是,往往有些企业只是追求时尚,追随科技发展,或者是一些系统操作起来很繁琐,总之,很多企业并没有从中真正的享受到信息技术给生活、工作带来的极大便利。

比如,本论文讨论电子文件管理信息系统,大多数企业应该都有一款属于自己专业处理文件的系统,但是又有多少企业是每天都在利用这样的系统办公,从中得到便利呢?目前,甚至还有很多企业办公还是利用大量的纸质文件,浪费了大量人、物、财力。所以针对以上出现的情况,就解决企业对电子文件的管理缺乏重视等问题,设计一款简单的易操作的电子文件管理信息系统来是本论文的主题。

在本系统中,管理员可以便捷地对企业产生的各类电子文件进行管理并且同时维护用户信息,避免了一些不必要的开支。主要从功能划分与核心内容分类器的设计来对课题研究。本次开发的电子文件管理信息系统在用户角色上主要分为管理员与用户两类。分类器设计:对于文件管理信息系统来讲,课题难点与核心便是如何实现自动分类,因此分类器的算法设计将会是本课题的核心技术点。

剩余内容已隐藏,请支付后下载全文,论文总字数:19346字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;