基于不良信息字词过滤系统的网络论坛的设计与实现

 2022-01-17 11:01

论文总字数:39899字

目 录

1 引言 3

1.1 研究背景及意义 3

1.2 国内外研究现状 3

1.3 论文结构介绍 4

2 相关技术 4

2.1 javaEE介绍 4

2.1.1 ssi介绍 4

2.2 maven介绍 6

2.3 resin介绍 8

2.4 mysql介绍 8

2.5 log4j介绍 8

2.6 jquery介绍 9

2.7 运行环境 9

3 系统分析 9

3.1 需求分析 9

3.2 可行性分析 10

3.3 系统功能设计分析 11

3.3.1 功能概述 11

4 数据库设计 11

4.1数据库需求分析 11

4.2 E-R图 12

4.3 数据库表的设计 12

5 系统的设计与实现 14

5.1 总体功能模块设计 14

5.2 网络论坛模块 15

5.3.1登录注册注销模块 15

5.3.2用户发帖模块 17

5.2.3用户回复模块 20

5.2.4用户评论模块 21

5.3不良信息字词过滤模块 26

5.3.1 AOP介绍 27

5.6.2 DFA介绍 28

5.6.3 过滤算法详解 29

6 结语 38

参考文献 38

基于不良信息字词过滤系统的网络论坛的设计与实现

杨军

,China

Abstract: In a variety of formal network forum people reached a high degree of freedom of speech.But because of the quality of modern people, and in this virtual world, people do not have or difficult for their own speech, the forum mixed with a large number of bad information. These bad information or some swearing, or some political sensitive information.

The system first simulated a BBS forum, based on this forum for poor information word filtering. Forum system design and filtering system separately, separately designed for filtering a filtering algorithm. The system uses B / S architecture, based on javaEE technology, the overall framework of the use of spring springmvc mybatis, the use of maven structures, front-end display layer using html jsp jquery, data storage using mysql. First of all, the requirements of the subject analysis, and then use the mysql database model, and then the specific function of the preparation. BBS Forum system to imitate the style of Baidu Post Bar, the main function is posting, comments, reply. Users are divided into three types of visitors, members, and administrators. Only members and administrators can post, comment and reply. Filtering system used in the filtering algorithm is a set of my own design algorithm, in addition to the details of the design, based on the DFA limited automatic machine to filter, considering the accuracy of matching the accuracy of information and matching efficiency, will be in the simulation of BBS The algorithm is shown in the forum.

Key words: Network forum, bad information, filtering system, DFA, javaEE, mysql

1 引言

1.1 研究背景及意义

互联网时代的到来伴随着互联网行业高速发展,网络论坛作为互联网行业的一个分支,其发展也是紧跟时代潮流,用户的线上交流也因此越来越频繁,可以说只要有网,用户分隔两极也一样可以通过网络愉快的交流,这得利与网络的发展和网络论坛平台的支持。

网络论坛的作用远不止于此,每个网络论坛都是一个大社区,社区里鱼龙混杂,人与人之间的素质不一。一个人发表的不良信息轻则可能带动一群人素质的下降,重则对他人进行人身攻击造成不可挽回的伤害,甚至造成社会和国家的动荡。泛滥的网络谣言极易形成所谓的网络暴力,一旦形成网络暴力,对受害者的身心都会造成巨大的伤害。

而我们创建网络论坛的目的是给大家提供一个平等交流的平台,而不是一个充满了污言秽语的堕落之地。

因此有必要对网络论坛进行不良信息字词过滤

其一,过滤一方面是素质较低的人的脏话,一方面是涉及到企业或者国家乃至世界的机密信息,这些机密信息很有可能造成社会动荡。通过对这些信息的过滤来加强互联网资源管理,避免互联网带来的负面影响,从而为用户创建一个文明的精神世界,加速我国信息化的进程,构建和谐社会服。

其二,用户本身可能是一名动机不纯的黑客,通过在发表的言论中注入大量脚本语言对论坛进行公司,从而非法获取用户的信息对用户进行人身攻击。比如注入JS或VB等脚本语言或html跳转标签lt;meta http-equiv=””gt;等,这种情况尤其危险,涉及到了法律层面,这时候就必须对这些脚本语言进行过滤,比如”lt;”用”amp;lt”代替等。

1.2 国内外研究现状

网络论坛国内网早就都有自己非常成熟的产品了,国内的有如百度贴吧丶天涯论坛丶网易社区丶qq空间乃至朋友圈等,国外的facebook丶Twitter等知名软件也都有自己的论坛,这些论坛把世界的人都连在了一起。

不良信息字词过滤每个论坛因为每个公司的需求不一样都有自己的一套算法,比如是否对逗号或空格进行字词过滤,是否对标题或文本进行过滤等,这些需求在不同的论坛功能模块里的要求也不一样。

目前来说针对不良信息字词过滤的研究还算比较成熟,针对一些脚本语言,不可能全部过滤掉,这样会使得着这个文本看起来呆板单调,也会显示用户的使用,影响用户体验,每个公司针对特定的场景都有特定的过滤。而对于脏话和敏感信息每个公司的过滤算法其实都大同小异。

1.3 论文结构介绍

论文的第一部分首先介绍了本次系统设计的背景和意义,然后从国内外现状开始描述,分析了不同的需求和使用场景。

第二部分是对本系统的技术支持部分的介绍,从系统的整体架构,前端后端使用的技术,开发工具,集成环境,使用的服务器容器和数据库等进行阐述

第三部分是系统分析。包含对网络论坛系统的分析和对不良信息字词过滤系统的分析。

分别进行了需求分析,可行性分析,系统功能设计分析。从技术条件丶社会环境因素等多方面进行阐,分别画出两个系统给的数据流图,以此方式进行概括总结。

第四部分是数据库设计。这一部分描述了本次系统的数据库的表结构,并用E_R图展示了出来。关于数据库设计其实一开始设计的并不是考虑很全面,在开发系统的时候发现有的表并不能满足实际需求,期间陆陆续续改了好几次数据库表结构。修改部分以及为什么这么改会在本部分具体介绍。

第五部分就是本次论文的中心部分——系统的设计与实现。这部分对本系统中的各个模块都做了详细的介绍,说了开发的流程和实现的方式,并且附上了关键代码和截图。并以数据流图的方式分别介绍网络论坛系统和字词过滤系统算法的执行流程。

第六部分则是对本系统和这篇论文的总结。这部分罗列了本次论文的参考文献,对本次系统的开发进行了经验总结,指出本系统的可完善之处和一些未来的期望。并且对在开发过程中援助过我的人表达了感谢。

2 相关技术

2.1 javaEE介绍

2.1.1 ssi介绍

javaEE是一套基于java的技术方案,是一套开发分布式企业级应用的规范和标准。

javaEE应用程序由一个个组件构成,组件之间相互独立,具有各自的独立功能单位,他们通过相关联的类和文件组成一个整体的javaEE应用程序,并具备其他独立组件交互的能力。

基于javaEE的技术包含Web Service、Struts、spring、hibernate、JSP、Servlet、JSF、EJB、JavaBean、JavaSE、JDBC、JNDI、XML等。

关于java语言本身的特性这里就不在重复累赘了。我们重点介绍下本系统所用的基于javaEE的技术,即ssi。

这里的ssi并不是spring struts2 ibatis,而是spring springmvc ibatis。

spring

剩余内容已隐藏,请支付后下载全文,论文总字数:39899字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;