计算机专业英语辅助写作系统设计与实现

 2022-01-17 11:01

论文总字数:21613字

目 录

1 绪论 1

2 开发环境介绍 1

2.1 Python及其IDE介绍 1

2.1.1 Python介绍 1

2.1.2 PyCharm介绍 2

2.2 MySQL介绍 3

2.3 Scrapy框架介绍 3

2.3.1 Scrapy介绍 3

2.3.2 整体架构 4

3系统分析 5

3.1 可行性分析 5

3.2 需求分析 5

3.2.1 用户需求分析 5

3.2.2 功能需求分析 7

4系统设计 8

4.1 系统总体结构 8

4.1.1 系统前台 8

4.1.2 系统后台 9

4.2 数据库设计 9

4.2.1 数据库E-R模型设计 10

4.2.2 数据库表设计 10

5系统实现 11

5.1 Scrapy获取词汇的实现 11

5.1.1 数据来源 11

5.1.2 页面分析 11

5.1.3 实现Spider 12

5.1.4 实现页面解析函数 13

5.2 数据存入数据库的实现 16

5.3 操作界面的实现 18

5.3.1 用户登录界面的实现 18

5.3.2 搜索界面的实现 20

5.3.3 其他操作的实现 21

6系统测试 22

6.1 功能测试 22

6.1.1 注册测试 23

6.1.2 登录测试 23

6.1.3 词库操作测试 24

6.2 非功能测试 25

6.2.1 界面测试 25

6.2.2 健壮性和性能测试 25

7总结 25

参考文献 26

致谢 27

计算机专业英语辅助写作系统设计与实现

单光胤

,China

ABSTRACT:With the development of globalization, international academic exchanges are becoming more frequent. For some non-English majors or poor English learners, it is difficult to write semantically accurate English sentences. In order to help these researchers write authentic English articles which are easy to understand by foreign scholars, this paper designs and implements an English assisted writing system for computer majors.The system first uses the Scrapy crawler framework based on Python language to get the word data from the web and store it in MySQL database.Then the user interface is implemented based on the C# language.In addition to a series of word operation functions, such as word query, word modification, word addition and deletion, it also has the function of word recommendation, which greatly improves the efficiency of English writing.

Key words:Python; C#; MySQL database; Scrapy crawler

1 绪论

《圣经》中记载着这么一则故事——在很久很久之前人类都使用同一门语言,相互之间没有交流的隔阂。为了能见到他们所信仰的上帝,人类便计划建一座能直通云端的高塔。因为人多力量大再加之沟通方便,塔的高度飞快地增加着。眼看着塔快建成了,上帝害怕自己的神秘不再,就施法让人类一夜之间变得说不同的语言。由于失去了畅通无阻的交流,塔的修建无法再继续下去,计划被搁置一旁。虽然这只是一个传说,我们无从考证,但是却让我们知道,语言的不同是不同国家人们交流最大的阻碍。在当今世界不断发展的背景下,不同语种之间的交流障碍变得尤为突出。因此,机器翻译成为了各国争相研究的重点。上世纪中叶初期,在第一台现代电子计算机ENIAC研发成功不久之后,就有两位科学家提出了利用计算机进行翻译的构思[1]

机器翻译在20世纪70年代以来进入了发展新阶段。当时各国都加大了对机器翻译的研究,大量的资源被投入进来,各种实用性软件和翻译系统频现。之后十年随着互联网大容量存储计算机的出现,大量翻译工具出现,如多语文字处理、信息传递的输入输出、词汇术语资源管理等。

我国机器翻译的研究开始于1956年。受当时国际经济,政治的影响,我国与前苏联的各方往来十分的频繁。为了满足中俄沟通的需求,MT翻译系统被研发出来。80年代后期,我国机器翻译的研究开始步入高速发展阶段,KY-1和IMT/EC863这两个翻译系统相继被开发出来。随着科学技术的不断发展,我国的科技公司推出了一系列的翻译软件,如“即时通”,“汉神”,“朗道”等[2]

机器翻译可以根据自动化程度的不同分为自动翻译和辅助翻译。前者翻译速度快,能满足用户简单的需求,但是因为人不直接参与翻译,所以很难获得高质量的翻译。而辅助翻译由于人机间的相互协助,因而能够获得高品质的译文[3, 4]。尽管目前机器翻译的研究取得了不错的成果,但是与人工翻译比起来还是有不小的差距,对于一些结构复杂的语句机器翻译还是不能做到百分百精准的翻译。因此,在翻译领域,计算机辅助翻译系统仍然发挥着重要的作用[5]

本文着重于研究计算机专业方面的英汉双语例句检索系统,不同于其它辅助写作系统直接运用市面上现成的词库来源,本文首先通过研究网络爬虫来亲自获取系统所需要的词库,这一部分主要用到了Scrapy框架技术。解决了词库问题,接着便是数据库方面的选择研究,这一块经过多次试验,最后在MongoDB与MySQL数据库间选择了后者,相对于MongoDB,MySQL数据库功能更为强大,检索更为的便捷。由于Windows窗体技术在搭建界面方面美观,高效,系统便采用这种技术来构建用户操作界面。最终,本系统能够通过查询用户输入的信息并将相应结果反馈给用户来帮助用户解决写作中碰到的难题。

2 开发环境介绍

2.1 Python及其IDE介绍

2.1.1 Python介绍

上世纪八十年代末,Guido van Rossum在荷兰一家研究所设计出了Python这门语言。这门语言目前有Python 2与Python 3这两个版本。虽然这两大版本有许多相似的功能,但是在语法和代码处理方面有着不小的差异。Python 3被看做是Python的未来,开发团队也声明将于2020年完全停止对Python 2的支持。目前Python 2相较于Python 3的优势是对于大量封装库的支持,但随着时间的推移这种优势也将不复存在。

Python具有很强的可读性,这也是这门语言给人的最直观的感受。不同于其他语言以大括号来区分程序段,Python采用了代码缩进的方法来区分程序段——不同的缩进距离代表了不同的部分,这种做法大大提高了代码的可读性和美观性。更进一步地说,Python是一门解释性的,面向对象的语言,前者体现在Python的项目在开发时不需要进行代码的编译处理,这与JAVA等语言不通,后者则说明Python具有面向对象编程的功能。此外,Python还具有上手难度低,代码维护方便等特点。

大数据是如今互联网上被提及最广泛的词,Python也因为其简单易学的特点和海量的数据处理库成为了大数据分析时代炙手可热的语言。

2.1.2 PyCharm介绍

PyCharm是一款为Python编程而设计的智能代码编辑器。它能识别Python代码的特性并提供了一系列的提高编程效率的工具,如代码重构、代码自动格式化、代码自动完成等。其主要功能如下:

  1. 编码协助:这款IDE(集成开发环境)能根据用户输入的内容智能弹出之后的代码提示供用户选择,大大提高了编程效率。
  2. 项目代码导航:通过使用Ctrl N快捷键,PyCharm能帮助用户在项目所包含的文件,方法间实现快速的切换。
  3. 代码分析:用户能根据诸如错误代码高亮显示,代码一键自动补全等功能达到优化程序的目的。
  4. Python重构:该功能可以帮助用户将代码提取为函数/变量/常数/字段/参数,对文件进行复制、移动、重命名以及安全删除等操作。
  5. 集成版本控制:在VCS(版本控制系统)界面中,不同用户可以进行登入,登出操作,确保不同开发人员涉及的同一文档得到及时更新。
  6. 支持Google App引擎:开发人员能运用这款IDE开发使用谷歌App内核的应用程序,并在谷歌服务器上部署,运行开发的应用程序。
  7. 支持Django:针对Django开发进行高级支持,包括特定代码导航、代码智能完成,代码重构等,用户可以更加方便的进行网站开发。
  8. 可视化调试器:用户可以通过IDE内置的调试器来调试脚本文件,这款调试器能实现设置断点,浏览帧以及观察变量的状态等功能。
  9. 集成的单元测试:PyCharm可以自动在项目文件中帮用户创建单元测试,对方法、类、文件或者整个项目进行测试。
  10. 可扩展:PyCharm具有丰富的拓展选项,不仅可以拓展包还能够安装各类插件如安装TextMate来进行文件的拓展以及编辑各种代码等。

2.2 MySQL介绍

MySQL是一种开源的关系型数据库管理系统,它使用SQL这种常用的标准化语言来访问数据库。MySQL具有使用成本低、速度快,体积小的特点,再加上它开放源代码的特点,因而成为了中小型网站开发时的数据库首选。MySQL还具有良好的拓展性,可以跟其他语言组成一个优良的开发环境。

MySQL采用的是C/S结构(客户/服务器体系),因此在实际使用时,有两个程序:一个是客户端程序,它负责与服务器进行连接,并通过用户输入的命令来通知数据库进行何种操作;另一个是服务器程序,它负责接收客户端收到的用户请求,并根据请求对数据库中的内容进行操作,最后把操作结果返回给用户。

剩余内容已隐藏,请支付后下载全文,论文总字数:21613字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;