多目标进化分类算法设计与实现

 2022-01-17 11:01

论文总字数:28634字

目 录

1 绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 2

1.3 主要研究内容 3

1.4 论文组织结构 4

2 分类问题 4

2.1 分类问题的描述 4

2.2 分类算法 5

2.3 本章小结 7

3 多目标问题 8

3.1 多目标问题的描述 8

3.2 多目标进化算法 8

3.3 本章小结 15

4 多目标进化分类算法 15

4.1 多目标进化分类算法的设计 15

4.2 多目标进化分类算法的实现 17

4.3 本章小结 20

5 实验及结果分析 20

5.1 实验数据集 20

5.2 实验参数设置 21

5.3 实验结果分析 21

5.4 本章小结 32

6 结束语 32

6.1 总结 32

6.2 展望 33

参考文献 33

致谢 35

多目标进化分类算法设计与实现

王小琴

,China

Abstract:There are various classification problems in various fields of daily life, engineering practice and scientific research, and most of these problems are multi-category problems. Traditional data processing and processing methods are far from meeting people's requirements for the promptness and accuracy of data information. Moreover, most current classification algorithms pursue the best overall classification accuracy, which easily leads to local optimization, that is, a certain category has high classification accuracy, and other categories have low classification accuracy. However, the classification problem in the real world is often very important for the classification accuracy of each category. Therefore, a class of local optimization problems can be solved, which can not only improve the overall classification accuracy of the classifier, but also ensure the classification accuracy of each category is relatively high. The classification algorithm is of great significance to our daily life and scientific research. In this paper, I propose a new classification algorithm: multi-objective evolutionary classification algorithm. It performs multiple evolutionary operations on all randomly generated classifier parameters through a multi-objective evolutionary algorithm, and selects the optimal classifier parameters into the classifier to complete subsequent experiments. The biggest advantage of the multi-objective evolutionary classification algorithm is that it constructs a classification objective function for each category. In the process of parameter evolution, the classification accuracy of each category will be considered, so as to ensure that the algorithm finally obtains the classifier for each the classification accuracy of the categories is relatively high, avoiding local optima. In order to test the classification performance of the multi-objective evolutionary classification algorithm, the experimental part selected five different data sets in the UCI machine learning library for experimentation. The data set was first divided into two parts. The first 80% data was used as the training data set, and the last 20% data is used as a test data set, and then multiple experiments are performed on each data set to obtain the overall classification accuracy rate of the test data set by the classifier and the classification accuracy of each category. Then, five data sets are calculated by calculation. The highest classification accuracy, average classification accuracy, and lowest classification accuracy after multiple experiments. Finally, the experimental data are analyzed and the conclusion is reached: the multi-objective evolutionary classification algorithm optimizes the classifier parameters through the multi-objective evolutionary algorithm, and the classifier achieves the highest relative classification accuracy for each category, avoiding the local optimum, and Better classification performance.

Keywords:Classification problem; multi-objective evolutionary problem; classification algorithm; multi-objective evolutionary algorithm; NSGA-II

1 绪论

1.1 研究背景及意义

二十世纪九十年代以来,随着信息技术和互联网的大规模普及和应用,尤其是数据库技术的迅猛发展,工程实践、科学研究、教育等各行各业所产生的数据量正呈现出一种指数增长的趋势,有些行业的数据规模已经达到数百TB甚至数十至数百PB,比如百度的总数据量已超过1000PB,每天需要处理的网页数据达到10PB~100PB,淘宝累计的交易数据量高达 100PB,Twitter每天发布超过2亿条消息,微博每天发布超过8000万条帖子,中国移动一个省一个月的电话记录数据有 0.5PB~1PB [1]。而且有相关公司的研究报告曾预测:全世界的数据量将在未来10年内,从2009年的0.8ZB增长到2020年的35ZB (1ZB = 1000EB = 1000000PB),这10年将增长44倍,年均增长高达40%,由此我们可以知道研究出一种对数据可以进行高效处理的技术是非常迫切和重要的。近年来,全世界的学术界、工业界和各国政府都非常关注和重视大数据技术的发展,并且在全球范围内掀起了一股大数据技术研究热潮。在2012年12月的时候,美国就曾研究讨论出台过一份《规划数字化未来》的战略报告,该报告列举了五个与我们生活息息相关的挑战,其中最重要的一个挑战就是大数据问题,如何对正在呈指数增长的数据进行收集、保存、管理和分析是我们必须要面对的重大挑战。为了顺应大数据时代的发展,我国各行各业的研究者也从未停止过对大数据技术的探索,在2013年,央视著名节目“对话”曾邀请了《大数据时代——生活、工作与思维的大变革》的作者维克托·迈尔-舍恩伯格和美国大数据存储技术公司LSI总裁阿比做了两期关于大数据的谈话节目:“谁在引爆大数据”和“谁在掘金大数据 ”。这两期节目一经播放就引起了社会和很多相关研究学者的关注,他们纷纷开始加入大数据技术研究的队伍。

大数据时代的到来也就让数据信息越来越显示出其重要性和支配力,尽管人们现在获取和存储大量数据已变得十分便捷,但是在面对海量数据时,以前的数据处理方式在分析数据内在联系和探索隐含信息方面就出现了很多的不足,而且由于人类活动范围越来越大,生活节奏越来越快,传统的数据加工处理方法已经远远不能满足人们对数据信息的即时性和准确性的要求。甚至因为当今海量数据的分析处理过程越来越复杂,分析周期越来越长,造成了“丰富的数据,贫乏的信息” [2]这一现象。为了改善这种现象,人们开始利用计算机强大的数据运算能力对海量数据进行分类处理,让它能够自动地、智能地把数据转化成有用信息。但是怎样才可以准确、有效的从已知数据中提取出潜藏的规则,并且从里面发现我们所需要的信息,这是当前很多研究者都在讨论的热点之一。所以,为了更好的分析海量数据,设计出一种准确的、有效的数据分类算法已经迫在眉睫。

剩余内容已隐藏,请支付后下载全文,论文总字数:28634字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;