聚类分析在教育评估模型中的应用

 2022-01-17 11:01

论文总字数:17586字

目 录

1.绪论 1

1.1聚类分析背景 1

1.2 聚类分析的应用领域 1

1.3 聚类分析的现实意义 2

1.4 我国教育的现状 2

1.5 论文内容安排 2

2.聚类分析的基本概念及其应用 3

2.1 聚类分析基本概念 3

2.2 类的概念 3

2.3 聚类过程

3.Q型和R型聚类分析 5

3.1 Q型聚类分析 5

3.1.1.样本的相似性度量 5

3.1.2类与类间的相似性度量 6

3.1.3 聚类分析数据变换处理 7

3.1.4. 聚类图

3.2 R型聚类分析

4.Q型和R型聚类分析在教育评估模型中的应用 11

4.1 引言 11

4.2 方法 11

4.3对教育模型的聚类分析

5.论文展望与总结 20

致谢 20

参考文献 22

聚类分析在教育评估模型中的应用研究

徐江涛

, China

Abstract:Cluster analysis is hoped by some standards will be different objects into different groups as possible, as much as possible with the same group, different groups try to be different. This thesis is to study the cluster analysis in educational assessment model applied, respectively, with each sample cluster analysis to regions and provinces in the development of education variables cluster analysis of indicator variables for each province affected areas were analyzed. Sample Cluster Analysis can analyze the development of education in which the more developed provinces in the region, which areas are underdeveloped provinces, and classify the degree of development of all regions as needed. The index variable analysis which can analyze large indicator variables for the development of education in the region affected, what factors affect the smaller, so as to provide basis for improving the level of education development in the region. Finally, the first chapter is the background of the development of cluster analysis and practical significance for a detailed introduction, the second chapter will detail the process of defining and clustering analysis cluster analysis class, the third chapter Q poly class analysis and R cluster analysis brief introduction, Chapter IV of the cluster analysis model for educational evaluation and classified according to the results of cluster analysis, the fifth chapter of the thesis summary and outlook.

Key words: cluster analysis, education evaluation, Q cluster analysis, R cluster analysis, cluster diagram

第一章 绪论

人们认识世界是将识别类对象进行分类,如在对人类社会进化过程的研究中形成了生物研究演变史和人文历史,对于各种生物识别需要对它们进行分类于是形成了界,门,纲,目,科,属,种。事实上,对于复杂多元的样本进行分类研究,是要比在原始集合中研究更为清楚,简单明了和节省时间。因为同一类事物有更多相似的特征,更利于进行比较分类。随着社会和信息技术的高速发展,各行各业的信息量也越来越大,人们面临在浩如烟海的数据中找到潜在有用的信息的问题。人们需要将这些原始的数据进行更高层次的分析,聚类分析正是解决这一难题的有效途径。

1.1聚类分析背景

数据进行聚类分析是数据挖掘的一种重要的方法,用较为精确的数学研究法对于需要聚类分析的样本分类。聚类分析在统计学中占有非常重要的地位,既可以用于样品的研究(样品聚类分析),有可以用于对指标变量进行聚类分析(变量聚类分析)。随着人们聚类分析的研究和应用,又提出了模糊聚类的概念,应用于样本数据间分界不是十分明确的分类问题。如把人对于食物的口感问题分为“好吃”和“不好吃”,把人分成“高的人”和“矮的人”。美国加州大学的教授于1965年正式提出对于模糊聚类分析的概念,后来研究者在此基础上进一步提出明确了对于模糊聚类过程中遇到的各种问题的算法。聚类问题实际上是将一组样本数据分成若干个组,使同组里的样本数据特征最大可能类似,异组之间的样本数据特征尽最大可能不同。

聚类分析是一种定量方法来实现分类的,是从数据分析角度,比人们凭借经验和专业知识来实现分类更为准确和细致。由于近年来数据库的迅猛发展收集了大量的数据,研究者对聚类分析的研究也越来越重视,聚类分析已经成为人们生活中处理对复杂多元的样本数据归类的一种重要方法。聚类分析在进行分析时无需对类进行定义,这和分类是不同的,因为分类必须在分析之前定义,而聚类是一种无主动意识的分析。

1.2 聚类分析的应用领域

聚类分析是一个充满挑战的领域,在多个行业都可以应用。尤其是在近几年,聚类分析发展异常迅速。

在公司的生产实践中,需要对企业的市场进行规划细分。一个即使再优秀和多产的企业,都没有办法完全使市场处于饱和状态。而对于市场的精细规划,可以帮助该企业发现自己的优势并且找到一条适合自己发展的道路,这样可以让企业的潜力得到最大的发挥。在对于图像处理中,模糊聚类分析方法已经成为重要的研究分析工具,尤其在图像分割上应用的最为广泛。在医药研究中,如果考察同一种药材的相似性,可以用普通药材代替某些珍贵的药材,

这恰好符合聚类分析的特征,采用聚类分析可以自动化识别药材。在金融领域中的应用,从对金融市场未来发展的预测,到对判断过去金融市场是否满足经济发展规律或者是否健康的发展,均要用到聚类分析。聚类分析在文本中也有广泛的应用,聚类分析在文本中有广泛的应用,如K-means算法,它是对于文本聚类分析最为有效的一种方法。因为聚类分析在使用前无需定义,具有很强的自主性和多变不确定性,所以对于处理文本聚类分析是一种很方便的方法。

1.3 聚类分析的现实意义

聚类分析是一种多元统计法,主要方法有:系统聚类法,有序样品聚类法、动态聚类法、模糊聚类法、聚类预报法等等。随着社会信息技术的飞速发展,我们身边的事物也越来越复杂。在实际生活中,我们接触到的数据量也越来越大,对于这些数据的分类问题要求越来越高。例如,航空中各种零件规格的分类,考察城市生活中食品消费物价,建材价格,服务项目物价指数;考察某个省份企业的效益,和排放污染的问题等等,我们通常将这些问题的某项或者某几项指标变量进行聚类分析。随着科学技术的指数发展,在很多重要的并且与人们生活休戚相关的领域遇到的分类问题,如果我们能够对着这些领域的数据处理的很好,将会极大的提高我们的生产或者生活水平。

1.4 我国教育的现状

我国近几十年经济的飞快发展,国家对于国家未来的政治,经济,军事发展都制定了合理的发展战略,并且着重强调了教育在其中所起到的关键作用。我国的教育事业不仅仅培养了一代又一代的行业领军人物,还关系到我国未来的兴衰成败。随着社会的发展,我国现行的教育矛盾也越来越尖锐。由于每个地区省份的经济发展水平各不相同,而且每个省份的高校的布局也使各个地区的教育发展的起点不一致,所以各个省份的教育发展水平也一定存在着差距。由于国家投入的不科学使教育发达的地区更为发达,教育不发达的地区更为不发达。

1.5 论文内容安排

本文首先对聚类分析做深入的理论研究,较为全面的了解聚类分析。并且以数学公式的形式来精确表达聚类分析中的相关概念如:样本相似度测量,类的定义,相似性度量等概率内容。随后用Q型聚类分析和R型聚类分析做了教育评估模型。

本论文共由五章组成,对于文章的整体结构积极各章节内容如下:

  1. 绪论,将详细的介绍聚类分析的现状,应用领域并且描述了我国教育现状表达 了写此文的必要性。
  2. 论述了关于聚类分析的一些定义如类,相关系数等等。
  3. 详细的介绍了Q型聚类分析和R型聚类分析。
  4. 把Q型聚类分析和R型聚类分析在教育评估中进行应用。
  5. 回顾并总结全文。

第二章 聚类分析的基本概念及其应用

聚类分析算法是人们希望计算机能够依据某种标准将对象(类)自动分组,并且同组数据特征尽可能相同,异组特征尽可能不同。以往对于数据量较小的分类可以进行手工分类,但是当数据量非常大,甚至达到指数级的数据量时,再用手工分类就显得不切实际了。聚类分析算法作为一种有效的分析方法被广泛应用于数据深入挖掘、机器自助学习、市场细分、图像模糊分割、人工智能语音识别等等。本章将主要介绍聚类分析算法的基本概念和研究现状。

2.1 聚类分析基本概念

如果根据样本之间的距离来对聚类来定义需要明确两个概念:第一是样本点与样本点之间的距离,第二是样本类与样本之间的距离。对于点与点之间距离有很多种不同定义的方式。最简单的是欧式距离(将在下面介绍),还有其他距离等等。当然还有一些和距离起同样作用的概念,比如相像性等。若在样本空间的两个点之间的距离较短,那么说明这两个点之间的相似性很高,反之,两个样本点的相似度很高,则说明两个点之间的距离很短,那么归为一类的可能性较大。根据样本类之间的定义样本类是有样本点组成的,若是每个类中有且只有一个样本点,那么样本点之间的距离就是样本类之间的距离。正常情况下类中包含的样本点肯定不止一个,但是样本类间的关系是有样本点之间的关系来确定的,因为类中的样本点不唯一,所以对于样本点之间距离选择的不同,类间的距离也就不同。所以对于不同的数据的要求的不同,对于距离选择也就不同,结果也是不同的,但是其相对结果是不变的。

2.2 类的概念

世界上的每一种事物都有其固有的特征,这是我们区别其他事物的唯一标准。我们对于事物的特征的选择的不同,那么对于样本点聚类分析的结果也是不同。对于不同的事物的需求不同,所以对于样本类定义也是很不相同的。对于类的严格定义是不太可能的。但是可以给出以下几种常用的类的定义:

不妨假设集合R为有m个样本空间点,其中任一样本空间用表示两个点,其中i,j为任意值,用p和q表示其距离的极值。

剩余内容已隐藏,请支付后下载全文,论文总字数:17586字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;