我校2010级统计学专业培养方案下学生成绩的统计与分析

 2023-06-02 08:06

论文总字数:14879字

摘 要

利用因子分析和聚类分析这两种方法建立了综合评价模型,对我校2010级统计学专业51名学生的20门课程成绩进行实证分析。从20门科目中提取了6个符合实际意义的公共因子,给出了所有同学的综合排名,而后依据因子得分运用K-means聚类分析将51名学生归纳为6类,合理地分析了学生们在各学科间的优势和劣势,结合客观实际情况,指出学生在哪个行业就业具有更加明显的优势,所得到的评析结果还可以为我校统计学教学方案的制定和施行提供比较科学的参考依据。

关键词:学生成绩,因子分析,聚类分析

Abstract: Using the methods of factor analysis and cluster analysis to establish comprehensive evaluated model,do an empirical analysis on the scores of 51 students of Statistics Specialty in our college.The six common factors in accordance with practical significance is extracted from the 20 subjects, then uses factor scores based on K-means clustering analysis to divide all students into six categories on condition that it enumerates the ranking of all students. Reasonably analyzing students’ advantages and disadvantages in every subject, point out that in which industry field the recruited students have more personal competitive advantage in combination with the practical situation. The results provided a good reference for the comprehensive quality training of the students and improving the teaching quality.

Keywords: scores of students, factor analysis, cluster analysis

目 录

1 引言 3

2 综合评价方法模型 3

2.1 因子分析 3

2.2 聚类分析 3

3 实例分析 4

3.1 数据来源与数据处理 4

3.2 学生成绩的因子分析 4

3.3 学生成绩的聚类分析 9

4 模型结果分析 10

结论 12

参考文献 13

致谢 14

附录 我校2010级统计学专业51名学生的20门课程成绩 15

1 引言

多元统计分析是统计学的一个重要分支,比较常见的领域是金融和医药,在教育领域的应用还处于初步阶段,但已取得了良好的效果。在《基于因子分析与聚类分析的学

生成绩综合评价》一文中,王成和王继顺采用因子分析方法,在建立综合评价指标的基

础上,还对学生的成绩进行了比较系统的评估,并给出了具体的优势和劣势的度量。该方法一方面避免了单指标的片面性,另一方面用数学变化产生的权重来计算综合评价指标值,最后得到学生学业成绩评价的相关信息,有效避开了许多多指标法中存在的主观因素的问题。同时,因子分析方法可以解决课程过多的缺陷,建立共同的因素,这样就可以清晰地显示出对学生成绩的影响,同时对学生能力的发展也有促进作用。而一种分

类方法的建立是聚类分析的本质,它可以是一个很大的样本数据,根据他们的亲密程度在没有先验知识的情况下进行自动分类,这样有助于抓住关键因素,为剖析学生的成绩差异和个性特点提供帮助。鉴于此,本文结合多元统计分析原理,利用因子分析和聚类分析的方法对学生成绩进行综合评析,为学生的等级评定提供合理的依据,给出了比较科学的学生综合排名,客观地分析了学生在各学科间的优势和劣势,寻找出潜藏在学生成绩背后的个人实力,为我校统计学教学计划的制定与施行提供比较科学的参考依据。

2 综合评价方法模型

2.1 因子分析

因子分析是采用降维的思路,按照相关性的大小对原始变量进行分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量体现,这个基本结构称为公共因子。在某一具体问题中,我们可以尝试用最少个数的不可测的公共因子的线性函数与特殊因子之和来表述原来观测的每一分量。它的具体步骤为:

(1)观察原始变量是不是适合做因子分析。

(2)从中提取因子并求解因子载荷矩阵。

(3)旋转因子的解释。

(4)列出因子得分函数

(5)求得每一个样本的因子得分。

2.2 聚类分析

聚类分析是统计学中一种研究“物以类聚”问题的多元统计方法。在聚类分析的发展

过程中,使用得最多、最成熟的方法为K-means聚类分析法,所以本文将采用K-means聚类方法。其分析思路为:聚类分析是将许多样本或变量按照它们在性质上的亲疏程度加以区别,进而给出分类。本质是依照距离的长短将若干数据分为几个大类,以使得类内数据的差异尽可能的小,类间数据的差异尽可能的大。

本文利用K-means聚类分析方法,将因子分析所得到的因子得分作为新变量进行聚类分析,根据其结果来划分学生类别。它的具体步骤为:

(1)把样品粗略的分为K个初始类别。

(2)不断进行修正,逐一分配样本到其最近均值的类中去。重新计算得到新样本的类和失去样本的类的均值。

(3)重复第二步,直到没有元素进出。

剩余内容已隐藏,请支付后下载全文,论文总字数:14879字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;