近十年国内外大气科学领域研究热点演进的知识图谱分析——基于WoS和CNKI论文视角的比较

 2022-01-17 11:01

论文总字数:30706字

目 录

1 引言 6

1.1研究目的和方法 6

1.1.1研究目的 6

1.1.2研究方法 6

1.2研究思路及结构框架 7

1.3本文创新之处 7

2国内外知识图谱研究综述 8

2.1国外知识图谱研究综述 8

2.2国内知识图谱研究综述 9

3期刊样本选择与数据来源 10

3.1期刊样本选择 10

3.2 数据来源 11

4国外大气科学领域研究热点评析 11

4.1国家和机构分析 11

4.2文献共被引分析 13

4.3关键词共现分析 16

4.4关键词聚类分析 18

5国内大气科学领域研究热点评析 19

5.1构建关键词共现矩阵 19

5.1.1数据统计 19

5.1.2高频关键词矩阵 20

5.1.2.1构建共现矩阵 20

5.1.2.2构建相关矩阵 21

5.2高频关键词的因子分析 23

5.2.1相关系数矩阵 23

5.2.2对高频关键词提取因子 24

5.3高频关键词的聚类分析 28

5.3.1高频关键词层次聚类分析的凝聚状态表 29

5.3.2高频关键词层次聚类分析的树状图 31

5.4 Ucinet社会网络分析 32

5.4.1 高频关键词的共现网络图 32

6 国内外研究对比分析 33

7 结论与展望 34

参考文献 35

致谢 37

近十年国内外大气科学领域研究热点演进的知识图谱分析

蔡恒

Abstract: Through the visual analysis of literature text and citation data of impact factor TOP10 journal in atmospheric science in Web of Science and CNKI show: (1) the number of papers and cooperation of major international areas and institutions; (2) using visual analysis software of Citespace to draw the co-occurrence analysis and cluster analysis map of high frequency keywords in international atmospheric science to show the study on evolution of international research focus in the field of atmospheric science; (3) using Bicomb software to extract the high frequency keywords in domestic field of atmospheric science to generate co-occurrence matrix, analyzing high-frequency keywords with factor analysis and cluster analysis by SPSS1.9, obtaining the research direction and research focus of atmospheric science in domestic field ; (4) analyzing high frequency words with social network analysis by Ucinet software, showing the research hotspots of domestic atmosphere science and their connection directly. Finally, analyzing and comparing the research results at home and abroad quantitatively and qualitatively, drawing the conclusion and put forward some suggestions.

Keywords:Atmospheric science; Mapping Knowledge Domain;Factor analysis;Cluster analysis;Social network analysis

1.引言

自建国以来,由于国内气象事业蓬勃发展,在一些大气科学相关基础性研究领域,取得了引人注目的成绩,甚至在很多研究领领先于国际大气科学相关领域的研究。即就是自大气科学领域开始研究,我国大气科学学科现在已成为大气科学领域主要学科。

那么国内大气科学领域研究状况又到底怎样呢?从往年大气科学领域研究的成果来看,国际大气科学领域的研究在地球科学相关领域研究中占的比例不到一成,在相关研究领域的研究中位居第五。然而我国大气科学领域的研究在地球科学相关领域研究中占的比例不足百分之七,更是比国际比例还要低。我国大气科学领域的研究的成果占国际大气科学领域研究成果的比例不到百分之二,在相关学科研究领域中位居第十。而国内大气科学类期刊在地球科学学术期刊排名中也是比较靠后的。由以上国内外大气科学领域研究的成果分析可知,我国大气科学领域的研究在研究成果上和国际大气科学领域的研究成果还不能相提并论,所以我国大气科学领域的研究进展与国际大气科学领域的研究还是有一定的差距。本文将会研究国内大气科学领域与国际大气科学领域的不足和差距以及如何更好发展[1]

1.1研究目的和方法

1.1.1研究目的

大气科学领域研究的问题涉及到人们生活的方方面面,探讨的话题备受关注,大气科学领域的研究一直在不断地发生着变化,之前研究人员对于大气科学领域的研究都是涉及到各个应用领域,大多数研究成果的可信度也比较高,却仍然没有研究人员对于国内外大气科学领域的发展情况、研究体系结构、研究方法和研究思路系统地研究过,单独的理论性研究或者是实践性研究不能解决上述问题。所以本研究将通过运用科学知识图谱来探讨和研究大气科学领域的发展进程来解决以上说明的问题,能够得出比较综合、系统的基于大数据的研究结果,从而能够挖掘出国内外大气科学领域的研究缺陷。本文研究的目的主要有以下几点:

(1)通过运用科学知识图谱来探讨和研究大气科学领域的发展进程与研究思路,能够得出比较综合、系统的基于大数据研究的结果,从而能够挖掘出国内外大气科学领域的研究缺陷,发现大气科学领域的研究热点和发展趋势。

(2)本文现对大气科学领域研究成果进行定性研究,再对其进行定量研究,增加本研究的逻辑性,为大气科学领域理论研究提供新的思路和视角。

(3)对国内外文献的分析,得出2006年到2015年来国内大气科学领域研究的不足,以便促使我国大气科学学科将来更好地发展。

1.1.2研究方法

本文现对大气科学领域研究成果进行定性研究,再对其进行定量研究,在进行定量研究时,运用科学知识图谱描绘出定量分析的结果。通过把研究成果中的高频关键字或研究前沿热点在科学知识图谱中以图表的形式直观地展现出来。科学知识图谱可以通过数据处理、图形描绘把大气科学领域研究成果中复杂的关键条目、关键知识绘制出来,以便研究者可以大体的了解大气科学领域的研究状况,对大气科学领域研究有一个整体的、系统的认识,给科研人员选择研究方向提供方便。目前运用科学知识图谱研究领域热点是科学计量学比较常用的研究方法,是以众多学科为理论基础的研究方法,也是科学计量学领域很重要的研究方法。科学知识图谱中常用的分析主要有引文分析、共被引分析、共现分析、因子分析、词频分析等。本文将会使用到的分析软件包括Citespace、Bicomb、SPSS和Ucinet。

CiteSpace是一款英文版的科学知识图谱软件。科学知识图谱软件可以对大量的研究文献进行统计分析,可以把文献中的各项条目进行处理、分类,对一些研究领域进行预测等。在本研究中用于确定大气科学领域的研究地区、机构、作者和期刊及他们之间的内部联系,确定研究地区大气科学领域研究成果产出,以图表的形式描绘出大气科学研究领域的演进变化。CiteSpace 在本研究中的功能主要有:一对大气科学领域研究成果进行国家和地区合作分析,得出大气科学领域研究地区的大致分布;二是可以清晰地看出大气科学研究领域的热点关键词,从而确定该领域的研究热点;三是进行关键词聚类分析,预测大气科学领域的研究方向[2]

Bicomb软件是目前关键词共现分析最流行的统计分析工具,它的开发最初是用于对医学文献信息进行处理,通过数据导入,关键词提取,统计分析,生成矩阵等环节便可以进行高频关键词矩阵分析,能够为研究领域相关人员研究提供比较全面的文献状况。Bicomb在本研究中主要用于:一对大气科学领域研究成果中关键词条目的进行统计并且生成共现矩阵 [3]

SPSS(Statistical Package for the Social Sciences)软件20世纪70年代年由美国大学的研究生开发的,主要面向中小客户,现在已成为会科学领域应用的最广泛的软件工具之一,在知识图谱绘制时,SPSS统计软件常用于对关键词相异矩阵进行因子分析、聚类分析、多维尺度分析等[4]

Ucinet软件是社会网络分析最常用的软件工具之一,该软件工具能读取文本文件、Pajek、Excel等格式的文件,可以对32767个关键词进行中心性分析、子群分析、角色分析和基于置换的统计分析等社会网络研究中常见的分析[5]

1.2研究思路及结构框架

在本研究撰写过程中,利用图书馆和网络翻阅很多大气科学领域中的英文文献和报告,对国内外大气科学领域研究现状进行总结。通过对国内大气科学领域研究现状的比较和分析,为我国大气科学领域研究提供了有力的理论支撑和重要经验。本文分为七章,研究框架如下所示。

  1. “引言”,介绍了本文的研究目的和方法、研究思路及结构框架和本文的创新之处。
  2. “国内外知识图谱研究现状”,分别介绍了国内外知识图谱研究现状。
  3. “样本期刊选择与数据来源”,介绍了期刊样本的选择和数据的来源。
  4. “国外大气科学领域研究热点评析”,对发文地区及机构进行统计和机构和关键词共现可视化分析。
  5. “国内大气科学领域研究热点评析”,对国内数据进行高频关键词共现分析、因子分析、高频关键词聚类分析以及社会网络分析。
  6. “结论”,得出结论。

1.3本文创新之处

本文的创新之处有:(1)第一次把科学知识图谱同时应用到国内和国际大气科学领域研究成果的研究中,分别深层次地挖掘出国内和国际大气科学领域的研究热点;(2)通过对国内和国外大气科学领域热点研究和热点演进状况进行对比分析,通过知识图谱可视化的视角展示了国内外大气科学领域的研究热点,展现出国内外大气科学领域的演进区别。

2.国内外知识图谱研究现状综述

2.1国外知识图谱研究综述

从一开始科学计量学一直都是用公式来表达科学知识的活动规律,由于近几年来科学知识图谱在各个领域的应用和蓬勃发展,科学计量学便开始用图表来表达科学知识的活动规律。照这样说来,普赖斯是最先发现科学知识指数增长规律的研究者,科学知识指数增长规律是他早期运用科学计量学的方法发现的。一开始是用二维结构表述活动规律,也是因为科学计量学的发展,开始以空间立体图来表述,知识图谱也是在这个时候从二维形式转化成空间立体图。

雷奇默的研究有力地促进了知识图谱的蓬勃发展,因为他主要是研究空间立体图。现在各个领域的研究人员都可以通过科学知识图谱了解本领域研究成果的大数据体系,了解本领域研究的整体水平和大致趋势,直观分析基于大数据形成的数据网络图,因此,科学知识图谱的应用基本上涉及到了各个行业和领域。Liu, G.使用知识域可视化技术比较太赫兹技术在1990年和2010年之间研究现状,这项研究为太赫兹领域技术创新和知识提供了一个全面的域可视化的地图,结果表明,在任何给定的字段的专利和论文中Aureka和CiteSpace是两个有前途的可视化分析方法[6]。Niazi, M.,Hussain,A.使用基于代理计算的科学计量来分析所有子域,使用网络工作台和CiteSpace两个应用程序进行分析,在网络工作台允许域的复杂网络的分析方面,使用基于可视化的CiteSpace进行书目数据分析,结果发现发现基于代理计算存在许非计算的相关科学领域,包括生命科学、生态科学和社会科学[7]。Ge Qian运用科学计量学和科学可视化技术CiteSpace评估生物能源的发展,生物能源领域的知识结构是基于ISI科学网络数据库中1973年至2012年之间2237篇关于这个主题文章的, 结果发现在这个领域最热门的关键字为生物能源,生物质能,能源,生物燃料,乙醇,柳枝稷和管理[8]。Chaomei Chen,Il-Yeol Song,Xiaojun Yuan等提出了概念地图和网络可视化来说明新兴主题突出的模式和趋势,主题域的概念结构是由聚类分析确定。各种统计报告强调关键贡献者对DKE论文产生了深远的影响。Chen CM在科学文献和瞬态模式中描述了一个通用的最新发展和可视化新兴趋势的检测方法,建模和可视化过程中使用CiteSpace II,并应用于分析两个研究领域:灭绝(1981 - 2004)和恐怖主义(1990 - 2003)。并对工作的实际意义进行了讨论,确定了很多未来面临的挑战和机遇[9]。Chaomei Chen,Zhigang Hu,Shengbo Liu等引用3875篇在2000和2011之间再生医学主题的文章逐步合成网络获得,CiteSpace用于促进知识结构的分析和新兴趋势,发现最近的一个新兴趋势的重点是结构和功能之间的等价万能和人类胚胎干细胞在再生医学临床和治疗的潜在影响。这两种趋势他们引用的重叠,但他们是不同的,对未来的研究有不同的影响。文献的可视化分析提供了一个宝贵的,及时的,可重复的和灵活的方法。Ganping Ma使用在神经科学的最新科学计量工具CiteSpace II专注于人工智能的发展和研究趋势分析。通过分析关于人工智能和神经科学1990年到2012年之间的数据,掌握人工智能在神经科学的研究前沿和趋势。[10]Huiling Chen,Guoqing Zhao等借助信息可视化软件CiteSpace揭示了知识可视化领域的热点和发展趋势,分析了2000年和2011年之间发表在科学的Web数据库的文献。得出结论是基于CiteSpace分析所产生的视觉知识地图的关键文章为进一步的研究提供有意义、价值的参考。研究表明,研究主要集中在技术、可视化表示形式,应用和理论知识。此外,在这个领域的研究在最近五年已经从基本理念和技术转移到越来越复杂的技术和应用程序。Jian Liu利用CiteSpaceⅢ可视化分析元数据研究提供了发展趋势和专业过渡。结果清楚地表明关键节点和元数据研究领域的经典文献,基于这些关键的节点,可以发现元数据研究经历了四个专业转换,结果将促进进一步了解元数据研究领域的新兴趋势。[11]

2.2国内知识图谱研究现状综述

国内各个研究领域基于知识图谱的统计分析大多是对其进行定量研究,在理论模型和研究工具方面,都是由国外学者领先发明并应用于各个领域的,国内的研究者在研究理论、软件工具等方面缺乏自己的创新思维。

剩余内容已隐藏,请支付后下载全文,论文总字数:30706字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;