随机森林模型在股票预测中的应用——以上汽集团为例

 2022-06-28 11:06

论文总字数:23647字

摘 要

股票市场被视为经济金融体系的重要支柱,对于个体投资人来说,为了增加投资收入,必须对股价后期趋势进行科学预判和把控,对于政府管理部门而言,具备活力的股票市场对于我国这样一个处于经济转轨制的国家其重要性也不言而喻。随着计算机技术和统计学理论的发展,越来越多的机器学习方法开始被应用于股市研究领域,其中,随机森林模型是一种经常被用于分类的新兴算法。相比较单棵决策树而言,其拥有运行速度快和预测精度高等一系列优点。基于此,本文重点从该模型着手,首先通过研究大量文献总结和归纳了随机森林模型的原理和建模步骤。然后结合股票市场探讨了利用随机森林对于预测股票次日涨跌的建模过程,并分别选取了近几年沪深300指数(600104.SH)于三种趋势(上升、水平、下降)的历史交易数据进行了实证分析,从而论证了随机森林模型对预测大盘的次日涨跌存在一定指导作用,且当股市整体走势为下降趋势时,其预测准确率最高。

关键词:股票预测,随机森林,沪深300

Abstract

The stock market is regarded as an important pillar of the economic and financial system. In terms of individual investors, the more accurate the prediction of future stock price changes is, the more confident it is to obtain profits and avoid risks. For the government, the stock is full of vitality. The importance of the market for China’s country in an economic transition system is also self-evident. With the development of computer technology and statistical theory, more and more machine learning methods are being applied in the field of stock market research. Among them, the random forest model is an emerging algorithm that is often used for classification. Compared to the decision tree, it has a series of advantages such as good operation and high prediction accuracy. Based on this, this paper focuses on the model. First, through the study of a large number of documents, the principle and modeling steps of the random forest model are summarized and summarized. Then, combining with the stock market, the modeling process of the random forest for forecasting the next day's ups and downs of stocks was explored, and historical transactions of the CSI 300 index in three trends (rise, level, and decline) were selected respectively in recent years. The empirical analysis of the data shows that the random forest model has a certain guiding role in predicting the next day's ups and downs of the broader market, and when the overall trend of the stock market is a downward trend, it has the highest forecast accuracy rate.

KEY WORDS: stock price forecast, random forest, CSI 300

目录

摘要 I

Abstract II

第一章 绪论 1

1.1研究背景和意义 1

1.1.1研究背景 1

1.1.2研究意义 3

1.2国内相关研究现状 3

1.2.1 关于股票市场的传统分析方法研究 3

1.2.3 基于统计理论或计算机技术的股市分析方法 6

1.3论文主要内容 9

第二章 随机森林模型概述 10

2.1随机森林模型的发展历程 10

2.2随机森林模型的原理 13

2.3随机森林模型的应用条件和过程 13

第三章 随机森林模型在预测股票走势中的应用 15

3.1随机森林模型对于预测盘整次日涨跌的适用性分析 15

3.1.1随机森林基分类器—单棵决策树的构建 15

3.1.2数据来源和参数说明 16

3.1.3预测效果分析 16

3.2不同趋势下随机森林模型对于盘整次日涨跌的适用性分析 18

3.2.1 三种股市趋势 18

3.2.2 沪深300指数处于三种趋势下的实证分析 19

第四章 总结与展望 24

致谢 25

参考文献 26

附录 27

第一章 绪论

1.1研究背景和意义

1.1.1研究背景

股票市场是观察和监测经济实时操作的最直接的指标,是国民宏观经济的“报警器”和“晴雨表”,被视作经济金融体系的重要支柱。这几年来,我国的股票市场迅速壮大和发展。

根据资料显示,1991年我国的上市公司数量仅有14家,经过了二十多年的发展,至今该数量已超过了3600家,股市的规模也从1992年的1048 亿元扩张到了如今的50多万亿元。我国已经成为全世界最主要的股票投资市场之一,其活跃度和交易规模一举上升至世界第二位。

表1-1 2000-2017年中国股票市场的规模变动

年份

上市公司总数

总市值(万亿元)

2000

1088

5.07

2001

1160

4.63

2002

1224

4.09

2003

1287

4.56

2004

1377

3.99

2005

1381

3.49

2006

1434

10.35

2007

1550

40.12

2008

1625

14.83

2009

1718

29.07

2010

2063

30.52

2011

2342

25.01

2012

2494

26.78

2013

2489

27.23

2014

2687

37.26

2015

2827

50.33

2016

3052

53.13

2017

3485

56.62

数据来源:Wind资讯

由表1-1可看出,自从步入二十世纪以来,我国的上市公司总数和总市值都在不断上升,股票市场的规模也在不断地扩大。

剩余内容已隐藏,请支付后下载全文,论文总字数:23647字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;