基于MIV-PLS的第二产业电力消费研究

 2022-01-17 11:01

论文总字数:24730字

目 录

摘要 I

Abstract II

1引言 1

1.1研究背景 1

1.2国内外研究进展 1

2 资料和数据处理 2

2.1资料 2

2.2 MIV的数据处理 3

2.2.1 MIV算法 3

2.2.2解释变量的MIV处理 3

3 偏最小二乘回归模型 4

3.1偏最小二乘线性模型 4

3.1.1偏最小二乘的基本原理 4

3.1.2交叉有效性 5

3.2基于样条变换的偏最小二乘非线性模型 5

3.2.1B样条基函数 5

3.2.2偏最小二乘非线性模型的建立 6

3.3辅助分析技术 8

3.3.1精度分析 8

3.3.2组间相关关系的结构分析 8

3.3.3特异点发现 8

4第二产业电力消费回归模型 10

4.1偏最小二乘线性模型的建立 10

4.1.1 PLS线性回归模型的求解 10

4.1.2对PLS线性模型做辅助分析 12

4.2偏最小二乘非线性模型的建立 15

4.2.1 PLS线性回归模型的求解 15

4.2.2对PLS非线性模型做辅助分析 15

4.3线性模型与非线性模型对比 17

5 结论及结束语 18

参考文献 19

致谢 21

基于MIV-PLS的第二产业电力消费研究

刘鑫

, China

Abstract: This article uses Chinese second industry electricity consumption data from 2007 to 2016 as the object of this study, then we select 15 explanatory variables such as the production of raw coal, ten non-ferrous metal production, flat glass, synthetic rubber, cloth and raw coal for analysis from the industry of black meta, non-ferrous metals, building materials, chemical, light and other. First, we use the MIV(Mean Impact Value) which is based on neural network to remove the variables that influence the dependent variable in the last 10%.Then use the culled data as the new data to establish the PLS(Partial Least Squares) linear regression model and the PLS nonlinear regression model based on the spline transformation. Meanwhile, we use cross-validation, precision analysis, index of importance of variable projections, correlation between groups and discovery of singularities to judge the fitting effect of this model. We will have the following conclusions: the RME, the square of R and RMSEP of the two models respectively are 0.08 and 0.02, 0.97 and 0.99, 0.05 and 0.02.We can see from the first three decision coefficients that both of the two models can solve the problem that there is high correlation between all the explanatory variables and the precision of PLS nonlinear model is higher than the PLS linear model. At the same time we calculate the difference between the second industry power consumption observed values, the linear and nonlinear model fitting values, and then we analyze this model combining with the residual change rate, this model data has the characteristics of time lag which is one year. To sum up, MIV-PLS model can be used effectively to fit the power consumption of the second industry, which has strong reference value.

Key words: MIV,PLS,Spline transformation,The consumption of second industry power, Nonlinear model

1引言

1.1研究背景

电力是人民生活的基础,电力工业在经济社会的发展中的作用越来越重要。近十年来全社会电力消费量的七成以上都是由第二产业提供的,所以在某种程度上通过研究第二产业电力消费量可以反映整个社会对电力的需求量。与此同时,全社会都在向低碳环保方向转型,各个工业企业会努力将电力作为首要能源,降低对传统能源煤炭的依赖,这些都会使第二产业的电力消费提高,进而带动全社会的电力需求[1]。因此准确拟合和预测第二产业电力消费的趋势,为相关部门制定有关决策起着重大的作用。

1.2国内外研究进展

1983年,偏最小二乘(PLS)回归是由S.Wold等人提出的一种先进的多元分析方法,以解决多元回归分析中的解释变量与解释变量之间或者因变量与解释变量间存在严重的多重共线性和解释变量的个数大于维数等问题。由于PLS回归可以解决范围广以及受数据自身存在的问题影响小等优点,所以该方法的理论研究进展非常迅速,而且应用领域也从最初的化工领域[2]迅速延伸到各个领域。

在上个世纪90年代PLS回归被引入到中国。近些年来,PLS回归在理论上获得了飞速进展,因而使PLS的应用范围更广。王慧文[3]介绍了PLS-Logistics回归方法以及基于样条变换和核函数变换的PLS回归方法。2017年孙彩云和常梦颖[4]通过对分析北京市2001年到2014年14年间的需水量,建立了PLS回归预测模型,对需水量进行预测。同年郭晓丹和李鹏[5]将模糊时间序列和PLS回归联系在一起对吉林省电力消费进行中长期预测分析。2016年毛瑞[6]通过研究十一年间小麦赤霉病发生情况并且选用最大的主成分个数从而很大程度上解决解释变量具有严重的多重相关性的PLS法进行建模,实现对小麦赤霉病预测。2013年迟丹一[7]运用PLS回归的方法分别建立线性和非线性模型,并将两个模型结果进行分析对比,实现对电站锅炉氧量预测。2006年许凤华和李述山[8]使用PLS回归方法预测我国17个城市的ph值,说明此方法在解决此问题时有很高的精度。

科学预测电力消费是保证电力供给的基本前提。电力消费预测也一直是全社会的持续升温的热点话题。常用的预测方法包括灰色预测法[9] 、电力弹性系数法[10]、时间序列分析法[11]、系统动力学[12]、最小二乘向量机[13]、面板数据模型[14]、协整理论[15]、神经网络和组合神经网络[16]、回归分析[17]等。

本文利用2007-2016年10年的第二产业电力消费值以及第二产业相关产业产量资料,建立基于MIV的神经网络模型用来对解释变量的筛选,接下来分别建立PLS线性模型和非线性模型来对这10年的第二产业电力消费值进行拟合,最后通过对比评估两个模型的拟合效果。

2 资料和数据处理

2.1资料

第二产业包括黑色金属行业、有色金属行业、建材行业、化工行业、其他能源行业、轻工业等其他行业[18]。因此我们按类选取解释变量,具体如下:

①黑色金属行业:钢材产量(万吨)、生铁产量(万吨)。

②有色金属行业:十种有色金属产量(万吨)。(一般指铝、汞、铜、铅、镍、镁、钴、锡、锑、锌十种有色金属)。

③建材行业:平板玻璃产量(万重量箱)、水泥产量(万吨)。

④化工行业:合成橡胶产量(万吨)、农用化肥产量(万吨)、乙烯产量(万吨)、纯碱()产量(万吨)、烧碱产量(万吨)。

⑤其他行业能源:原煤产量(亿吨)、原油产量(万吨)、天然气产量(亿立方米)。

⑥轻工业:布产量(万吨)、纱产量(万吨)。

剩余内容已隐藏,请支付后下载全文,论文总字数:24730字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;