基于Logistic-SVM回归的民营企业债务违约风险预测模型

 2022-04-15 07:04

论文总字数:31830字

摘 要

公司债是我国债券市场的重要组成部分。我国公司债违约频率自2014年起不断增加,一方面说明了债券市场正在逐步实现市场化,另一方面也对判断企业偿债能力提出了更高的要求。为了更好地实现债务违约预测、保护投资人利益、帮助债券市场良性发展,本文从民营企业债券违约预测角度出发,以上市企业为样本,利用单一Logistic模型、单一SVM模型和基于准确率加权的Logistic-SVM联合模型进行债券违约预测。

本文先选择了27个以流动比率、资产负债率为代表的和偿债能力有关的指标,之后利用主成分进行降维,并进行因子旋转得到了10个主成分。利用降维之后的指标作为单一模型和组合模型的运算指标,之后先进行了单一模型的构建。使用SPSS软件构建Logistic模型时,ROC曲线拥有较高的AUC值,说明模型具有一定预测价值。综合考虑ROC曲线反映的最佳分类点和犯第Ⅰ类错误的概率,最终确定Logistic二分类的分类点,使模型达到较佳的预测效果和应用要求。使用SPSS Modeler软件构建SVM模型时,通过对RBF核函数、多项式核函数、Sigmoid核函数和线性核函数四种核函数各自在训练集和测试集上的预测准确率对比,选择最佳的映射函数,构建SVM模型。

根据实验结果,单一SVM预测效果优于单一Logistic模型,但之后论文又采用了Logistic-SVM联合模型,使预测准确率又取得进一步提升。利用线性规划的方式求得两单一模型的最优权重,进而得到组合模型的数学表达。研究结果证明,采用Logistic-SVM联合模型可以在提高总体预测准确率和降低犯第Ⅰ类错误的概率两方面均取得较为明显的优化效果,具有较强的实际意义和应用价值。

对企业偿债能力的有效评估可以协助减少问题企业的债务发行,降低投资人的投资风险,进而增强市场信心,有利于提高资金利用的效率,有利于我国债券市场的健康稳健发展。

关键词:债务违约,Logistic回归,支持向量机,组合模型

Abstract

Corporate bonds are an important part of China's bond market. The default frequency of corporate bonds in China has been increasing since 2014. On the one hand, it shows that the bond market is gradually becoming market-oriented. But on the other hand, it puts forward higher requirements for judging the solvency of enterprises. In order to better achieve debt default forecasting, protect the interests of investors, and promote the benign development of the bond market, this paper takes listed companies as samples, and uses a single logistic model, a single SVM model and a logistic-SVM joint model based on accuracy-weighted to predict bond default.

First, 27 indicators related to solvency, represented by current ratio and asset-liability ratio, were selected. Then, the principal component was used for dimensionality reduction, and the factor rotation was used to obtain 10 interpretable principal components. The data after dimension reduction was used as a calculation index of each single model and the combined model. Then we built a single model respectively. When constructing the Logistic model with SPSS software, the high AUC value of the ROC curve indicated the effectiveness of the model. Considering the best classification point reflected by the ROC curve and the probability of making the first type of error, the classification point of the two classification was finally determined, so that the model achieved better prediction ability and application requirements. When using the SPSS Modeler software to construct the SVM model, the optimal mapping was selected by comparing the prediction accuracy of the four kernel functions——the RBF kernel function, the polynomial kernel function, the Sigmoid kernel function and the linear kernel function on the training set and the test set.

The outcome showed that the single SVM prediction effect was better than the single logistic model, but then we built the Logistic-SVM joint model, which was used to further improve the prediction accuracy. The optimal weight of the two single models was obtained by means of linear programming, through which the mathematical expression of the combined model was obtained. The research results show that the Logistic-SVM joint model can achieve more obvious optimization effects in both the overall prediction accuracy and the ability of reducing the type I error, which has strong practical significance and application value.

Effectively assessing the solvency of enterprises helps to reduce the debt issuance of problematic enterprises, then reduces the investment risk of investors, and thereby enhances market confidence, improves the efficiency of capital utilization, and contributes to the healthy and steady development of China's bond market.

Keywords:Bond Default,Logistic Regression,Support Vector Machine,Combined Model

目 录

摘 要 Ⅰ

Abstract Ⅱ

第一章 绪论 1

1.1研究背景 1

1.2研究意义 1

1.3研究内容与方法 2

第二章 国内外研究综述与本文创新点 3

2.1国内外研究综述 3

2.2本文创新点 4

第三章 论文相关理论 5

3.1主成分分析法 5

3.2 Logistic回归方法 5

3.3 SVM方法 6

3.4 Logistic-SVM组合方法 7

第四章 Logistic和SVM模型构建 10

4.1样本的选取及指标的选择 10

4.1.1样本选取 10

4.1.2指标选取 11

4.2数据清洗与预处理 13

4.2.1数据清洗 13

4.2.2数据预处理与主成分降维 13

4.3 Logistic回归模型构建和验证 18

4.4 SVM模型构建和验证 22

第五章 Logistic-SVM组合模型构建和验证 25

5.1 Logistic-SVM模型构建 25

5.2 Logistic-SVM模型验证 25

5.3三种模型对比分析 27

第六章 结论与展望 28

6.1论文主要成果 28

6.2研究展望 28

参考文献 29

致 谢 30

附 录 31

第一章 绪论

1.1研究背景

公司债是我国债券市场的重要组成部分,也是上市公司的一种重要融资手段。2007年中国第一只企业债券——长江三峡股份公司债券发行上市,之后公司债券规模逐渐扩大,呈现快速增长的态势。然而,由于债券市场仍处于发展阶段,缺乏一定的风险意识和完善的评级体系,债券违约事件对市场的良性发展产生了较大的负面影响。债券违约造成了市场动荡和投资者恐慌,对于我国目前的债券市场冲击较大,对企业的融资造成了不利影响。如何有效地防范和控制债券违约风险,是监管部门、投资者和债券发行人共同关注的问题,也是我国债券市场发展的重要研究课题。

1.2研究意义

违约行为,是指借款人(即债券发行人)到期不愿或不能履行部分或全部还本付息义务而致使投资者遭受损失。2014年3月7日,超日太阳不能支付“11超日债”到期利息8980万元人民币,成为中国首例公司债违约事件。出现公司债务违约,一方面反映出我国企业债券在逐渐形成市场化的正常状态,另一方面也打破了刚性兑付的隐形保证。投资者不再能毫无风险地获得信用利差,因此对债券评级和风险防范开始提出更高的要求。截止2018年底,债券市场共有105个主体发行的242只债券发生了违约(仅为银行间、交易所交易的债券),涉及违约的债券本金规模达1946.28 亿元。其中2016年和2018年违约现象出现频繁,且违约主体数量和违约债务规模增长较大。随着隐性担保逐渐退出,市场化进程不断推进,未来债券违约将逐渐成为常态化。为了防范该类事件发生、维持债券市场稳定,需要有更多的研究和精力付诸于风险管理。寻找一个适用于我国市场的违约风险预测模型,是当前阶段促进债券市场健康发展的一个重要任务。此外,违约主体以民营企业居多,2018年民营企业发生新增违约的有37家,占全部新增违约主体的86%。发生以债券违约为代表的信用问题,会使机构对民营企业更加保持警惕,进一步加重了民营企业“融资难”的问题。完善对民营企业的信用评价体系,能够增强投资者信心,让资金更多流入有需要的民营企业,促进民营企业的发展,进而为国家的整体经济发展提供活力。

1.3研究内容与方法

从违约主体特征来看,民营企业占大多数,其中不乏许多上市公司。非上市公司的数据准确性和完整性都比较欠缺,而上市公司的数据公开,较容易获取。因此采用公开发行债券的民营上市公司作为研究对象,采用Logistic回归、SVM模型、Logistic-SVM联合模型的方法来进行违约概率预测。本文先进行数据清洗和Z-score标准化,之后提取主成分,得到主成分表达式和各主成分的值。然后对所得主成分进行Logistic 回归分析,并通过 ROC 曲线检验模型的预测效果。此外,本文还采用SVM模型进行预测。最后分析两种联合模型,根据预测准确率加权,得到Logistic-SVM联合预测模型。将得到的三种模型预测准确率进行比较,得到最优模型。

第二章 国内外研究综述与本文创新点

2.1国内外研究综述

近几年来,人们对民营企业的债券违约关注颇多,从文献看来大致可以列出两个重点:一个是从违约成因出发,通过分析企业违约的原因,找到重要影响因素。通过建立各种模型,调整对债券信用评级的方法,并丰富和发展债券定价的机理。张继德、翟颖[1](2017)以超日太阳发行的“11超日债”违约事件为例,从企业层面提出防范债券违约风险,应在事前建立健全企业债务风险预警机制、加强应收账款内部控制等要求。王攀[2](2019)分析了上海市建设机电安装有限公司发行的“12沪机电”在2015年6月18日首次发生实质性违约后,连续五次延期兑付的原因,发现现金流周转失灵是重要的违约因素。龚宇[3](2018)采用整体与局部的分析视角,通过调查实证、总结归纳相结合的方法,对我国债券违约的现状、成因以及处置予以研究。

另一方面,从市场角度出发,关于加强债券市场监管和规范化发展,近年来许多学者结合国外研究经验和我国的实际情况,也提出了相关建议。胡汉英[4](2013)研究了中小企业集合债券的优势及存在的问题,采用KMV模型对我国中小企业集合债券的信用风险进行度量。林力、张自力[5](2014)深入研究了美国市政债券市场违约风险监管模式,总结出科学界定市政债券的违约概念和统计口径等提高市场风险分析准确性的措施,对于仍处于发展中的我国市政债券市场颇具借鉴意义。张春强、鲍群、盛明泉[6](2019)围绕债券违约信用风险的传染效应,发现违约引发的信用风险经行业传染后在一级市场具有定价效应,且产能过剩行业的风险传染效应也比非产能过剩行业更为突出。

剩余内容已隐藏,请支付后下载全文,论文总字数:31830字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;