第八章离散选择模型Logist回归.docx
《第八章离散选择模型Logist回归.docx》由会员分享,可在线阅读,更多相关《第八章离散选择模型Logist回归.docx(9页珍藏版)》请在冰豆网上搜索。
第八章离散选择模型Logist回归
第八章离散选择模型—Logistic回归
基于logistic回归模型的企业信用评价——以材料和机械制造行业上市公司为例
一、引言中国市场经济制度的日益健全与完善以及证券债券等金融市场的逐步建立与发展,信用成为经济交往、债务形成的一个重要的基础,信用风险越来越受到市场交易者的关注。
信用风险是指借款人、证券发行人或交易方由于各种原因不愿或无能力履行商业合同而违约,致使债权人、投资者或交易方遭受损失的可能性。
对于上市公司而言,这种违约行为经常表现为拖欠账款、资不抵债以及以发行证券或债券进行圈钱等失信行为。
对这种违约失信的可能性的度量显得十分重要。
怎样分析公司的信用状况,对信贷管理者如何分析企业的信用,对证券投资者如何衡量投资项目的风险和价值以及企业家如何评价自己管理的公司,都有极大的价值。
自上世纪中期以来,国内外以计算违约率(本文计算守信率,守信率=1-违约率)对信用风险进行评价和度量的方法和模型得到了迅速发展。
对企业的信用评价主要是基于综合财务指标特征计算违约风险并用来划分等级。
以综合财务指标为解释变量,运用计量统计方法建立模型,分析信用在金融和学术界成为主流,并且评价效果显著。
特别对于logistic回归模型效果更好,因为该模型没有关于变量分布的假设,也不要求假设指标存在多元正态分布。
最早有Martin(1977)建立logistic回归模型预测公司的破产以及违约的概率。
Madalla(1983)建立logistic回归模型来区分违约和非违约贷款申请人,并确认0.551为两者的分界线。
比如在我国,张后启等(2002),杨朝军等(2002),应用Logistic模型研究上市公司财务危机,得出有效结论等等。
面对我国在深沪两家证券市场上市的一千多家上市公司,由于公司体制和管理机制缺陷,或者自身利益最大化利益驱使,或者多部分有国企改制而来等各种原因,信用风险程度变的更大。
若能够应用一个较简单的计量模型对他们的信用状况进行评价,对债权人选择贷款对象,投资者投资和交易方的选取都有较大帮助。
本文则利用上市公司综合财务数据,运用主成分分析,建立logistic回归模型。
并为了消除行业因素的影响,仅对材料和机械制造行业的100家上市企业作为样本进行建立模型,对于其他行业可依次方法进行评价。
二、指标选取与数据搜集
㈠选择指标的类别
一般而言,企业信用评价及违约风险大小与企业财务状况密切相关的,企业财务状况良好时,资本运营顺畅、现金流量管理较好,企业就可能守信、有能力且可及时还款。
反过来,当一个企业财务出现危机时,企业的经营、运作和盈利均处于不利状态,可能出现拖欠货款,圈钱,丧失信誉等行为,导致企业信用危机,更加剧了财务困境。
从而企业信用评价基于企业财务状况,在建立信用评价模型时,就选择几个有代表性的综合财务指标作为分析的对象。
㈡选取指标的原则在选择财务指标时,首先,遵循全面性和综合性原则,可以从不同方位、层次体现信用状况,综合考虑会计的三大报表,从中提取数据,各报表的数据互相结合、对比,注重现金流量表这个动态变量的作用,充分表达企业的偿债能力、盈利能力、营运能力等。
比如,选取应付账款周转率这个指标,其较好的反映了企业还款意愿,该周转率越高,周转天数越少,表明还款意愿强烈,此外该指标同应收账款周转率存在高度相关性,反映了营运能力的大小,变现速度和收账效率。
再如流动负债经营现金净流量比,即动态地体现了企业的短期偿债能力,又表达其营运能力的大小。
其次,遵守可比性和数据的易于获取性原则,选择同行业中数据,反映其内在规律性。
据我国现行企业会计核算制度,上市公司的财务数据必须向社会报出,可以根据报表的基本数据来计算指标。
最后,考虑选取的指标与评价目标要求存在正相关性,这是由于回归模型本身决定的,因各个解释变量与解释的目标是正比例关系,比如负债率等这样的指标不宜使用。
㈢选取的财务指标
综上所述的选取指标的类别和选取原则,全面考虑,选取如下(见表1)财
务指标:
表1选取的指标
反映能
力
财务指标
计算公式
偿债
能力
X1:
流动比率
流动资产/流动负债
X2:
流动负债经营活动净现金流比
经营活动净现金流量/流动负债
X3:
股东权益比率
股东权益/总资产
X4:
总资产周转率
主营业务收入净额/平均总资产
经营
X5:
存货周转率
主营业务成本/存货平均余额
能力
X6:
应付账款周转率
(主营业务成本+期末存货-期初存货”
平均应付账款
盈利
X7:
净资产收益率
禾U润总额/平均股东权益
㈣数据的来源
以2004年上市公司的报出的三大报表数据为依据计算财务指标作为分析对象,选取两组样本。
由于logistic回归模型的特征,为了使守信率更趋近于0和
1,选取两组两端(较好和较坏)作为样本数据,一组为正常上市公司(信用状
况较好),选取被证券之星网站排名在材料行业前30名和机械制造行业前20名的公司,共计50家;另一组为非正常公司(信用状况较坏),因财务异常而被特别处理(ST)的公司,选取材料和机械制造行业被特别处理的公司和注册会
计师给以“拒绝表示意见”的审计报告的公司共计50家。
三、logistic回归模型分析
㈠数据的初始处理和主成分分析
设选取的原始数据为X(X!
X2...X8),其中:
Xj(X",X2j...X!
00j),(j1,2...8)
先消除量纲的影响,先对样本数据进行标准化
标准化后的数据记为Xi*(i=1,2,…8)。
为了消除logistic回归模型分析中各变量存在的多重共线性,并对选取的指
标进行分类,对8个指标进行采取主成分分析法进行因子分析,即寻找因子Fi保
持原始的信息,并且互不相关。
计算相关系数矩阵R的特征值,和特征向量D,所求特征值依大小顺序排列为iiLio0,对应i的特征向量为Di,主成分为Fi=XDj.
主成分F的贡献率为hi盲-」•这样可只考虑少数几个主成分而不损失
t
t1
较多信息,抓住主要矛盾,揭示规律性。
并对其通过方差最大化法进行正交因子旋转。
旋转过程对主成分提取的结果只改变信息量在不同主成分之间的分布,从
而可以找到合理的经济解释。
采用SPSS11.5统计软件中Analyze—DataReduction—Factor…进行因
子分析,前4个主成分的特征值的累计贡献率已经达到了78.58%,选取
F1,F2,F3,F4作为最终指标进行分析,可以分别有原来8个指标表示为:
F1=0.456X;+0.335X2*+0.486X3*+0.031X4*-0.157X5*+0.035X6*-0.073X7*+0.079X8*
F2=-0.048X;+0.242X2*-0.219X3*+0.498X4*+0.530X5*+0.07X6*-0.015X7*-0.214X8*
F3=0.012X;-0.138X2*+0.006X3*0.116X4*-0.087X5*0.452X6*+0.05X7*0.698X8*
F4=0.063X1*+0.247X2*-0.398X3*0.065X4*-0.084X5*0.061X6*+0.849X7*0.07X8*
由上表达式可以看出,F1主要表达了X1、X2、X3等三个指标的信息量,反映
的是企业的偿债能力,F2主要表达了X4、X5等指标的信息量,反映的是企业的
营运能力,F1主要表达了X6、X8等指标的信息量,反映的是企业的还款意愿和
总盈利能力,F1主要表达了X7等指标的信息量,反映的是企业的净盈利能力
㈡logistic回归分析
建立logistic回归模型表述如下:
其中:
Zi
1
PiZi
1ei
m
0
j1
对于各公司i,(i=1,2,…n)若p7),表明信用状况较差,若p~1,表明信用状况较好,称P为守信率。
令Pi(y)Piyi(1Pi)(1yi)
甘出1,若公司i的信用状况较好
八yi0,若公司i的信用状况较差
函数为:
两边取对数:
其中Fj为企业信用风险评定的影响变量,即上述的四个主成分。
使上述函数达
n1
i1[yiF0
[y-J^)]*Fij0(j=1,2,3,4)
i11e
联立上述方程求出各个估计的参数值。
采用SPSS11.5分析软件中AnalyzefRegressionfBinaryLogistic…进
行回归模型分析。
回归方法为向前逐步选择引入法,即通过最大似然估计所得的似然比的概率作为引入变量的标准,采取迭代法逐步计算,直到对数似然比不再
变化为止。
逐步引入的变量及迭代过程以及参数估计值如下表(表2)所示
表2IterationHistory
Iteration
-2Loglikelihood
Constant
Coefficients
F1
F2
F4
Step11
100.074
.000
1.111
2
81.354
.043
2.494
3
75.701
.073
3.725
4
74.923
.091
4.390
5
74.902
.096
4.522
6
74.902
.096
4.526
7
74.902
.096
4.526
Step21
80.290
.000
1.111
.861
2
59.407
.082
2.508
1.253
3
51.050
.097
4.013
1.643
4
49.144
.070
5.127
1.937
5
48.987
.050
5.563
2.051
6
48.985
.047
5.612
2.063
7
48.985
.047
5.613
2.064
Step31
76.722
.000
1.111
.861
.324
2
55.195
.143
2.394
1.371
.659
3
46.050
.212
3.800
1.815
1.301
4
43.109
.282
4.687
2.158
3.030
5
42.703
.331
5.154
2.367
3.964
6
42.691
.343
5.258
2.415
4.148
7
42.691
.344
5.262
2.417
4.154
8
42.691
.344
5.262
2.417
4.154
由上表可以看到,F1(企业偿债能力)对P的影响最大,第一步就被引入模型,其次是F2和F4。
我们选择第三步的回归结果,其参数估计以及其统计检验如下表(表3),各系数统计量检验的效果显著。
如上所述,估计的
logistic回归模型如下:
p
1
.(0.344+5.262F1+2.417F2+4.154F4)
1e
表3VariablesintheEquation
B
S.E.
Wald
df
Sig.
Exp(B)
Step3
F1
5.262
1.193
19.439
1
.000
192.856
F2
2.417
.653
13.716
1
.000
11.208
F4
4.154
2.413
2.963
1
.085
63.689
Constant
.344
.408
.709
1
.400
1.410
主成分F3没有引入模型,在我国F3(还款意愿和部分盈利能力)对守信率的影响并不显著。
将样本数据代入模型预测信用状况时,计算出P值,若PO.5,就判断企业为守信较差企业(信用较差),若PO.5,就判断企业为守信较好企业(信用较好)。
对样本数据的预测概率和各企业的频数若下图(图1)所示。
32
ObservedGroups
andPredictedProbabilities
F
0
R
24
-0
--
E
0
Q
0
1
U
0
1
E
16
-0
1-
N
0
I
匚
0
1
¥
0
1
3
-0
11-
0
11
00
11
11]1
OOOIJOD000000
Dll1ID0111
111111010
Predicted
1
I
—1—
Prob:
0・25
・5J
1
Group:
ooocooooooooooooiooooooooooocooiiiiimuumini]iminin
图1预测概率和各企业的频数
从表中可以看出,样本分类的准确率如下表(表4),该模型判定的总准确率为93%,对信用好的企业判为守信率高的准确率为92%,对信用较差的企业判为守信率低的准确率为94%,判定结果可信度较高。
表4ClassificationTable
Predictedy
PercentageCorrect
0
1
Observedy
0
47
3
94.0%
1
4
46
92.0%
OverallPercentage
93.0%
从样本之外选择该行业40个测试企业数据进行模型的检验,预测的准确率
为86%,判断结果同样本预测的准确率基本一致,模型比较稳定,可推广应用。
四、结论及建议
㈠基于logistic回归模型对企业信用进行评价,能够为债务人、投资者和交易方提供准确率较高的决策依据,为企业的管理者提供决策信息。
对样本的检验准确率高达93%,选择的测试数据的准确率高达86%。
㈡有回归结果可知,就材料和机械制造行业而言,影响企业信用主要是企业的偿债能力F1(原始指标为X1,X2,X3),再次是企业的营运能力和盈利能力,从参数的系数可以看到这一点,信用状态的好坏同企业的偿债能力、资金的流动性和运营效果密切相关,资金流动性好,偿债能力就强,对债务人、投资者和交易方的保障程度高,与该企业的还款意愿和盈利能力关系并不很强。
一个企业的还款意愿很强,盈利能力较强,但是资金周转效果不好,也不可能及时还债。
对于投资者选择投资对象时,企业的偿债能力,资金的流动性和经营运作能力常作为首要考虑因素。
㈢该模型的定量判别方法并不能代替定性分析方法,需同定性分析有机的结合在一起,这是因为,首先模型判别的准确性建立在真实、公允的财务报表信息的基础上,其次分析信用状况时,必须结合专业判断、管理情况、行业性质和前景以及客观环境等因素进行综合分析,最后定性分析在我国有着较长历史,积累了丰富的经验,这些是不可完全由数据分析所能概括的。
㈣对该模型,可以扩大样本量,充分考虑时间因素,采用平行数据进行分析。
可以分行业、分地区进行建立不同的模型,有针对性进行回归分析,也可以建立多元logistic回归模型,从而划分信用等级。
本文并没有从这几个方面进行探讨。
(根据东北财经大学油永同名论文编写)