多元统计分析方法在股票市场板块的应用研究文档格式.docx
《多元统计分析方法在股票市场板块的应用研究文档格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析方法在股票市场板块的应用研究文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
有利于股票投资价值的正确评估;
有利于投资风险的降低;
投资者成功投资的关键是科学的投资分析。
在股票市场中,对于广大投资者而言,通过聚类分析与因子分析结合相对股票进行分析可以开拓投资渠道,扩大投资可选择的范围,但股价是受到政治、经济、市场等相关因素的影响,也可以受到技术和投资行为因素的影响,因此,股价经常处在频繁的变动当中,而股价的变动也扩大了股市的投资性活动,使股市的风险性加大。
因此,对股市的股票进行聚类分析与因子分析尤其显得意义重大。
经过前人研究,多元统计分析方法中的聚类分析与因子分析相结合的方法在股票的综合评价中有着越来越广泛的应用。
而本文主要采用的分析方法就是聚类分析与因子分析。
在对上市公司进行综合评价时,由于存在多个指标,所以先进行标准化处理,再用spss软件进行系统聚类分析,得到聚类谱系图,根据聚类谱系图对股票进行分类,随后利用因子分析方法对多维变量进行降维,其目的是使信息的损失达到最小化,加强对原变量的综合解释能力。
2聚类分析与因子分析
2.1聚类分析与因子分析的概念
聚类分析:
依据研究对象的特征,对研究对象进行分类的方法,以减少研究对象的数目。
因子分析:
因子分析的基本目的是用较少的几个因子去描述多个指标或因素间的相互联系,也就是将相关较密切的多个变量归在同一个类别中,每一类别变量就会成为一个因子,用以比较少的几个因子来反映原始资料的绝大部分信息。
2.2基本思想
由于我们所要研究的样品之间存在着不同程度的相似性,于是我们根据一批样品的多项观测指标,从中找出一些能够相对准确度量所选样品或指标之间相似程度的统计量,从而以这些统计量为划分类型的依据,采用某一种聚类法,把一些相似度比较大的样品聚到一类,同样的把另外一些彼此之间相似度较大的样品又聚为另一类,目的就是使同一类别中的个体有较大的相似性,而不同类别中的个体有较大的差异性。
一直到把所有的样品都归类完毕为止,这就是分类的基本思想。
其中我们说到的类指的是相似元素的集合。
把原始指标综合成为相对较少的指标,使得这些指标能够充分反映原始指标的大部分的信息,而这些综合指标之间是没有任何相关性的。
3聚类分析与因子分析的应用
3.1问题的提出
中国的股市从无到有,发展到今天已经颇具些规模。
而前些年,是中国股票市场发展的初级阶段,由于市场规模还相对比较小,上市公司的数量也并不是很多,再加上股民的投资观念以及操作方法也相对来说太不成熟,因此,投机性特别的强,那个时候还根本用不上多少技术来分析,所以股票根本不能给人们带来任何收益。
但是,伴随着我国市场经济建设的高速飞跃发展,人们的金融意识和投资意识也是日益的增强,而作为市场经济组成部分之一的股票市场,也正在一步一步的向成熟与规范迈进,也有越来越多的投资者开始重视股票的投资,历史已经证明了,股票是一种不仅仅在过去可以为投资者提供丰厚的长期利益,并且在将来也可以为投资者提供良好机遇的投资媒体。
然而,股票价格的涨跌很难掌控,股票市场也是变幻莫测的,投资者要是想在股票市场的投资中获得丰厚的投资回报,就必须要认真的研究上市公司的发展历史、公司业绩以及发展前景,也必须要详细的分析上市公司的财务状况,坚决树立以基本分析为主,以技术分析为辅的基本投资理念,从众多股票当中找出真正具备投资价值的股票,从而对其进行长期的投资。
伴随着股票市场的不断快速发展、投资手法以及证券监管方法的不断向成熟与规范迈进,并且上市公司数量正在持续不断的增多,如果投资者再像往常一样,面对成千上万种的股票随便的乱抓一气,碰运气,甚至于是受到了各种股评和谣言的左右,则投资者很难取得最终的投资成功,获得丰厚的回报。
因此,在成熟的股票市场当中,一个股民若是想要取得成功,必须得学会板块分析和习惯理性的操作以及树立板块的投资理念。
而我们所说的板块是指具有共同特征的股票群。
股票市场当中的板块我们可以从行业与产业、地域与时间、特殊题材等等多个角度来划分,而在每一个板块当中又有几十种甚至上百种的股票。
而面对众多股票以及各个公司的众多的财务数据,怎么样才能客观、全面、准确地分析并且从中挑选出各个板块以及板块内的绩优龙头股和潜力股呢?
本文采用多元统计分析中的聚类分析与因子分析方法,对此问题作一些探讨。
3.2聚类分析在股票市场板块分析中的应用
本文选取2012年30家湖北上市公司前三季度财务指标进行分析,选择每股收益、总资产、净利润、净资产、每股净资产、净资产收益率、主营业务收入、每股现金流8项财务指标,对这些公司进行聚类分析,将其分类。
3.2.1标准化处理
由于单一指标对事物进行评价时不尽合理,我所选取的8项财务指标的性质不同,而且都具有不同的量纲和数量级,为了保证研究结果的可靠性,所以要先对其进行标准化处理,数据标准化的主要功能就是消除标量间的量纲关系,从而使数据具有可比性。
处理后的样本数据可以更好的了解不同公司的特征财务状况,如下表1
表1
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
1
17
19
0.26
6
2
3
25
1381.65
5
4
8
13387.91
11
22
14699.01
9
12
14916.08
13
27
21458.75
7
10
20
32627.44
23
24
173377.21
16
21
211457.25
18
29
238872.65
26
306404.95
14
15
30
348231.41
406858.71
838951.64
1187444.4
1493108.1
2804607.3
4679837.6
4837514.5
28
81131158.7
17374563
017
21590054
33633497
69019531
83213466
84576356
217081688
858695370
1.289E+09
由上表可知,根据输出的结果,第一行数据的含义:
聚类分析的第一步中,17号及19号聚合为一类,其离差平方和为0.26,这个类别会在聚类分析第6步用到。
同样,第6行数据的意义是聚类分析中的第6步27号与和第一步新聚成的类别又可以聚到另一个类别当中,其离差平方和是21458.75,且这个类别也将会在聚类分析中的第13步用到。
由此可见,经过了29个步骤的聚类过程,所选取的30个样本最终都聚到一个类中。
3.2.2聚类谱系图
0510152025
聚类谱系图
聚类谱系图可以非常直观地展示了聚类的过程,并且也可以非常清楚的表现其数值分类结果,从中我们可以更好的了解各种股票的亲疏关系的程度,更可以根据选择距离的不同对样本进行新的分类,这是聚类分析经常用到的。
根据上图可以将这些股票分成七类,但是无法分辨出这些股票是属于蓝筹股、绩优股、一般股还是劣质股,因此还要进行因子分析。
3.3因子分析股票市场板块分析中的应用
通过spss软件进行因子分析,得出五个特征根、贡献率及其累计贡献率,如下
从上表可以看出,最主要特征根只有3个,这三个特征根的累计贡献率为88.715%,即说明其反映出来的信息占全部信息的88.715%,因此只取这三个来分析。
通过spss软件求得因子载荷阵,又因为因子变量在很多变量上的载荷较高则它要表达的实际含义不是太清晰,因此要对其进行旋转如下表2,每一个数据说明了每个因子变量对应相应原始变量的重要程度。
根据因子分析我们对这些公司来进行分类,再计算因子得分(下表中括号内的数字)
表2
Component
每股收益
-0.007(-0.57)
0.974(0.374)
-0.042(-0.037)
总资产
0.991(0.320)
0.073(-0.030)
0.044(0)
净利润
0.479(0.108)
0.778(0.259)
0.203(0.094)
净资产
0.991(0.324)
-0.038(-0.036)
-0.046(-0.071)
每股净资产
0.049(-0.010)
0.747(0.322)
-0.485(-0.453)
净资产收益率
-0.094(-0.085)
0.755(0.367)
0.407(0.281)
主营业务收入
0.966(0.313)
0.030(-0.047)
0.069(0.025)
每股现金流
0.070(-0.012)
0.127(-0.02)
0.894(0.720)
上表括号内中的各个数据是计算因子得分的系数,通过spss软件我们计算各个样本的因子得分,这里以方差贡献率为权数,根据上表中的因子得分计算出各个公司的综合实力得分,湖北省30家上市公司综合实力得分如下表3所示,
表3
F1
F2
F3
综合实力得分
湖北金环
-0.369
-0.726
-0.224
-0.217
湖北宜化
0.708
2.056
1.916
1.215
沙隆达A
-0.326
-0.572
0.522
-0.236
襄阳轴承
-0.353
-0