基于量化选股的阿尔法策略在中国中小板市场的实证研究.docx
《基于量化选股的阿尔法策略在中国中小板市场的实证研究.docx》由会员分享,可在线阅读,更多相关《基于量化选股的阿尔法策略在中国中小板市场的实证研究.docx(27页珍藏版)》请在冰豆网上搜索。
基于量化选股的阿尔法策略在中国中小板市场的实证研究
随着股指期货的推出,我国证券市场只能单边做多的局面已经成为历史,股指期货为阿尔法策略投资提供了必要的做空手段。
纵观国内外的投资经验,在资本市场有效性相对较弱时,阿尔法投资策略可以获得持久稳定的超额收益,而我国的中小板市场正是一个新兴的、效率相对较低的市场,本文旨在研究基于量化选股的阿尔法策略在中国中小板市场是否具有可行性。
本文首先利用历史数据研究上市公司各类相关指标与公司股票超额收益率之间的相关关系,以期通过指标来筛选出可以获取高阿尔法收益的股票;其次,通过构建投资模型来检验阿尔法策略在中国中小板市场的可行性。
通过对2007年5月到2011年12月期间的81只股票的各类财务及非财务指标和股票超额收益的分析我们发现,通过使用ROE增长率、流动资产周转率、持股集中度2、现金流量比率这四个指标对股票进行筛选我们可以得到高收益的股票,随后根据这四类指标构建投资组合,在2012年1月到2013年10月期间对投资组合的业绩进行评价,最后发现在中国中小板市场可以通过量化选股和适当卖空股指期货来获得比较客观的超额收益率,卖空机制的引入有利于稳定市场、提高流动性、增加积极型投资者的投资收益。
相对于股指期货收益率来说,阿尔法策略投资组合收益率更加平稳,有效避免了投资收益“过山车”现象。
目录
摘要III
AbstractIV
目录1
1引言1
1.1研究背景与意义1
1.1.1研究背景1
1.1.2研究意义2
1.2国内外研究动态3
1.2.1国外研究现状3
1.2.2国内研究现状6
1.3研究思路、研究方法与技术路线8
1.3.1研究思路8
1.3.2研究方法9
1.3.3技术路线9
2阿尔法策略产生背景、优势及原理分析11
2.1阿尔法策略产生的背景11
2.2阿尔法策略优势12
2.3阿尔法策略基本原理12
3因子回归分析15
3.1数据的选取和因子的选取15
3.1.1数据的选取15
3.1.2因子的选取15
3.1.3数据的滞后处理17
3.2α、β值的计算17
3.3因子回归分析17
4投资组合构建与实证检验22
4.1投资模型的选择22
4.2投资组合的构建方法22
4.2.1调整周期22
4.2.2选股方法与步骤23
4.2.3统计检验与实证效果分析23
5总结与展望30
5.1本篇文章的研究成果30
5.2本篇文章的创新之处31
5.3本篇文章的不足之处与改进设想31
5.3.1本篇文章的不足之处31
5.3.2研究的进一步改进设想32
参考文献34
1引言
1.3研究思路、研究方法与技术路线
1.3.1研究思路
本文通过对07年之前在深圳中小板上市的上市公司的基本面数据和股票收益率进行分析,检验公司的成长能力指标、营运能力指标、盈利能力指标、估值指标、风险指标、持股集中度指标等数据与公司股票超额收益率之间的关系,从而筛选出与阿尔法相关性较大的因子,根据这些因子构造量化选股模型,构建股票池,并通过计算贝塔值利用股指期货规避系统风险,通过实证来检验量化投资和阿尔法策略在中国市场的可行性,可能用到的指标如表1.1所示。
表1.1选股指标
分类
指标
成长能力指标
总资产增长率、基本每股收益增长率、ROEG、
净利润增长率、每股经营活动产生的现金流量净额增长率
估值指标
每股收益、PE、每股净资产、市净率、P/CF、
托宾Q值、每股未分配利润、每股公积金
盈利能力指标
ROE、ROA
营运能力指标
流动资产周转率、总资产周转率、股东权益周转率
现金流指标
现金流量比率、每股净现金流量
持股集中度指标
集中度1、集中度2、集中度3、集中度4、Z指标
1.3.2研究方法
(1)文献与理论研究:
文献阅读与总结、理论分析,归纳现有的研究成果,结合alpha收益的特点,通过将现有研究成果中的投资思想抽象成数量化模型中的相关参数,以设计可能取得alpha收益的投资策略。
(2)数据收集:
为保证策略运行及检验的可靠性,一定要保证历史交易数据的可靠性,包括来源可靠和数据可靠。
(3)运用计算机对数据进行处理。
本文需要运用公司各类财务指标、收盘价、指数收盘价等众多数据,数据处理过程繁琐,需要借助excel等数据处理软件来完成数据的处理加工的工作。
1.3.3技术路线
图1.1技术路线图
通过对07年之前在深市中小板上市的81家公司在2007年5月至2011年12月之间的财务数据、股本数据等基本面数据与其股票收益率的回归分析筛选出与阿尔法相关性较大的因子,根据得到的可用因子构造选股模型,在2012年1月到2013年10月之间进行模拟投资,检验模型的获利能力,论证量化投资和阿尔法策略在中国中小板市场上的可行性。
技术路线如图1.1所示。
2阿尔法策略产生背景、优势及原理分析
2.1阿尔法策略产生的背景
1990年代初,阿尔法策略开始被尝试性使用。
本世纪初,美国股市所谓的“TMT(技术、传媒、通讯)泡沫”的破裂导致了股市连续三年的下跌,同时,美国联邦基金利率持续下降,这使美国的养老基金遭受了双重打击。
在资本市场投资收益率不断下降的同时,由于利率的降低,使其未来负债的现值大幅上升,导致养老基金的资产不足于偿付未来的负债,出现了严重的资金短缺,很多养老基金的资金短缺率达到20%以上。
在这种局面下,传统投资方法的低收益已很难解决养老基金资金不足的问题。
于是,聪明的投资人开始寻求新的投资管理的方法。
阿尔法策略和可选择阿尔法策略进入了养老基金、保险公司和其他大型基金的视野。
可以说,机构投资者希望通过创造性的手段来追求出色的风险调整后收益(risk-adjustedreturn)的迫切需求,促进了阿尔法策略包括可选择阿尔法策略的发展和推广。
随着市场效率的提高,追求绝对报酬率逐渐困难。
传统的积极投资策略希望在同一子市场或者同一类资产中同时获得阿尔法和贝塔,而事实证明,在有效的市场中(例如美国的大盘股市场或投资级债券市场)赚取超额收益是最困难的,找到更有可能获取超额收益的市场才是明智之举。
许多分析师都认为,超额收益在对冲基金、商品市场、房地产基金、小盘股、新兴国家资本市场和非投资级债券等市场中更容易被发现,但是往往基金公司们并不愿意承担这些市场的系统风险。
随着衍生工具的不断发展,基金经理越来越熟悉各种金融创新工具和策略,拥有卖空和杠杆两大手段使得基金经理可以自由灵活的通过衍生工具在任意目标资产类型之间转移收益,这种利用衍生品将资产收益分离重组的策略就阿尔法策略。
2.2阿尔法策略优势
以实现稳健收益为主要目的的阿尔法策略具有以下四大优点:
一是阿尔法策略具有准绝对收益的特性,也就是说投资组合的收益不受市场涨跌的影响,与股票、债券的相关性较低,做到了市场中性,稳中求胜;二是利用股指期货对冲,可以使得较少的亏损转化为相对正的收益;三是投资者只需要把精力放在选股上就行,只要投资者选出的股票组合跑赢大盘指数就能获得正的收益;四是阿尔法策略避开了择时这一难题,在最初只能单边做多的情况下,要想获得超额收益,必须准确择时,而现在即便判断错误,也有可能获得超额收益。
2.3阿尔法策略基本原理
WilliamSharpe最早在其著作《投资组合理论与资本市场》中指出,投资者在投资组合交易中,面临着系统性风险和非系统性风险,通过对系统性风险的度量和分离,将其从投资组合中排除,剩余部分可以转化为剥离系统性风险后的策略组合,这种为获取稳定超额收益的策略即为阿尔法策略。
阿尔法策略通常利用选股、择时等方面优势,寻找具有稳定超额收益的现货组合,通过股指期货等衍生工具来分离beta,获得与市场相关度较低的阿尔法收益。
资本资产定价模型认为,在有效的资本市场里,只有承担一定的系统风险才能得到一定的收益补偿,承担非系统风险无法获得收益补偿,所以,一种证券的预期收益由其贝塔值决定:
β越高的证券预期收益率越高,β越低的证券预期收益率越低。
但如果市场不是有效的,则证券的收益率将不仅仅取决于其贝塔值。
由于信息的不对称等导致某些证券的价值被低估,而通过选股和择时上的技巧及时买入这类股票,投资者就可以获得一定的超额收益,这部分收益成为阿尔法收益,詹森(1968)将CAPM模型进一步完善:
其中
为某证券或证券组合的期望收益率,
为无风险收益率,
为市场平均收益率,
为该证券或证券组合的相对风险系数,
为阿尔法收益。
根据以上理论,证券投资者从市场获得的收益可以分为两个部分:
第一部分是来自市场风险部分的期望收益率,我们称此收益为贝塔收益;第二部分是通过积极管理而获得的超额收益,我们称此为阿尔法收益,对此可以用证券市场线SML加以说明。
图2.1阿尔法收益图解
其中R(βp)为SLM上与证券或证券组合P具有相同系统风险的收益率,Rp为股票或股票组合P的收益率,则
市场收益:
;
阿尔法收益:
。
从公式中可以看到获得超额收益的关键是选择具有高收益率的股票并通过计算β值来对冲市场风险。
股指期货的推出为对冲市场风险提供了很好的交易工具,当买入某一股票时,可以通过卖空一定量的股指期货来对冲市场下跌的风险,从而获得较为稳定的α收益。
通过分析上市公司的财务数据等资料,可以预测公司股票价格的变化趋势,从而筛选出拥有较高预期收益率的股票,进而构建投资组合。
多头组合
α
β
-β
股指期货空头
图2.2阿尔法策略图解
从图2.2中可以直观的看到阿尔法收益约为
部分,只要
大于
则不管是牛市还是熊市或者是震荡市,都可以通过卖空股指期货来对冲市场风险从而获得稳定的阿尔法收益,避免投资收益的过山车现象。
图2.3阿尔法收益图
3因子回归分析
3.1数据的选取和因子的选取
本文价格数据和指标数据均来自国泰安CSMAR数据库。
3.1.1数据的选取
首先,确定用于回归分析的数据的时间范围。
由于财务数据的基本面信息都是按季度公布,所以在回归分析时我们采用股票的月度收益率来计算,为保证样本数据的规模,我们将回归分析的时间跨度定为2007年5月至2011年12月。
筛选出用于回归分析的股票池。
新股上市时由于不确定性较高,历史数据少,不利于进行量化分析,所以本文选择07年之前上市的公司股票作为样本,同时,因为ST股票有较多的交易限制,所以我们在选股时剔除掉曾被ST过的股票,由此,我们选出07年之前上市的非ST股票81只股票,其股票代码分别为:
002001;002003;002004;002005;002006;002007;002008;002009;002010;002011;002012;002013;002014;002015;002016;002017;002018;002019;002020;002021;002022;002023;002024;002025;002026;002027;002028;002029;002030;002031;002032;002033;002034;002035;002036;002037;002038;002039;002040;002041;002043;002044;002045;002046;002048;002049;002050;002051;002052;002054;002055;002056;002057;002058;002059;002060;002061;002062;002063;002064;002065;002066;002067;002068;002069;002070;002071;002072;002073;002074;002076;002077;002078;002079;002080;002081;002082;002083;002084;002085;002086。
所需的数据分别为:
个股月收益率(
)、个股日收益率、沪深300指数月度收益率(
)、沪深300指数日收益率、月度无风险利率(
)。
3.1.2因子的选取
本文用到的指标分别为:
成长指标、估值指标、流动能力指标、盈利和营运能力指标、股权集中度指标。
成长指标:
企业成长能力是指企业未来发展趋势与发展速度,包括企业规模的扩大,利润和所有者权益的增加。
企业成长能力是随着市场环境的变化,企业资产规模、盈利能力、市场占有率持续增长的能力,反映了企业未来的发展前景。
一般来说,具有较高成长能力的公司的股票拥有较高的预期收益率,从而可以获得较大的阿尔法收益。
本文选取的成长能力指标有总资产增长率、基本每股收益增长率、净资产收益率增长率、净利润增长率、每股经营活动产生的现金流量净额增长率。
估值指标:
股票估值是对股票内在价值的计算,可以帮助投资者发现被低估的股票,而只有持有被低估的股票才能在未来获得较大的收益。
但由于行业的固有属性以及行业、公司的资本结构不同,不同行业的PE、PB、PS等估值指标会有显著差异,也就是说这些指标的普适性较差,同一个指标在不同行业之间甚至有着相反的指导意义。
本文选取的估值指标有市盈率、每股净资产、市净率、P/CF、托宾Q值、每股公积金、每股未分配利润、每股储备。
流动能力指标:
现代财务管理学认为,企业的内在价值是未来现金流量的现值,企业价值评价应当侧重于参考未来获取自由现金流量的规模和速度。
企业获取现金的能力是价值评价的基础,也是财务风险评估的主要依据和核心。
相比于净利润,现金流量指标在会计上不容易被修饰,可以更加真实地反映公司获取现金的盈利能力。
现金流量指标在一定会计期间以收付实现制为基础,从而避免了销售收入有可能成为坏账、关联的虚构交易等其他因素导致的盈利虚高。
(同时这也会导致漏选周转较慢,应收账款帐期较长的行业与公司。
而这些公司并不肯定就是不值得投资的。
)同时它剔除了不需要实际支付现金的“沉没成本”—折旧与摊销,更加真实地反映了公司的现金流量,并对公司未来的盈利状况有一定的预见性。
一般来说流动性越强风险越低、价值越高,股票价格的走势越平稳,有利于获得稳定的阿尔法收益。
本文选取的流动能力指标有现金流量比率和每股现金净流量。
盈利和营运能力指标:
公司的盈利能力直接决定了公司净利润的质量及成长空间。
某种意义上来说,高的盈利能力也表明公司的“护城河”足够宽,公司的利润能受到足够的保护,其获利能力更为持久,所以投资者的投资风险、持有风险也越低,公司股票的价格有强劲的增长动力。
本文选取的盈利能力指标有总资产净利润率(ROA)和净资产收益率(ROE),营运能力指标有流动资产周转率、总资产周转率和股东权益周转率。
股权集中度指标:
持股集中度是指投资者持有上市公司股票的集中程度,一般来说,持股从分散到集中,表示大资金流入,股价会上涨或者抗跌,值得关注。
高度集中,流动性丧失,则值得警惕。
持股从集中到分散,表示大资金流出,股价会下跌或滞涨,高度分散则可能引起大资金重新收集。
本文选用的持股集中度指标有集中度1(公司第一大流通股股东持股比例)、集中度2(公司前三位流通股股东持股比例之和)、集中度3(公司前五位流通股股东持股比例之和)、集中度4(公司前十位流通股股东持股比例之和)、Z指标(公司第一大流通股东与第二大流通股东持股比例之比)。
3.1.3数据的滞后处理
在检验因子有效性的时候,需要应用到公司财务数据的一类指标在实际的投资过程中并不能够拿到当前时点的公司财务数据。
根据公司财务报告的最晚公布时间,一季报是当年4月底前公布,半年报是8月底前公布,三季报10月底前公布,年报是在下一年的四月底前公布。
考虑到我们的策略是想为实际投资做检验,所以我们对财务数据做以下滞后处理:
1月
2
3
4
5
6
7
8
9
10
11
12
去年三季报
今年一季报及去年年报
今年半年报
今年三季报
3.2α、β值的计算
β值的计算采用历史数据回归法,本月的β值由前三十天的个股交易数据和沪深300指数数据回归得出,具体计算工作用Excel的Linest函数来完成。
共得到81只股票的4536个月度β值。
根据公式
使用Excel的数学函数功能计算α值,共得到81只股票的4536个月度α值。
3.3因子回归分析
首先,按照每个因子从大到小的顺序,把同一时点上的81只股票进行排序。
由于股票的阿尔法值受到多种因素的影响,所以在考虑某一因素对股票阿尔法值影响情况时我们选取10只股票作为一组来进行分析,从而尽量抵消其他因素对实证结果的影响。
选取前10位股票作为第一组,求出此组所有股票的阿尔法收益的均值,记为①,选取后10位股票作为第二组,求出此组所有股票的阿尔法收益的均值,记为②,然后再用第二组的时间序列阿尔法收益分别减去第一组的时间序列阿尔法收益,记为②-①,并求该序列的均值及标准差。
如果②-①序列的均值为正,则说明此因子与阿尔法收益成正相关关系,即此因子越大,阿尔法收益越高,此时第二组为优势组;反之,则因子越大,阿尔法收益越低,此时第一组为优势组。
另外,计算优势组战胜劣势组的概率,作为评价因子有效性的另一个标准。
计算公式为P=优势组战胜劣势组期数/总期数。
最后,用成对双样本均值分析T检验对第一组和第二组进行差异的显著性检验,其中α取值为0.05。
如果差异是显著的,则说明该指标具有一定的区分度。
各因子的实证结果统计见表3.1
表3.1实证结果统计表
分类
指标名称
②-①
均值
Sig值
显著性
优势组战胜劣势组概率
相关关系
成
长
指
标
总资产收益率
-0.0081
0.0636
不显著
62.50%
负相关
基本每股收益增长率
0.0067
0.1084
不显著
62.50%
正相关
ROE增长率
0.0093
0.0171
5%的显著性水平下显著
60.71%
正相关
净利润增长率
0.0072
0.1362
不显著
53.57%
正相关
每股经营活动产生的现金流量净额增长率
-0.0034
0.2694
不显著
55.46%
负相关
流动能力指标
现金流量比率
0.0057
0.0385
5%的显著性水平下显著
53.57%
正相关
每股净现金流量
0.0007
0.1465
不显著
50.00%
正相关
分类
指标名称
②-①
均值
Sig值
显著性
优势组战胜劣势组概率
相关关系
估
值
指
标
市盈率
-0.0058
0.1612
不显著
51.79%
负相关
每股净资产
0.0015
0.4123
不显著
53.57%
正相关
市现率
-0.0050
0.5470
不显著
55.46%
负相关
市净率
0.0071
0.0315
5%的显著性水平下显著
53.57%
正相关
托宾Q值
-0.0008
0.152
不显著
50.00%
负相关
每股储备
0.0029
0.3379
不显著
53.57%
正相关
每股未分配利润
-0.0006
0.4717
不显著
52.79%
负相关
每股公积金
0.0012
0.0452
5%的显著性水平下显著
55.36%
正相关
盈利和营运能力指标
ROA
-0.0098
0.1006
不显著
60.71%
负相关
ROE
-0.0099
0.0983
不显著
51.89%
负相关
流动资产周转率
0.0086
0.0458
5%的显著性水平下显著
55.36%
正相关
总资产周转率
0.0014
0.3887
不显著
53.57%
正相关
股东权益周转率
0.0011
0.4312
不显著
52.79%
正相关
股权集中度指标
集中度1
0.0014
0.3288
不显著
53.57%
正相关
集中度2
0.0069
0.0412
5%的显著性水
平下显著
60.71%
正相关
表3.1实证结果统计表(续)
表3.1实证结果统计表(续)
分类
指标名称
②-①
均值
Sig值
显著性
优势组战胜劣势组概率
相关关系
股权集中度指标
集中度3
0.0044
0.0512
不显著
51.79%
正相关
集中度4
0.0064
0.0680
不显著
55.36%
正相关
Z指标
-0.0023
0.0407
5%的显著性水平下显著
53.57%
负相关
理论上高成长能力上市公司的股票应该拥有较高的预期收益,从而可以获得较高的阿尔法收益,即成长能力指标与阿尔法收益应该呈正相关关系。
从实证结果看,总资产收益率和每股经营活动产生的现金流量净额增长率这两个指标均与阿尔法呈负相关关系,这说明在实际投资过程中无法通过总资产收益率和每股经营活动产生的现金流量净额增长率这两个指标筛选高阿尔法收益的股票。
而按照基本每股收益增长率和净利润增长率这两个指标进行排序分组后,第一组和第二组的阿尔法收益并不存在显著差异,所以这两个指标并不是筛选高阿尔法收益股票的理想指标。
按照ROE增长率指标排序分组后,第一组与第二组的阿尔法收益具有显著差异性,且②-①均值为0.0093,也就是说如果投资期限为一个月,那么持有第二组股票组合得到的阿尔法收益比持有第一组股票组合得到的阿尔法收益高出0.93个百分点,这个收益是非常可观的,并且第二组有60.71%的概率击败了第一组,72.18%的概率获得了正的阿尔法收益,因此,ROE增长率是筛选高阿尔法收益股票的一个比较理想的指标。
在估值指标中,市盈率、市现率、每股净资产、托宾Q值、每股储备、每股未分配利润均不具有明显的区分性,不适合做筛选高阿尔法收益股的指标,而市净率和每股公积金均与阿尔法收益正向相关,虽然估值指标并不是越低越好,但是高估值的股票很难获得超额收益,所以,排除与阿尔法正向相关的市现率和每股公积金指标。
由此看来估值指标并不能有效筛选高阿尔法收益股票。
流动能力指标中,每股净现金流量不具有区分度,排除。
现金流量比率有一定的区分度,②-①均值为0.0057,但是第二组只有53.57%的几率战胜第一组,56.29%的概率获得了正的阿尔法收益,因此此指标是一个比较弱的筛选指标。
盈利和营运能力指标中ROA、ROE、总资产周转率、股东权益周转率这四个指标均不具备区分度,流动资产周转率指标随具有一定区分度,②-①均值为0.0086,并且第二组有55.36%的概率击败了第一组,69.75%的概率获得了正的阿尔法收益,理论上流动资产周转率越高的公司营运能力越强,预期收益率越高,流动资产周转率越低的公司营运能力越差,预期收益率越低,即流动资产周转率与阿尔法收益正向相关,这与流动资产周转率与阿尔法收益之间关系的实证检验结果相吻合,因此,流动资产周转率可以作为筛选高阿尔法收益股的指标。
股权集中度指标中集中度1、集中度3、集中度4均不具备区分度,而Z指标与阿尔法收益负向相关,理论上,一种股票的持股集中度越高说明市场对该股票的认可度越高,股票价格上涨的预期也就越强烈,股票获得超额收益的几率越高,即持股集中度与阿尔法收益成正向相关关系,因此,排除Z指标,持股集中度2指标具有一定的区分度并且与阿尔法收益