Chinascope数库多因子量化投资平台.docx

上传人:b****8 文档编号:29640246 上传时间:2023-07-25 格式:DOCX 页数:30 大小:2.71MB
下载 相关 举报
Chinascope数库多因子量化投资平台.docx_第1页
第1页 / 共30页
Chinascope数库多因子量化投资平台.docx_第2页
第2页 / 共30页
Chinascope数库多因子量化投资平台.docx_第3页
第3页 / 共30页
Chinascope数库多因子量化投资平台.docx_第4页
第4页 / 共30页
Chinascope数库多因子量化投资平台.docx_第5页
第5页 / 共30页
点击查看更多>>
下载资源
资源描述

Chinascope数库多因子量化投资平台.docx

《Chinascope数库多因子量化投资平台.docx》由会员分享,可在线阅读,更多相关《Chinascope数库多因子量化投资平台.docx(30页珍藏版)》请在冰豆网上搜索。

Chinascope数库多因子量化投资平台.docx

Chinascope数库多因子量化投资平台

Chinascope数库多因子量化投资平台

多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。

数库多因子量化平台,是数库团队依托金融大数据开发的量化平台,克服了传统策略开发过程中的种种问题,力求做到数据权威、因子丰富、回测精准、评价全面、个性化功能更加丰富。

传统策略开发过程中的问题

1.数据维护耗时耗力:

数据量庞大,从原始数据到因子数据,任何环节出错就会造成策略失真

2.计算处理能力受限:

个人电脑在处理批量计算时,速度缓慢

3.回测结果无法有效保存:

无法有效的形成统一规划的可视化输出,策略结果随意保存

4.策略不能及时跟踪:

策略更新需重复运行代码,无法有效跟踪策略绩效

数库能做到的

1.更高效、权威、及时的原始数据

2.更加全面、丰富的因子库、

3.更加精准的回测算法

4.更加权威、全面的因子评价指标

5.更丰富的自定义功能

因子分类【因子目录】

财务因子:

估值、盈利能力、成长能力、资本结构、运营、流动性

技术因子:

动量型、趋势型、波动型、成交量型、超买超卖型

Ⅱ. 因子目录

因子目录有两种呈现方式,即因子列表和因子筛选。

因子列表,即以列表形式展示全部或某类因子的名称、释义及公式;因子筛选,即以列表形式展示各因子近期表现指标,且可通过设定指标取值范围进行因子筛选。

因子列表与因子筛选页面均可进行收藏、加入组合及加入对比操作。

1. 因子列表

∙通过类型选择进行因子类型切换,默认显示全部因子;

∙单击因子名,可进入该因子数据概览界面,见Ⅲ.单因子有效性评价;

∙通过右侧按钮进行收藏、加入组合、加入对比等操作.

2. 因子筛选

∙参数设置:

股票池; IC计算方法; 类型选择;

∙通过右侧按钮进行收藏、加入组合、加入对比等操作;

∙单击因子名,可进入该因子数据概览界面,见 Ⅲ.单因子有效性评价;

Ⅲ. 单因子有效性评价

工具栏

凡是界面上出现的工具栏,均可通过其对进行相应的操作:

∙收藏、加入组合、加入对比

在单因子有效性评价页面,可通过收藏、加入组合、加入对比进行相应的操作;

∙对比栏

右侧悬浮对比栏,显示当前已加入对比的因子列表,上限为5个;通过对比 、 清空 、 删除可对对比栏因子进行相应操作。

1.数据概览

单因子有效性评价首页为数据概览界面,基本参数设置同上,该界面呈现如下内容:

∙近12期所选股票池的因子值分布箱形图

∙近12期所选股票池的收益率分布箱形图

∙近12期股票覆盖率序列图(股票覆盖率:

即每期被纳入到选股范围的股票占股票池所有股票的百分比)

∙单期因子值分布直方图

∙单期股票收益率和因子值散点图

∙单期各档收益率分布:

横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布

箱形图

又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。

2.IC分析

信息系数相关算法

点击IC分析,进入IC界面,基本参数设置同上,通过IC计算方法选择不同的信息系数(默认为normalIC);

∙图-IC :

柱状为每期的IC值,曲线为IC的12期移动均值;

∙图-IC分布 :

呈现所选起止时间内IC值的分布图、及IC的均值和标准差;

∙图-IC衰退 :

主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。

首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,...,12;其次,分别对因子每隔i期的信息系数计算均值;

∙图-IC统计指标:

即各分组IC的均值、P值均值、标准差和IR值;

∙图-因子自相关序列:

即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。

3.收益率分析

收益率相关指标算法

点击收益率分析切换到收益率界面,基本参数设置同上,该页面呈现:

∙累计收益率:

即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同);

∙收益率分布:

呈现选择组别在所选起止时间内收益率的分布、及收益率均值和标准差;

∙收益率对比:

呈现选择组别在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益;

∙收益率统计指标:

即因子收益率相关的评价性指标。

4.换手率分析

换手率算法

点击换手率分析可切换到换手率界面,基本参数设置同上,该页面呈现如下内容;

∙图-换手率:

即所选时间段中各组的换手率序列,选择计算方法可切换不同的换手率,复选Q1-Q5可对比不同组的换手率序列;

∙图-平均换手率:

即所选起止时间内换手率序列均值;

∙图-换手率对比:

即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别可切换Q1至Q5;

∙图-买入信号衰退和反转:

买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为中性信号; 衰退指TOP组中股票近12期仍保持买入信号的比率逐渐减少,反转指TOP组中股票近12期每期变更为卖出信号的比率逐渐增加;通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。

(注:

若无反转信号,则买入信号反转图为空。

5.选股结果

选股结果,即按因子值排列选出的Top组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别可查看不同组别的市值和行业占比。

6. 月历效应

金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。

月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。

∙因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应;

∙因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。

Ⅳ因子对比

点击单因子界面的悬浮窗对比按钮,可进入因子对比界面(对比因子上限为5个),且可通过生成组合建立组合;

设定相关参数后,可呈现以下内容:

∙统计指标对比表:

即所选各对比因子起止时间内的信息系数、收益率、换手率等相关指标(详见算法说明);

∙累计收益率对比图:

即所选各对比因子的累计收益率曲线对比,通过按组查看可切换至Q1、Q2、Q3、Q4、Q5或Q1-Q5组;

∙IC对比:

即所选各对比因子(不分组)信息系数序列对比,通过IC计算方法选择normalIC或者RankIC;

∙换手率对比:

即所选各对比因子所选组别的换手率序列对比,通过换手率计算方法可选择个数算法或者市值权重法;

∙平均市值对比:

即所选各对比因子各组股票的平均市值序列对比,通过选择组别可切换至Q1、Q2、Q3、Q4、或Q1-Q5组;

∙滚动相关系数:

即所选N个对比因子两两因子值间的截面相关系数序列,通过选择因子设定基准因子,该图呈现N-1条滚动相关系数曲线;

∙因子相关性矩阵:

每两因子的相关系数,即所选起止时间内两因子滚动相关系数序列均值。

Ⅴ因子收藏

∙点击因子收藏切换到因子收藏页面如下图,通过因子收藏可更加快捷地进行因子选择;

∙点击因子名称,可进入该单因子有效性评价界面;

∙通过右侧工具栏,可进行取消收藏、加入组合、加入对比等操作。

Ⅵ因子组合

点击因子组合 可切换到因子组合界面,可对多组合进行编辑,如创建组合、删除组合、重命名组合等; 

选择因子组合名称,如因子组合1,或者点击因子对比界面右侧的生成组合,则均进入组合界面。

因子组合界面由回测设置、回测结果、策略跟踪三部分组成。

1.回测设置

起止时间:

开始时间、结束时间

股票池:

沪深300、中证500、中证800

调仓期:

周、月、季

因子加权:

等权法、IC加权法、IC_IR加权法、收益率加权法

IC计算方法:

NormalIC、RankIC

组合加权:

平均权重、市值权重

分组组数:

5组、10组、15组、20组、30组

∙添加因子:

点击右侧添加因子,出现因子库界面,在左侧因子列表中选择因子并设定因子方向(默认因子降序),构建因子组合,选择生成策略或另存为可保存因子组合。

2.回测结果:

在回测设置页面选择生成策略则对其进行回测计算,回测结果由IC分析(信息系数算法)、收益率分析(收益率相关指标算法)、换手率分析(换手率算法)、月历效应、选股结果五部分组成。

选择IC分析、收益率分析、换手率分析、月历效应、选股结果,则进入相应页面,因子组合评价页面与单因子评价界面类似,算法详见因子组合评价逻辑。

3.策略跟踪:

策略跟踪由累计收益率、策略历史表现、股票信息、相关资讯四部分组成。

∙累计收益率:

呈现回测期间Q1与基准指数的累计收益率曲线,及累计收益率(%)和最大回撤(%)指标;

∙策略历史表现:

呈现Q1、Q5、Q1-Q5、基准指数的累计收益率和当期收益率,以及年化收益率、最大回撤、标准差、胜率、最大单期涨幅、最大单期跌幅、夏普比率和信息比率指标;

∙股票信息:

呈现当前持仓股票所属行业、因子值、最新价、昨日收盘价、涨跌幅、仓位,以及该组合的历史调仓记录等;

∙相关资讯:

即当前持仓股票的相关新闻资讯。

Ⅶ 算法说明

单因子评价算法逻辑

因子数据获取与处理流程:

∙根据回测起始日期确定所涉及到的财报报告期;

∙根据起始日期与调仓频率确定回测期间的调仓期(具体的日期);

∙根据调仓期与财务数据映射原则确定所用到财报报告期;

∙跟据用户输入的参数从数据库中提取原始数据,原始数据有三个维度:

报告期,股票名,因子值;

∙对原始数据进行去极值和标准化处理;

∙将原始数据的频率转换至用户设定的调仓周期。

MAD去极值处理

去极值算法的主要目的是为了使因子数据在一个合理的范围之内。

去极值的方法主要有两种:

MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。

f′i=⎧⎩⎨fm+nfMADfm−nfMADfiif fi>u+nfMADif fiu+nfMADfm−nfMADif fi

fm为fi序列中位数fm为fi序列中位数

fMAD为|fi−fm|的中位数fMAD为|fi−fm|的中位数

标准化处理

标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差,主要有普通标准化和行业标准化,区别是因子暴露值的均值和标准差计算方式不同,行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。

fi=frawi−uσfi=firaw−uσ

fi为标准化后的修正值fi为标准化后的修正值

frawi:

原始数值firaw:

原始数值

u:

fi序列均值u:

fi序列均值

σ:

fi序列标准差σ:

fi序列标准差

IC信息系数

IC(InformationCoefficient,信息系数):

∙normalIC,即某时点某因子在全部股票的暴露值与其下期回报的截面相关系数;

normalIC=corr(factort−1,returnt)normalIC=corr(factort−1,returnt)

factort−1为t-1期的因子值factort−1为t-1期的因子值

returnt为t期的因子收益率returnt为t期的因子收益率

∙rankIC,即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数;

rankIC=corr(orderfactort−1,orderreturnt)rankIC=corr(ordert−1factor,ordertreturn)

orderfactort−1为各股票t-1期的因子值排名ordert−1factor为各股票t-1期的因子值排名

orderreturnt为各股票t期的因子收益率排名ordertreturn为各股票t期的因子收益率排名

因子收益率相关指标

平均收益率

Ravg=1t∑i=1tRtRavg=1t∑i=1tRt

t为总样本期数t为总样本期数

Rt为因子t期的当期收益率Rt为因子t期的当期收益率

累计收益率

Rcumt=Π((1+R1)⋯(1+Rt))−1Rtcum=Π((1+R1)⋯(1+Rt))−1

年化收益率

Rannual=(Π(1+R1)⋯(1+Rt))Nt=(Rcumt+1)NtRannual=(Π(1+R1)⋯(1+Rt))Nt=(Rtcum+1)Nt

N为一年调仓次数N为一年调仓次数

t为总样本期数t为总样本期数

最大盈利、最小盈利

Bestmonth=max(Rt)Bestmonth=max(Rt)

Worstmonth=min(Rt)Worstmonth=min(Rt)

Rt为因子t期的收益率Rt为因子t期的收益率

最大回撤(Drawdown)

最大回撤:

在选定样本周期内任一历史时点往后推,资产价格走到最低点时的收益率回撤幅度的最大值。

最大回撤用来描述买入资产后可能出现的最糟糕的情况。

Drawdownt={0NETt−minj≥tNETjNETtif NETt=minj≥tNETjelseDrawdownt={0if NETt=minj≥tNETjNETt−minj≥tNETjNETtelse

NET为某期净值NET为某期净值

MaxDrawdown=max(Drawdownt)MaxDrawdown=max(Drawdownt)

标准差(年化)

波动率,即组合收益率的方差,波动率越大,则风险越高。

Volatility=N×∑i=1T(Ri−R¯)2T−1−−−−−−−−−−−−−−−⎷Volatility=N×∑i=1T(Ri−R¯)2T−1

Ri为{组合收益率}Ri为{组合收益率}

R¯为组合收益率均值R¯为组合收益率均值

T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数

下行标准差(年化)

s=N×∑Ri≺R¯(Ri−R¯)2T−1−−−−−−−−−−−−−−−−⎷s=N×∑Ri≺R¯(Ri−R¯)2T−1

Ri为组合收益率Ri为组合收益率

R¯为组合收益率均值R¯为组合收益率均值

T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数

超额收益

Rexcesst=Rt−ItRtexcess=Rt−It

Rt为因子t期收益率Rt为因子t期收益率

It为基准指数t期收益率It为基准指数t期收益率

年化超额收益

excessRannual=Rannual−IannualexcessRannual=Rannual−Iannual

Rannual为因子年化收益率Rannual为因子年化收益率

Iannual为基准指数年化收益率Iannual为基准指数年化收益率

最大、最小超额收益

BestExcess=maxRexcesstBestExcess=maxRtexcess

WorstExcess=minRexcesstWorstExcess=minRtexcess

CAPMAlpha,Beta

CAPMAlpha和Beta由因子某组收益率序列对指数同期收益率做一元线性回归得到:

Alpha即每组收益相对于回测选股基准收益的Alpha值,表示风险调整后的超额收益,其中,风险用Beta衡量;Beta,即每组收益相对于回测选股基准收益的Beta值,表示该组收益相对于基准指数的波动性大小,该值大于1表示该组收益波动性大于样本,反之,则波动性小于样本;

Rt=Alpha+Beta∗ItRt=Alpha+Beta∗It

跟踪误差(TrackingError)

跟踪误差即超额收益的年化标准差;

TE=∑t=1T(Rt−It)2T−1−−−−−−−−−−−⎷TE=∑t=1T(Rt−It)2T−1

T为样本观测期T为样本观测期

Rt为因子t期收益率Rt为因子t期收益率

It为基准指数t期收益率It为基准指数t期收益率

胜率(HitRatio)

胜率即在整个样本期内,组合收益率战胜市场平均收益率的次数占整个样本期的比率胜率越大,有效性越显著。

HitRatio=num(Ri>Mi)THitRatio=num(Ri>Mi)T

num(Ri>Mi)为组合收益率战胜市场平均收益率的次数num(Ri>Mi)为组合收益率战胜市场平均收益率的次数

夏普比率(SharpRatio)

夏普比率,表示每承受一单位风险,会产生多少超额报酬,这里风险被定义为波动率,即组合收益的标准差。

夏普比率越高,每单位风险创造的超额收益越多。

SharpRatio=Ri−Rfσ(Ri) SharpRatio=Ri−Rfσ(Ri) 

Ri为组合年化收益率Ri为组合年化收益率

Rf为年化无风险收益率Rf为年化无风险收益率

σ(Ri)为组合年化收益的标准差σ(Ri)为组合年化收益的标准差

信息比率(InformationRatio)

信息比率,即组合年化超额收益的均值与标准差的比值;

IR=avg(Ri−Rm)σ(Ri−Rm)IR=avg(Ri−Rm)σ(Ri−Rm)

Ri为组合年化收益率Ri为组合年化收益率

Rm为基准指数年化收益率Rm为基准指数年化收益率

σ(Ri−Rm)为组合年化超额收益的标准差σ(Ri−Rm)为组合年化超额收益的标准差

组合换手率计算方法

T=12∑i=1N|wnewi−woldi|T=12∑i=1N|winew−wiold|

Wnew=(wnew1,⋯,wnewN)′Wnew=(w1new,⋯,wNnew)′

Wold=(wold1,⋯,woldN)′Wold=(w1old,⋯,wNold)′

(1)个数法换手率

即每期各分组中股票数目变化百分比:

Turnovert=i组t期较t-1期股票变动数量i组股票数量Turnovert=i组t期较t-1期股票变动数量i组股票数量

(2)权重法换手率

即各组股票权重值变化绝对值加总的一半,基于市值权重和平均权重分别得到市值加权的换手率(权重法cap)和平均加权的换手率(权重法equal):

Turnovert=12∑s=1n|weights,t−weightss,t−1|Turnovert=12∑s=1n|weights,t−weightss,t−1|

weights,t为t期s股票在组合中所占权重weights,t为t期s股票在组合中所占权重

多因子组合算法逻辑

多因子组合分析时的相关评价指标与单因子分析时的指标一样,唯一的区别是因子(因子组合)暴露值不同:

∙单因子分析时,股票因子暴露值就是股票当期的该因子值;

∙多因子分析时,某股票在多因子组合下的暴露值是该股票根据该因子组合内各因子加权得到的综合因子值。

相关术语

∙股票原始因子值:

即股票在各因子上的暴露值;

∙股票调整因子值:

即股票在各原始因子值乘以对应的因子权重所得值;

∙股票综合因子值:

即股票各调整因子值的加总;

∙股票综合得分:

即股票按照各原始因子值(或调整因子值)进行排序打分,股票在各因子上的得分与对应因子权重乘积的加总。

因子组合部分主要包括因子加权、计算综合因子值、综合打分、股票加权等部分,整体思路如下图:

(1)因子加权方法:

∙等权法

每个因子赋予相同的权重,即若该类别共有N个因子,则每个因子权重为1/N。

∙因子IC加权:

根据每个因子最近N个月的IC绝对值的均值进行加权,N默认为12个月。

步骤如下:

∙计算回测开始期前12期至回测结束期每个因子的IC值(IC值默认为NormalIC);

∙从回测开始期$t_0$至回测结束期$t_N$每个因子$f$每期的权重计算如下:

Wtf=mean(ICtf:

ICt−12f)∑f∈Fmean(ICtf:

ICt−12f)Wft=mean(ICft:

ICft−12)∑f∈Fmean(ICft:

ICft−12)

∙因子收益率加权法

根据因子最近N个月平均收益率而分配不同权重,N默认为12个月。

步骤如下:

∙计算回测期开始至结束期每个因子的收益率;按照因子值排序并分组,Top组股票(平均权重)的综合收益率;

∙从回测开始期$t_0$至回测结束期$t_N$每个因子$f$每期的权重计算如下:

Wtf=mean(Rtf:

Rt−12f)∑f∈Fmean(Rtf:

Rt−12f)Wft=mean(Rft:

Rft−12)∑f∈Fmean(Rft:

Rft−12)

∙因子IC_IR加权法

计算方法类似因子IC加权算法,唯一的不同是把IC替换为IC_IR,计算步骤如下:

∙计算回测开始期前12期至回测结束期每个因子的IC值(IC值默认为NormalIC);

∙从回测期开始计算每期的IC_IR值;

∙从回测开始期$t_0$至回测结束期$t_N$每个因子$f$每期的权重计算如下:

Wtf=mean(ICIRtf:

ICIRt−12f)∑f∈Fmean(ICIRtf:

ICIRt−12f)Wft=mean(ICIRft:

ICIRft−12)∑f∈Fmean(ICIRft:

ICIRft−12)

(2)综合因子值

计算综合因子值,即对有效因子原始值结合因子权重得到有效因子的赋权修正值,加总后得到个股的综合因子值;

(3)综合打分

计算综合得分,即将所有个股分别按照各单个因子修正值Value进行排序,并分为N档,第一档N分,第二档N-1分,依此类推,第N档得分为1,将个股在各因子上得分并乘以各因子的权重加总后得到个股的综合得分。

(4)股票加权

根据股票综合得分选取相应股票组合后,则要选取组合中个股的加权方法:

∙【默认】平均权重法:

即组合中股票具有同等的权重,即当组合P中包含N只股票时,每只股票的权重为1/N

∙市值权重法:

组合中的股票权重取决于股票市值的大小,即根据个股最新流通市值分配不同权重.

Wi=Capi∑ni=1CapiWi=Capi∑i=1nCapi

上述多因子组合算法通过设定因子加权方法计算股票的综合因子值、根据因子值进行打分得到股票的综合得分、根据综合得分进行分组(默认5组)得到Q1、Q2、Q3、Q4、Q5,设定股票加权方法则可参照单因子算法进行有效性评价。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1