股票相关性分析.pptx
《股票相关性分析.pptx》由会员分享,可在线阅读,更多相关《股票相关性分析.pptx(22页珍藏版)》请在冰豆网上搜索。
![股票相关性分析.pptx](https://file1.bdocx.com/fileroot1/2022-10/9/834c336b-39e7-4c44-9610-d56ce63f9f42/834c336b-39e7-4c44-9610-d56ce63f9f421.gif)
股票的关联规则挖掘目录nCopula函数n股票相关性网络n协同微粒群nApriori算法Copula函数n一致性相关系数:
度量了两个随机变量的变化一致性或协调性(同时增大或减小)程度。
n=P(x1-x2)(y1-y2)0-P(x1-x2)(y1-y2)x1|X2x2:
当X2x2时X1x1的概率是否会发生变化,x1,x2相当大时,就是X1和X2的尾部相关性。
Copula函数nCopula函数描述的是变量间的相关性,实际上是一类将联合分布函数与它们各自的边缘分布函数连接在一起的函数。
n利用Copula函数可以计算一致性相关系数。
构造股票相关性网络n将每一只股票看作一个节点,股票与股票之间的关联关系看成边;n当股票a的价格变化影响股票b的价格变化时,则它们的关联关系是从a指向b的。
当股票b的价格变化影响股票a的价格变化时,则它们的关联关系是从b指向a的;n当a对b的影响大于b对a的影响,则认为两只股票的关联关系是从a指向b,反之则是从b指向a。
构造股票相关性网络n任意选取两只股票a和b,则a股票和b股票的相关性系数为:
其中构造股票相关性网络根据关键点可以对股票网络进行板块划分协同微粒群n将粒子编码为影响股票走势的各个相关因素,粒子通过适应度函数来进行更新,并且在更新的过程中保留原来的较优成分进行遗传。
协同微粒群n假设微粒群的节点搜索位置空间的维度为D维,粒子的编码使用某种属性下的关联股票的属性值。
初始化选取m个粒子构成的粒子群,粒子的空间优化问题就是选取属性关联下的符合目标函数的粒子。
n空问中第i个粒子的编码就是选取的分析股票下某种属性的属性值,表示为以下的形式Xi=(Xi1,Xi2,Xin),n代表分析股票的总数。
协同微粒群第第i个粒子空间更新的速度为个粒子空间更新的速度为第第i个粒子历史最优位置为个粒子历史最优位置为整个粒子群历史最优位置整个粒子群历史最优位置粒子可以根据如下的公式进行速度与位置的更新粒子可以根据如下的公式进行速度与位置的更新K为微粒群中优化的迭代次数,为微粒群中优化的迭代次数,r1和和r2是在区间是在区间0,1上的随机数,这两个随机数能够有效保持微上的随机数,这两个随机数能够有效保持微粒群优化的多样性。
粒群优化的多样性。
C1和和C2是两个学习因子,这两个系数可以保证粒子对全局位置的学习能力。
是两个学习因子,这两个系数可以保证粒子对全局位置的学习能力。
协同微粒群支持度挖掘粒子群S(i),S(R)分别表示微粒的支持度与用户预先设置的支持度。
分别表示微粒的支持度与用户预先设置的支持度。
cov(A+B)是指两种事件在数据库中的比例。
)是指两种事件在数据库中的比例。
置信度挖掘粒子群协同微粒群初始化m个粒子支持度微粒群规则度微粒群规则提取更新进入规则微粒群更新符合适应度粒子补充不符合适应度粒子更新能力保持Apriori算法n依据支持度找出所有频繁项集n依据置信度产生关联规则项集(项集(Itemset):
同时出现的项的集合。
定义为:
):
同时出现的项的集合。
定义为:
k-itemset(k项集)。
项集)。
Apriori算法n首先,找出频繁“1项集”的集合,该集合记作L1。
L1用于找频繁“2项集”的集合L2,而L2用于找L3。
如此下去,直到不能找到“K项集”。
找每个Lk都需要一次数据库扫描。
n置信度大于给定最小置信度minConf的关联规则称为频繁关联规则(FrequentAssociationRule)。
数据预处理n插值:
由于连续交易的时间间隔不同,因此在一个时间段内,甚至可能没有任何的记录。
按照给定的时间单元间隔对高频交易数据采样,选择最近的一个价格点填充。
n小波分析:
股票的价格变动可以看作一个一维离散信号,对于一维离散信号来说,其高频部分影响的是小波分解的第一层细节,其低频部分影响的是小波分解的最深层和低频层。
小波降噪的过程,就是把信号分解为多个子信号,通过对小波分解系数的处理去掉其中的噪音部分,然后把余下部分进行合并重构的过程。
n使用SYM8小波,对价格信号进行两层分解,对分解得到的分解系数进行Heursure阈值处理。
数据预处理n涨幅z定义如下:
若第I时刻成交价为Pi,第I-1时刻成交价为Pi-1,则涨幅z=(Pi-Pi-1)/Pi-1。
同时约定:
z1%时为涨,记为1;z-1%时为跌,记为0。
n考虑时滞性:
以时间窗口的个数作为事务项。
数据预处理数据预处理数据预处理构造股票相关性网络n利用股票的相关性网络找出关键点并进行板块划分。
投资者的盈亏大约80%是来自于买卖时机的选择,还有20%的比例是来自于板块和个股的选择。
如果个股所属的板块整体有行情,那么买卖这样的个股盈利可能性更大。
Apriori算法n挖掘关联规则n频繁项集n关联规则