1、算术平均arithmetic mean:相加后除以数据几何平均geometric mean:可以排除算术平均的极端值,相乘后开次方。计算多期平均价收益率调和平均harmonic mean:用于计算定投平均成本N/,3期1元定投价格X1、X2、X3,总共3元买入了份股票,调和平均成本即为3/调和平均几何平均算术平均,等号成立只有X1=X2=X3时加权平均weighted mean:加入资产比重计算分位数L =(N+1)Y/100,N是样本数、Y是分位数位置数:四分位、五分位。总体方差variance: 开根号后即为总体标准差standard deviation。样本方差:开根号后即为样本标准差。
2、以上公式用于衡量收入偏离均值的平均距离值。变异系数coefficient of variation:CV=S/X平均值,样本标准差除以样本均值。用于对比不同资产(农业银行股份、茅台股份),一单位均值收益率承受的风险,系数越低越好。对比两家公司的例题出现标准差、平均值时使用。夏普比例,资产收益率-无风险收益率,除以总体标准差,用于衡量资产P在单位风险下的差额收益,比例越大越好。偏度skewness:偏度大于0,数据出现右偏,也叫正偏。偏度小于0,数据出现左偏,也叫负偏主要观察尾巴,而不是肩膀,右边尾巴长为右偏。左边尾巴长为左偏(与意识中概念不相同)。管理学中的长尾理论实际上是就是数据的左偏和右偏
3、。无需记忆公式记住偏度是有关的表达式,反映的是数据分布的对称性。相对于Xi而言右向偏离X平均值较多为右偏。众数被定义为概率分布的最高点。左偏时:均值中位数众数。右偏时:众数中位数均值。偏度是衡量尾巴长度是偏左还是偏右,峰度是进一步衡量尾部的厚度。无需记忆公式记住偏度是有关的表达式,衡量尾部厚度。峰度越高说明xi偏离x平均值的极端值越多,尾部越后。反之则尾部较薄,实际运用中通常用正态分布峰度为3作为基准,峰度高于3为高峰,为尖峰肥尾,峰度低于3为低峰,为矮峰瘦尾。正态分布表示均值表示标准差横轴区间(-,+)内的面积为68%。横轴区间(-1.65,+1.65)内的面积为90%。横轴区间(-1.96
4、,+1.96)内的面积为95%。横轴区间(-2.58,+2.58)内的面积为99%。正态分布有负数,设置对数正态分布来弥补,对数正态分布没有负数、概率密度函数是正偏,主要用来衡量资产价格。而正态分布主要用来衡量收益率。超峰度与峰度不同,超峰度是以超过3为基准,正态分布的超峰度为0。Leptokurtic高峰Mesokurtic 平峰Platykurtic低峰概率论基础随机变量的部分组成的集合称为随机事件,简称为事件event事件的三个分类:互斥事件mutually exclusive events、遍历事件exhaustive events、独立事件indepengdent events遍历事
5、件:掷骰子,要么单数要么双数,单数和双数都为遍历事件,不可能还有其他的情形。遍历事件的概率和为1。独立事件P(AB)=P(A)事件概率的三类:经验概率empirical probability、先验概率priori probability、主观概率subjective probability,前两类又为客观概率。经验概率通过历史数据和客观规律来估计。比如股票分红推算先验概率通过逻辑分析而不是历史数据。比如抛硬币主观概率:依据个人主观判断,在数据量小时发挥作用。赔率odds:P(E)/(1-P(E),一匹马获胜真实概率1/8,赔率应该是(1/8)/(1-1/8)=1/7,即1赔7。条件概率con
6、ditional probability,在已知B发生的情况下,事件A发生的概率,记为P(AB)随机变量的期望是以概率为权重,所有可能结果的加权平均,记为E(x)贝叶斯定理bayes formula是一种在已知其他概率的情况下求概率的方法:公式ABABABP(A|B) 是在 B 发生的情况下 A 发生的概率;P(A) 是 A 发生的概率;P(B|A) 是在 A 发生的情况下 B 发生的概率;P(B) 是 B 发生的概率。 天空多云。50%的雨天的早上是多云的,大约40%的日子早上是多云的。平均30天里一般只有3天会下雨,10%。会下雨的可能性是 P(雨|云)。P(雨|云) = P(雨)P(云|
7、雨) /P(云)P(雨) 是今天下雨的概率 = 10%P(云|雨) 是在下雨天早上有云的概率 = 50%P(云) 早上多云的概率 = 40%P(雨|云) =0.10.5/0.4=0.125,下雨的概率只有12.5%300只股票,设置多个条件,符合标准的概率为条件相乘后乘以300。协方差covariance度量不同资产间的收益率联动性,但是斜方差有缺陷,取值是负无穷到正无穷,没有考虑量纲。相关系数改进了这点,将协方差除以资产i与资产j的标准差,相关系数为1是正相关,相关系数为-1是负相关。排列组合的种类数量种类用n!,及n的阶乘计算。3!=3*2*1常见概率分布离散型discrete随机变量的可
8、能取值要么是有限的,要么是无限但可数的。连续型continuous随机变量的可能值为无限且不可数。伯克利Bernoulli试验非对即错,多次伯克利试验构成二项分布binomial random variable。例题:一支股票超过市场表现概率为35%,接下来10天,超过6天超过市场表现概率是多少?0.356 * 0.6510-6多元分布multivariate distribution是多个资产的随机变量的分布,只需要知道三个参数:每个资产收益率均值、方差、不同资产的相关系数。用于衡量总体特征的统计量称为参数,通常用希腊字母表 。(表示总体)有样表计算的结果称为样本统计量,用大写字母表示标为
9、X,并以此来估计总体参数 抽样偏差包含:数据挖掘偏差、样本选择偏差(幸存者偏差)、前视偏差look-ahead bias(财务数据的使用有滞后性)、时间段偏差(特定时间结论,无法推广)。点估计指利用样本统计量来估计总体参数。统计量的判断标准:无偏性unbiasedness、有效性effciency、一致性consistency中心极限定理central limit theorem三个条件和三个结论抽样必须是简单随机=样本统计量 X服从正态分布总体的均值与方差均有限,不为无穷大=样本统计量 X的均值为 。样本的统计量超过30=样本的统计量的方差为 2/n置信区间confidence interv
10、al指估计未知总体参数的区间范围95%的置信水平的置信区间,与5%显著性水平的置信区间是完全等价的。置信区间的宽度与置信水平正相关,与显著性水平负相关。置信区间概率置信因子confidence factor 1.65对应90%的置信区间置信因子1.96对应95%的置信区间置信因子2.58对应99%的置信区间给出样本容量大于30、给出市盈率的均值19、给出样本标准差6.6,计算置信水平95%的置信区间。解:191.96*6.6=(6.06,31.94)当总体方差已知时,检验单个总体均值采用Z统计量。当总体方差未知时,用样本方差替代总体方差,采用T统计量。当总体方差未知,但样本容量足够大时也可以采
11、用Z统计量。技术分析是指利用价格和交易量图像进行分析,最终做出投资决策。技术分析假设:交易决定市场价格和成交量、价格同时反映理性和非理性市场参与者行为、有效市场假说不成立、证券可在市场上交易、历史会重演。优点:基于实际交易数据、可用于分析不产生现金流的资产价格(大宗商品、汇率)缺点:不适用于流动性差、容易被操作的市场,不适用于分析破产的公司。基本面分析是对宏观经济、行业、公司业务管理水平等基本面的分析,与技术分析相对。技术分析:分析价格与成交数据、试图找出适合的交易价格。基本面分析:分析财务报表、但数据不一定客观、有可能基于估计或假设、试图找出资产的内在价值。支撑位support和阻力位resistance会相互转换技术分析常见图像:折线图line chart、点数图bar cahrt、点数图point momentum、蜡烛图candlestick chart头肩形head and shoulders几个特征:左肩成交量最大,头部成交量略小,右肩成交量最小,成交量呈递减现象。目标价格=颈线-(头部-颈线)双重顶形类似M,第二个顶点相对于第一个成交量略有收缩。三重顶的成交量也是逐渐减小。整理形态分为:三角形态triangles、矩阵形态rectangle pattern、旗形形态flags and pennants。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1