1、如何利用excel做数据分析上下网站分析中专业的工具除了 Google An alytics, Adobe Sitecatalyst, Webtre nds, 腾讯分析和XX统计等外,我想最常用的数据处理工具就是 Excel 了,Excel里头最基础的就是运算和图表的制作,稍微高级一点就是函数和数据透视表的 使用了,当然你可能还会想到 VBA和宏,但估计很少高手会使用这些高级的功能。那对于高级的数据分析而言,也就是涉及统计学的专业分析方法和原理的时候, 是不是就一定得求助于SPSS,SA磁类专业的分析工具呢?数据分析从低级到高级层次的跳跃过程中有没有可以起承接 作用的工具呢?其实是有的,这就是
2、Excel的数据分析功能。貌似最近比较火的两本Excel书籍谁 说菜鸟 不会数据分析和让Excel飞都没有涉及这部分的内容。高级的数据分析会涉及回归分 析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无 关系,其实往高处走,MBA勺课程也是包含这些内容的,所以早学晚学都得学,干脆就提前了解吧,请查看以下内容。在使用之前,首先得安装Excel的数据分析功能,默认情况下,Excel是没有安装这个扩展功能的, 安装如下所示:1)鼠标悬浮在Ofice按钮上,然后点击【Excel选项】:2)找到【加载项】,在管理板块选择【Excel加载项】,然后点击【转到】:3)选择【分析工具库】,点击【确定
3、】:4)安装完后,就可以【数据】板块看到【数据分析】功能,如下所示:VP|吗数据分析全部剧新”财选站工具分希安装完后,首先来了解一下回归分析的内容、回归分析在详细进行回归分析之前,首先要理解什么叫回归?实际上,回归这种现象最早由英国生物统计学家 高尔顿在研究父母亲和子女的遗传特性时所发现的 一种有趣的现象:身高这种遗传特性表现出”高个子父母,其后代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发 生回归”。 这种效应被称为”趋中回归”。现在的回归分析则多半指源于高尔顿工作的那样一 整套建立变量间的数量关系模型的方法和程序。 这里的自变量是父母的身高,因变量是子女的身高
4、XX百科对于回归分析的定义是:回归分析(regression analysis)是确定两种或两种以上变数间相 互依赖的定量关系的一种统计分析方法。运用十分广泛:1) 回归分析按照涉及的自变量的多少,可分为一兀回归分析和多兀回归分析;2) 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。这里举个电商的例子:电子商务的转换率是一定的,网站访问数一般正比对应于销售收入,现在要建 立不同访问数情况下对应销售的标准曲线,用来预测搞活动时的销售收入,如下所示:访问数销售额0010010489491010105 152305072040020535100050261006021如电1首
5、先,禾I用散点图描绘图形:住形團 徳图 阱图 案形图面秩團散点塑具悒图表 超卷接销售额销售额2.添加趋势线,并且显示回归分析的公式和 R平方值:销售额y 二 0.1028X - 27.424R3 二 0.3995销售额姿性鹅售刼从图得知,R平方值=0.9995,趋势线趋同于一条直线,公式是:y=0.01028x-27.424R平方值是介于0和1之间的数字,当趋势线的R平方值为1或者接近1时,趋势线最可靠。 因为R2 0.99,所以这是一个线性特征非常明显的数值,说明拟合直线能够以大于 99.99%地解释、涵盖了实际数据,具有很好的一般性,能够起到很好的预测作用。3.使用Excel的数据分析功能
6、1)点击【数据分析】,在弹出的选择框中选择【回归】,然后点击【确定】:2)【X值输入区域】选择访问数的单元格,【丫值输入区域】选择销售额的单元格,同时勾选如下所 示的选项,包括残差、标准残差、残差图、线性拟合图和正态概率图。3)以下内容是残差和标准残差:SUMMARY OUTPUT回归刼Multiple Ra 99980694R Square6 M5S13S17Adjusted R Square0. 856756775标准误差37.30185573规测值8方是分析dfSSUSFSignlfian10的pv,所以用pv来做电子商务 的转换率不合适。&n bsp数据源如下所示:按照以下图例进行设置
7、:设置后,会得到如下所示的图表:(解释是我人为添加的,是对指标的解释)数值平均1.90%电子蔺务转换率的平均值标准误差0.00201896电子闾爭转换率僉H谓呈的平方和闫平均恒E抨方複.又琢为均方 澳差的平方根中位数0.019处于数列中间僅置的值0.018岀现反克懐多的裁0,00781939是各魏据侵离平均数的平均数它是离均差平方和平均后的方根,1 用示,标准差是方差西算术平方根6.1143E-05各个数据与平均数之差的平方的平沟数-0.4960863覺融拒分右起伏吏化的怖.以正态分右为垦准.出臬平農对is 为IE反之为负:偲燮-0.4923336蟹量数据懂值但移的播数.根据峰d左均恒左q或者
8、右咔别为圧丁 軽负值;0,025最大值与最少值的差最小值0,005最大诣0.03求Ju0,2&5观矚15soansA(1)0.03最小0,005豊唁滾(9 5.0%)0.00433023所谓査信度,也叫畫信水平”它是指特左个o対特左冥例真实性相 信的题二、抽样分析&n bsp抽样分析工具以数据源区域为总体, 从而为数据源创建一个样本。当总体太大而不能进行处理或绘制 时,可以选用具有代表性的样本。&n bsp举个例子:假设这样一种情况,要抽查电子商务转换率的情况是否正常。&n bsp数据源如下所示:按照以下图例进行设置,注意是抽 8个样本:设置后,会得到如下所示的图表:抽样结果10701. 90ft10392. 80%loiak 90%r id月2曰0, 50%M月E曰L 90%101101.3CWtID月14日2. 30%M月阳k 90%三、直方图&n bsp直方图是最适合描述数据在不同选定区间分布情况的图表&n bsp数据源如下所示:按照以下图例进行设置:设置后,会得到数据和图表:数抿阶梯频率累积%数据阶梯频率累积筑000 . 00%60006io, cm20000
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1