ImageVerifierCode 换一换
格式:PPTX , 页数:40 ,大小:2.21MB ,
资源ID:2495232      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2495232.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(深层次会计数据分析方法培训PPT.pptx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

深层次会计数据分析方法培训PPT.pptx

1、数据分析方法培训 目录数据分析前的思考案例分享深层次数据分析数据分析前,我们需要思考3 孙子兵法谋攻篇:故上兵伐谋,其次伐交,其次伐兵,其下攻城;攻城之法为不得已。像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。问题分析结果呈现分析思路与方法数据选取数据分析前,我们怎么去思考?每一个步骤可能面临的问题以及需要准备的东西?4 选取的分析软件以及分析方法(统计学相关方法)。分析问题和解决问题的思路5 定义问题第一步 首先,要搞清问题的实质,准确、完整、真实地表达问题。其次,弄清楚为什么要解决这个问题?最后,解决这个问题的意义何在?是必须

2、解决还是无关紧要,或是需要马上解决还是不太着急。第二步收集整理信息 搜集、整理关于要解决问题的历史资料、类似情况和现状。第三步选取分析方法 分析涉及到的主要维度,为后面提取数据需求作准备;第四步数据提取整理 根据分析内容以及分析方法,提出分析所需的数据需求;对于反馈回来的数据,需要进行部分加工,以便更能反应所要分析的问题。第五步分析结果及结论 根据分析的结果,得出一些当前问题产生的一些结论。这里注意分析的方法以及维度,结果的展示方式等。结论需要求足够的数据做支撑。第六步实施及建议措施 针对数据分析结论,给出当前问题的解决建议措施。一方面从业务层面进行建议措施,另一方面,可以就问题点进行更深层次

3、分析,给出数据挖掘层面的解决措施。第七步实施效果评估及报告整理 根据措施实施效果进行实际评估,将完成的分析过程,结果以及评估整理报告,为以后出现问题提供经验教训。对于本次没有完全解决的问题,进行说明。例如,从现有的报表数据中就能够看到当前问题点的数据情况或者一段时间的趋势;两个重点步骤精确的陈述问题Where-哪里存在问题?What-存在的问题是什么?Why-原因在哪里?When-什么时候开始出现这样的问题?Who-与什么对象有关?How many-发生的次数和数量?How much-损失有多大?爱因斯坦说:“精确的陈述问题比解決问题还来得重要”5W2H法:5W:What,When,Where

4、,Who,Why;2H:How及How many;使用这个方法阿根廷队世界杯输球了,如果你是马拉多纳,你怎么去思考?定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理问题展现方式问题现状直接原因最终原因问题的结构如同这座冰山初步的问题分析深层次的问题分析问题结构是由现状、直接原因以及最终原因构成的。针对直接原因进行的叫初步问题分析,针对最终原因进行分析的叫深层次问题分析。7 治标治本定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理问题分解8 问题陈述问题/假设1问题/假设2问题/假设3分支问题分支问题分支

5、问题分支问题分支问题分支问题为什么使用逻辑树?1.将问题分成几个部分使解决问题的工作可以分成智力上能够解决的几个部分不同部分可按轻重缓急区分工作责任能分派到各人2.保证问题获得完整地解决将问题的各个部分解决好,即可解决整个问题所分问题的各个部分各不相同,而且包括了各个方面(即没有重叠没有遗漏)3.使项目小组共同了解解决问题的框架4.协助重点使用组织框架及理论定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理分析方法统计方法的三大特性,用三句话来简单概括一下:反应客观现象的数据描述性统计(包括统计数据的收集、整理、显示和分析)实用性:除了实情,数据能证

6、明一切;丰富性:统计就像比基尼,露出来的部分固然诱人,没露出来的部分才是最要命的;公平性:我们相信上帝,其它人请用数据说话。概率论(包括分布理论、大数定律和中心极限定理)推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)总体内在的数量规律性9 样本数据总体数据定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理描述性统计分析“五点法”:最小值,1/4分位数,均值,3/4分位数,最大值“两度”:峰度,偏度六西格玛:检验统计量的取值空间6 10 定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理21

7、20y-1y-2-2-101-1-20221y0y468负相关相关但非线性相关推断统计分析11 回归分析是统计分析思想中最基础、最集中的一个领域。高斯、高尔顿相关分析&回归分析-3-212(a)-212(b)x-2-1012x-3-2-10123x-1 0不相 x 关(c)-1 0正相关(d)变量的选取;预测推断;P值:回归分析就是放“P”,放得好,就合格。定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理变量分析方法选取对象变量的关系类型因变量自变量预测和解释变量的个数变量的相互关系变量的结构关系多因变量与自变量多因变量与自变量单一变量存在多存在多

8、重关系存在单一关系重关系变量样本因变量测量尺度结构方程式模式数量型非数量型数量型非数量型自变量尺度测量典型相关分析多元方差分析因变量尺度测量多元回归分析结合分析数量型非数量型多元判别分析Logistic回归离散选择模型CHAID因子分析/主成分析聚类分析变量测量尺度数量型非数量型多维尺度分析对应分析一张简单的图胜过千言万语!12 定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理数据挖掘分析13 按挖掘方法分类:包括统计方法,机器学习方法,神经网络方法和数据库方法,其中:统计方法可分为:判别分析(贝叶斯判别、费歇尔判别、非参数判别等),聚类分析(系统

9、聚类、动态聚类等),探索性分析(主成分分析等)等。机器学习方法可分为:归纳学习方法(决策树、规则归纳等),基于范例学习,遗传算法等。神经网络方法可以分为:前向神经网络(BP算法等),自组织神经网络(自组织特征映射、竞争学习等)。数据库方法分为:多为数据分析和OLAP技术,此外还有面向属性的归纳方法。关联规则关联规则反映一个事物与其它事物之间的相互依存性和关联性,如果两个事物或者多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其他事物预测到。Ps:多元统计分析中的聚类分析有个阈值,用于确定分类的一个临界值,平时会遇到把它读成f,误以为它是“阀”字。正确的应该是阈(念y)值,而不是阀值.

10、定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理 网管中心数据 CRM数据 一经数据 第三方调查数据 14 海量的数据eg数据提取时注意的几点问题。经分数据 BOSS数据定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理选取分析所需的相关数据制定数据提取需求15 人口统计 性别 年龄 户藉 职业 婚姻状况 教育程度 收入 客户 办理时间地点 办理的渠道 办理的业务种类 生效和失效时间 购买行为 消费行为 沟通记录 销售概率 帐单信息 分群特征 离网概率 离网原因客户价值高利润率中等利润率低利润率负利润率

11、服务与产品 使用的产品 使用的服务功能 接受的营销offer 享受的客户服务态度形象价值观生活方式心理因素 客户偏好 渠道偏好 联络时间偏好 服务内容偏好帐户信息高级资料 性格和爱好 反感的业务 家庭情况 缴费方式 使用清单 缴费记录行为信息基本资料地址、电话、email、籍贯等语言、行业手机相关信息网络状况业务办理信息行为方式通话时段繁忙和非繁忙通话量漫游服务方便程度行为方式的变化 客户交互信息 客户交互概况 整合的投诉历史 整合的咨询历史 主动联络客户历史客户分析信息注意数据提取粒度定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理数据质量的评估

12、 在现实社会中,存在着大量的“脏”数据 不完整性(数据结构的设计人员、数据采集设备和数据录入人员)缺少感兴趣的属性 感兴趣的属性缺少部分属性值 仅仅包含聚合数据,没有详细数据 噪音数据(采集数据的设备、数据录入人员、数据传输)数据中包含错误的信息 存在着部分偏离期望值的孤立点 不一致性(数据结构的设计人员、数据录入人员)数据结构的不一致性 Label的不一致性 数据值的不一致性业务角度对于数据质量进行初步评估!16 数据类型冲突 性别:string(Male、Female)、Char(M、F)、Interger(0、1)日期:Date、DateTime、String 数据标签冲突:解决同名异义

13、、异名同义 学生成绩、分数 度量单位冲突 学生成绩 百分制:100 0 五分制:A、B、C、D、E 字符表示:优、良、及格、不及格 概念不清 最近交易额:前一个小时、昨天、本周、本月?聚集冲突:根源在于表结构的设计定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理数据质量的评估技术角度进行数据质量评估17 定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理数据的清洗处理主要任务:补充缺失数据识别孤立点,平滑噪音数据处理不一致的数据处理方法:分箱(Binning)的方法:聚类方法:检测并消除异常点线性回归:对

14、不符合回归的数据进行平滑处理人机结合共同检测:由计算机检测可疑的点,然后由用户确认 18 定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理 指标分析与政策分析并重;反应重点问题、实事求是;材料、数据要真实,论据要有说服力。切记分析角度:缺乏分析中心思想或主干线文字表达:“一图二表三文字”逻辑结构:论点、论据、论证19 收集整理 定义问题 信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理怎样将分析的结果呈现出来?定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理分析结果呈现基本

15、原则20 确定表达的主题 使用图形的目的:将思想和观点形象化的表达,加深读者或听众的印象。使用图表时,必须明确通过图表要表达的信息是什么。确定对比关系 同一类别不同项目间的对比 不同类别不同项目间的对比 时间对比:把时间作为项目分类的标准 频率对比:以部分占整体的百分比为项目分类的标准 相关性对比:按照项目之间的函数关系作为项目分类的标准 其他对比:逻辑关系的对比(因果,时间序列)选择图形饼图柱状图百分比柱状图堆积柱状图线形图雷达图面积图点图气泡图矩阵图逻辑图数据分析结果呈现准备工作:如何用图来表示数据?定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告

16、整理定量数据的图表示对于一个定量变量;用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”的一个办法是画直方图(histogram)。定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理x 10000定性数据的图表示定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。丌同页面内容访问量和累计访问量大众化网页单类网页访问次数占比大于10;累积网页访问次数占比达81.05;单类网页访问次数占比510;累积网页访问次数占比达15.41;单类网页访问次数占比小于5;累积网页访问次数占比丌足10;个性化网页小众化网页44.60%81.05%96.42%20%0%40%80%60%100%1003020504060博客娱乐体育游戏女性星座金融笑话音乐彩票搜索微博视频页面访问量累计占比定义问题收集整理信息选取分析方法数据提取整理分析结果及结论实施及建议措施实施效果评估及报告整理常见的分析模式内容决定形式,形式服务于内容,当形式经过实践考验被普遍接受后就固化成一种模式。分析报告的模式主要包括:金字塔式;综合式

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1