ImageVerifierCode 换一换
格式:DOCX , 页数:116 ,大小:5.52MB ,
资源ID:9410102      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9410102.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据分析实验报告册柯鸿.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据分析实验报告册柯鸿.docx

1、数据分析实验报告册柯鸿 数据分析实验报告册20 14 - 20 15 学年 第 一 学期班 级: T1253-4 学 号: 20120530403姓 名: 刘志涛 授课教师: 况湘玲 实验教师:况湘玲 实验学时: 20 实验组号: 信息管理系实验一网上书店的数据库创建及其查询 实验 1-1 “响当当”网上书店的数据库创建 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验1-3 “响当当”网上书店会员分布和图书销售查询实验二 企业销售数据的分类汇总分析 实验2-1 Northwind公司客户特征分析 实验2-2 “北风”贸易公司销售业绩观测板实验三 餐饮公司经营数据时间序列预测 实验

2、3-1 “美食佳”公司半成品年销售量预测 实验3-2 “美食佳”公司月管理费预测 实验3-3 “美食佳”华东分公司销售额趋势预测 实验3-4 “美食佳”公司会员卡发行量趋势预测 实验3-5 “美食佳”火锅连锁店原料年度采购成本预测实验四 住房建筑许可证数量的回归分析 实验4-1 “家家有房”公司建筑许可证一元线性回归分析 实验4-2 “家家有房”公司建筑许可证一元非线性回归分析 实验4-3 “家家有房”公司建筑许可证多元线性回归分析 实验4-4 “家家有房”公司建筑许可证多元非线性回归分析实验五 手机用户消费习惯聚类分析实验六 新产品价格敏感度测试模型分析实验七 品牌知觉图分析实验一网上书店的

3、数据库创建及其查询实验 1-1 “响当当”网上书店的数据库创建 实验类型:验证性 实验学时:2实验目的:理解数据库的概念;理解关系(二维表)的概念以及关系数据库中数据的组织方式;了解数据库创建方法。 实验步骤:1.创建空数据库“xddbookstore”:执行“文件/新建”命令,在屏幕右边单击其中的“空数据库”,在接着出现的 “文件新建数据库”对话框中规定好文件名和存放该文件的适当的文件夹,然后单击“创建”按钮,于是一个名为“xddbookstore”的“数据库”窗口就会出现在屏幕上 数据库窗口2.数据库中表结构的定义:执行“对象/表”命令,双击“使用设计器创建表”,打开“设计”视图。在“设计

4、”视图中进行相应数据的设置,最后得到如下图的结果,设置完后单击工具栏上的保存按钮()或文件菜单的保存命令,对设置进行了保存。再用同样的方法设置其他表的定义。 设计视图 书表的定义结果图 另存为对话框 定义所有表后的数据库窗口3.“响当当”数据库中表之间联系的建立:单击“工具”菜单的“关系”命令,出现“显示表”对话框,分别选择其中的每个表并按“添加”按钮,直到将所有表添加到“显示表”对话框后面的“关系”窗口中。以会员表和订单表为例,单击“会员”表中用于联系的“会员号”字段,然后按住鼠标左键拖动鼠标,将随后出现的一个小矩形块拖动到“订单”表的“收货人”字段上,松开鼠标,出现“编辑关系”对话框,选中

5、其中的“实施参照完整性”复选框,单击“创建”按钮即可在这两个表之间建立联系,“会员”表和“订单”表之间的连线代表了它们间的联系。使用同样的方法,建立“xddbookstore”数据库的七个表间的所有联系。 显示表对话框 添加到关系窗口的结果 编辑关系窗口 xddbookstore数据库七个表间的联系4.数据的输入:以付款方式表的输入为例,右击“付款方式”,打开付款方式的输入窗口,的“数据表”视图中逐行输入付款方式表的各个记录,数据输入完毕,关闭该“数据表”视图,access便会将所输入的数据自动加以保存。其他表的数据可以用相同方法进行输入,也可用导入数据的方法进行数据的导入。单击文件菜单的“获

6、取外部数据/导入”命令,出现 “导入”对话框。单击要导入的文件“xddbookstore.xls”,然后单击“导入”按钮,出现导入数据表向导对话框,按照步骤进行相应的操作。 未输入任何数据时付款方式表的数据表视图 输入数据后的付款方式表 导入对话框 选择订单表导入订单表的数据 选择“包含列标题” 导入数据表向导对话框之三 导入数据表向导对话框之四 导入数据表向导对话框之五 导入数据后的订单表实验小结: 数据库就是存放在计算机中的、以一种合理的方法组织起来的、与公司或组织的业务活动和组织结构相对应的各种相关数据的集合,该集合中的数据可以为公司的各级经过授权的用户和信息系统所共享。关系数据库是由一

7、系列的表组成的,一般情况下,每个表都具有一个主键,通过这些主键,数据库的表与表之间可以建立各种联系.选中主键所在行,单机主键符号就可以建立一个主键。实验思考:1、什么是表的主键?在同一个表中,记录的主键值是否可以相等?答:在一个表中,存在着其值唯一确定一个记录的属性或属性组,这样的属性(或属性组)称为表的主键。在同一个表中,记录的主键值是不可以相等,因为同一表中每个记录的主键是唯一的。2、在数据库中各表之间的联系建立后,将外部数据导入到表中的过程中可能会遇到什么问题?答:有时由于数据库中设计表的字段名称、数据类型和字段大小等属性与要导入的Excel表的属性存在误差,相关属性不对应,致使数据导入

8、不了。解决方案是检查数据库中表的属性并加以改正。若数据库的各表之间建立了联系且实施了参照完整性的话,应先导入父表数据,再导入子表数据,否则导入操作也会出错,系统会提示用户参照完整性被违反了。导入的外部文件中主键的值应惟一,否则导入操作也会出错,主键值重复的记录会丢失,解决方案是检查主键设置并加以改正。 实验1-2 “响当当”网上书店库存、图书和会员信息查询实验目的理解odbc的概念;掌握利用microsoft query进行数据查询的方法。 实验步骤:1.建立odbc数据源:启动microsoft office query应用程序,在microsoft office query应用程序窗口中,

9、执行“文件/新建”命令,出现 “选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。 选择数据源对话框 创建新数据源窗口 做图上所示的选择 odbc microsoft access安装对话框 选择数据库对话框 选择数据源对话框2.查询设计1低库存量图书信息查询:选择“bookstore”数据源,点击“确定”,进入“添加表”窗口,添加书表后,在“查询设计”窗口的“表”窗格中,分别双击“书”表中需要查询的“书名”、“isbn”、“库存量”等字段,执行“视图/条件”命令,在“条件”窗格的“条件字段”行的第一列中选择“库存量”,并在下一行中输入“=2005-7-1

10、 and =2006-6-30”后回车,即可在“查询结果”窗格中显示2005上半年和2006下半年的图书总订购量和总销售金额。此时,若想了解各月份的图书总订购量和总销售金额,只要再查询设计窗口中增加一个“订购月份”分类字段即可 增加了订购月份后的查询结果 排序对话框3.查询设计3会员订购图书详细信息查询:添加“会员”、“订单”、“订单明细”和“书”表,在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”、“会员号”、“姓名”字段,“订单”表的“订单号”字段、“书”表的“书名”字段和“订单明细”表的“订购数量”字段。选择“记录”菜单的“排序”命令,在随后出现的“排序

11、”对话框中设置排序方式 查询结果共84条记录4.查询设计4各城市会员图书订购数量和销售金额统计:添加“会员”、“订单”、“订单明细”和“书”表,在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”、“订单明细”表的“订购数量”字段。分别双击“订购数量”和“订购数量*单价”字段的列标,在编辑列对话框的列标项中分别输入“总订购数量”和“总销售金额”字样,并在总计项中选择“求和”。按“确定”按钮后即可查看结果。5.查询设计5被订购图书的作者和出版社信息查询:添加“会员”、“订单”、“订单明细”、“书”、“作者”和“出版社”表。在表之间建立合适的联系。在“查询设计”窗口的

12、“表”窗格中,双击“书”表的“书名”、“作者”表的“姓名”和“出版社”表的“出版社名称”字段。在条件窗格中添加关于订购日期和会员姓名的条件。可以查看到结果为会员“刘丹”在2007年共订购了7本图书。实验小结: 单表查询仅涉及一个表的查询操作,在查询时将要查询的字段输入“条件|”窗口,或者添加条件就可以得到查询结果。多表查询须了解两个问题:查询中使用到的各个字段分别来自于哪些表。分析查询所涉及的表与表之间存在着何种联系,这些联系是通过哪些字段建立起来的。先建立起多个表直接的联系,再进行查询。实验思考:1、在进行汇总查询的过程中,如果被选择的字段除了分类字段以外还包含了其他字段。查询结果是否正确?

13、为什么?请举例说明。答:不正确,如果被选择的字段除了分类字段以外还包含了其他字段,那么query将把多余的字段自动作为分类字段。例如:只有分类字段:订单号和汇总字段:订购日期是情况包含其他字段是的情况:2、“响当当”网上书店的管理人员想了解最近2年中那位作者的书是最畅销,请你设计一个查询找到相关作者。答:如图所示:通过分析可知最近2年中wellin,paul的书是最畅销实验二 企业销售数据的分类汇总分析实验2-1 North wind公司客户特征分析实验类型:验证性 实验学时:2实验目的: 理解数据分类汇总在企业中的作用与意义; 掌握数据透视表工具的基本分类汇总功能; 掌握建立分类汇总数据排行

14、榜、生成时间序列、绘制praetor曲线图、计算各地区客户分布、统计各地区客户的平均销售额和大宗销售时间序列的方法和步骤。实验步骤:一、汇总客户销售额排行榜为了汇总客户销售额的排行榜,首先要获得客户每笔销售的销售额、所购买产品的类别以及销售发生的时间,然后再利用数据透视表工具将销售额按照客户名称、产品类别和销售时间加以汇总。步骤1:获取各客户每笔销售的销售额、销售产品的类别和时间。在一张空白的工作表中,选择菜单“数据”“数据透视表和数据透视图” “外部数据源”,单击“获取数据按钮”,随后启动了Microsoft Query,选择所建立的连接到Northwind.mdb数据库的ODBC数据源“N

15、W”,并选择“确定”,选择“客户”表中的的“公司名称”、“订单”表中的“订购日期”、以及“类别”表中“类别名称”,随后Query弹出窗口“查询向导无法继续,因为该表格无法链接到您的查询中。您必须在Microsoft Query 中的表格之间拖动字段,人工链接。”这是因为类别表无法同订单表建立联系。单击“确定”。要查询销售额,需要在Query中首先增加“订单明细”表,利用其中的“单价”、“数量”与“折扣”字段中的数据,才能计算销售额。在数据窗格中,在一个空白字段的名称处输入公式:“订单明细.单价*数量*(1-折扣)”。键入回车后就可以计算出销售额。见图2-7。随后,将“产品”表也添加到查询中,虽

16、然查询结果中并不包括任何“产品”表中的字段,但是该表的能够建立“类别”表与“订单明细”表之间的联系(“订单明细”表指明所订购产品的ID,“产品”表指明该产品属于哪一个类别)。此时,查询中的表都建立了正确的联系,并在查询结果中包括了汇总所需要的数据。如图2-7。 图2-7 查询各客户每笔销售的销售额、销售产品的类别和时间将计算销售额的字段的列标命名为“销售额”。选择Query菜单中的“文件”“将数据返回Microsoft Office Excel” ,此时Query已经关闭,我们的操作对象回到了Excel,单击“下一步”,指定位置在“现有工作表”,单元格A3,单击完成。步骤2:汇总客户销售额排行

17、榜,并排序。 此时,在工作表的区域A1:G16的位置,出现了数据透视表的框架,数据透视表的浮动工具栏和数据透视表的字段列表。为了能对销售的时间“订购日期”进行组合以获得各年的销售额,首先将“订购日期”拖至行域,将“销售额”拖至数据域,“类别名称”拖至列域,得到如图2- 8所示的数据透视表。图2-8 按订购日期与类别汇总销售额为了能将销售额按照年度汇总,将光标停留在“订购日期”下方的任何单元格,右击鼠标,选择“组合及显示明细数据”“组合”,选择组合的步长为年。然后将单元格A4当中的字段名称“订购日期”改为“订购年”,将它推至页域,将字段列表中的“公司名称”拖到行域,让透视表按照列总计,从大到小排

18、列,就得到了如图2-9所示的数据透视表。它能够反映了三年或者各年度,各个客户的销售额的大小,以及排列名词的先后,还能够观察到各客户订购的产品类别和该类别的销售额。图2-9 按照订购年、客户公司名称、类别名称汇总的销售额排行榜二、汇总前三大客户各月销售额,并绘制图形在前一部分实验的基础上,选择前三个最重要的客户,进一步观察购买情况,他们购买情况的变化将对公司整体销售业绩产生很大影响。所以,将前三大客户的销售数据加以展开,按月显示其销售的变化。步骤1:将实验要求1所汇总的数据透视表复制到新的工作表。步骤2:利用数据透视表,汇总前三大客户的销售额时间序列。 按照实验要求1汇总的数据透视表,反映出“高

19、上补习班、 正人资源、 大钰贸易”是公司的前三大客户。点开“公司名称”字段,选中这三个公司名称,并拖到列域。将列域的字段“类别名称”拖出数据透视表。将页域的字段“订购年”旋转到行域,将其重新组合。选择组合的步长为“月”和“年”,把字段名称修改为“订购年”与“订购月”。光标停留在数据表中任何单元格,右击鼠标,选择“表格选项”,将“对于空数据项显示”设置为“0”,即当该单元格汇总出的数据值为空时,在数据透视表中将其显示为0。此时得到的前三大客户销售额时间序列见图2-10。图2-10 Northwind公司前三大客户销售额时间序列步骤3:绘制前三大客户销售额时间序列图。 光标停留在数据透视表中,选择

20、菜单“插入”“图表”,在当前工作簿自动插入一张图表。选择菜单“图表”“位置”,将该图表调整到与数据透视表位于同一张工作表。选择菜单“图表”“图表类型”,选择“折线图”“数据点折线图”。随后,再对该图的大小、外观以及数据系列的格式加以调整,就能得到Northwind公司前三大客户销售额时间序列图,如图2-1所示。三、绘制按照客户汇总的客户数与销售额帕累托曲线1897年,意大利经济学家帕累托(Vilfredo Pareto,18481923)提出,在意大利,80的财富为20的人所拥有,并且这种经济趋势存在普遍性。这就是80/20法则,又被称作80/20原理、帕累托法则或帕累托定律。后来人们发现,在

21、社会生活中有许多现象都符合该法则。80/20法则说明,原因和结果、投入和产出,以及努力和报酬之间,本来就是不平衡的。80/20法则为这种不平衡现象提供了一个指标:80%的产出来自于20%的投入;80%的结果归结于20%的起因;80%的成绩归功于20%的努力。在商业世界和人们的日常生活中,呈现出许多80/20法则现象:20%的产品和20%的客户,涵盖企业80%的营业额;20%的产品和客户,实现企业80%的利润;20%的罪犯,施行80%的罪行;20%的驾驶员,引起80%的交通事故;20%的孩子,达到80%的教育水平;在家中,20%的地毯面积可能有80%的磨损;80%的时间里,所穿的衣服是所有衣服的

22、20%;80%的能源浪费在燃烧上,只有20%的可以传送给车辆。Northwind公司希望按照80/20法则对销售进行分析。他们要求:按年汇总客户数与客户销售额,计算客户销售额累计百分比与客户数累计百分比,绘制客户数与客户销售额的帕累托曲线,利用图形,分析公司主要客户销售情况,即20%的客户,有没有实现公司80%的销售额。步骤1:查询“订购日期”、客户的“公司名称”与“销售额”等数据。在Excel的空白工作表中,选择菜单“数据”“数据透视表与数据透视图” “外部数据源”“获取数据”,利用Microsoft Query,从“订单”表、“订单明细”表与“客户”表中查询 “订购日期”、客户的“公司名称

23、”与“销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将所查询数据返回Excel。步骤2:利用查询的数据,制作数据透视表。 从数据透视表的字段列表中,选择“订购日期”,拖至行域,将“销售额”拖至数据域。将“订购日期”字段按年组合,然后拖至页域,将“公司名称”拖至行域,按照销售额从大到小的顺序排列,得到按照年度和客户公司名称汇总的数据透视表,如图2-11。图2-11 Northwind公司按照年度汇总的各客户销售额步骤3:利用数据透视表的数据,计算客户数累计百分比与客户销售额累计百分比,绘制帕累托曲线。在区域D4:G4依次输入说明文字,“公司名称”、“ 客户百分比”、“ 客户数累计

24、百分比 ”、“销售额累积百分比”。按照图2-12输入公式,得到如图2-13所示的汇总数据。图2-12 Northwind公司按照年度汇总客户数累计百分比和销售额累计百分比公式图2-13 Northwind公司按照年度汇总客户数累计百分比和销售额累计百分比区域F5:F93汇总累计的客户数,即到该客户为止,已有客户数占到总客户数的百分比。区域G5:G93汇总了到该客户为止,已有客户实现的销售额占总销售额的百分比。选中区域F4:G93的数据,绘制无数据点散点图,得到如图2-14所示图形。图2-14 客户数与销售额的帕累托初步曲线步骤4:在曲线上添加代表20%客户数的垂直参考线。在I5:I7单元格输入

25、“20%”,在J5与J7单元格输入“0”和“120%”,在J6单元格输入公式:“=INDEX(G5:G93,MATCH(I5,F5:F93,1),1)”,即从客户数累计百分比中,查找到20%的客户数在第几行,然后用INDEX函数查找,该行对应的销售额累计百分比,计算结果如图2-15。在前面所绘制的图表上,添加一条垂直参考线。该参考线的X轴数据来自区域I5:I7,Y轴数据来自区域J5:J7,得到如图2-2所示的帕累托曲线。该曲线反映出,Northwind公司20%的客户只实现了59%的销售额,低于20/80准则的比例。通过在数据透视表中调整页域的值,可以发现:96年、97年比例都不足58%,98

26、年有所增长,达到了63%,还是远低于80%。因此, Northwind公司今后销售工作的重点应是更多地关注大客户,通过增加大客户的销售额来增加整个公司的销售额。图2-15 Northwind公司客户数与销售额帕累托曲线垂直参考线数据最后公司客户销售额与客户数parato曲线呈现如图所示:图2-2 公司客户销售额与客户数parato曲线四、绘制按照订单汇总的销售额与销售次数帕累托曲线Northwind公司希望按照订单汇总销售次数与销售额,计算各订单的累计销售额和累计销售次数,绘制帕累托曲线,如图2-3。利用图形分析,20%次的销售(20%的订单)是否实现80%的销售额。步骤1:查询“订购日期”、

27、“订单ID”与“销售额”等数据。在Excel的空白工作表中,选择菜单“数据”“数据透视表与数据透视图” “外部数据源”“获取数据”,利用Microsoft Query,从“订单”表和“订单明细”表中查询 “订购日期”、“订单ID”与“销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将查询数据返回Excel。步骤2:利用查询的数据,制作数据透视表。 从数据透视表的字段列表中,选择“订购日期”,拖至行域,将“销售额”拖至数据域。将“订购日期”字段按年组合,拖至页域,将“订单ID”拖至行域,按照销售额从大到小的顺序排列,得到按照年度和订单ID汇总的数据透视表,如图2-16。图2-16 Northwind公司按照年度汇总各订单销售额步骤3:利用数据透视表的数据,计算客户数累计

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1