联机分析处理技术实验报告.docx
《联机分析处理技术实验报告.docx》由会员分享,可在线阅读,更多相关《联机分析处理技术实验报告.docx(12页珍藏版)》请在冰豆网上搜索。
联机分析处理技术实验报告
本科生实验报告
(一)
姓名:
学院:
专业:
计算机科学与技术
班级:
实验课程名称:
数据仓库与数据挖掘
实验日期:
2015年4月2日
开课时间:
2014-2015学年第二学期
甘肃政法学院实验管理中心印制
实验题目
联机分析处理技术
小组合作
无
姓名
班级
学号
一、实验目的
1.学习并掌握AnalysisServices的操作,加深理解数据仓库中涉及的一些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机分析处理等。
二.实验环境
一台装有MICROSOFTSQLserver的计算机
三、实验内容与步骤
在实验之前,先通读自学SQLSERVER自带的AnalysisManager概念与教程。
按照自学教程的步骤,完成对FoodMart数据源的联机分析。
建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析数据。
四、实验过程与分析
1、启动联机分析管理器:
开始->程序->MicrosoftSQLServer->AnalysisManager。
2、按照AnalysisService的自学教程完成对FoodMart数据源的联机分析。
3、在开始-设置-控制面板-管理工具-数据源(ODBC),数据源管理器中设置和源数据的连接,“数据源名”为你的班级+学号+姓名,如T3730101张雨。
(1)打开管理工具中的数据源:
(2)选择系统DNS
(3)建立名为“………….”的数据源
(4)添加,选择“MicrosoftAccess驱动程序(*.mdb)”,然后单击“完成”按钮
(5)选择数据库
(6)在“ODBCMicrosoftAccess安装”对话框中单击“确定”按钮。
在“ODBC数据源管理器”对话框中单击“确定”按钮。
4、在开始-设置-控制面板-管理工具-服务-MSSQLServerOLAPService,启动该项服务。
在AnalysisManager中,单击服务器名称,即可建立与AnalysisServers的连接;否则,在AnalysisServers上单击右键,注册服务器,在服务器名称中输入本地计算机的名字,如pc56。
本地计算机的名字可右击:
我的电脑,选择属性,网络标志,里面有本地计算机的名字。
建立新的数据库,数据库名与数据源名相同,如T3730101张雨。
在你所建立的数据库中,单击“新数据源”,和早期在ODBC数据源管理器中建立的数据源连接。
(1)启动MSSQLServerOLAPService服务
(2)注册服务器
(3)建立名为“………”的新数据库
(4)建立数据源
5、假设你是FoodMartCorporation的数据库管理员。
FoodMart是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。
市场部想要按产品和顾客分析1998年进行的所有销售业务数据。
要求建立Sales多维数据集,多维数据集是由维度和事实定义的。
其维度有“Time”维度、“Product”维度、“Customer”维度、“Store”维度和“Promotion”维度,事实表为sales_fact_1998,事实表中的度量为:
store_sales、store_cost、unit_sales。
理解每个维度的级别。
(1)“Time”维度
(2)Product维度
(3)“Customer”维度
(4)“Store”维度
(5)“Promotion”维度
6、可以使用多维数据集编辑器对现有多维数据集进行更改。
在使用或浏览多维数据集中的数据之前,要求设计多维数据集中的数据和聚合的存储选项。
即设计好Sales多维数据集的结构之后,需要选择要使用的存储模式并指定要存储的预先计算好的值的数量。
完成此项操作之后,需要用数据填充多维数据集。
这里选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后处理该多维数据集。
处理Sales多维数据集时将从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。
7、使用多维数据集浏览器,可以用不同的方式查看数据:
可以筛选出可见的维度数据量,可以深化以看到数据的细节,还可以浅化以看到较为概括的数据。
这里可以使用多维数据集浏览器对Sales数据进行切片和切块操作。
要求理解OLAP操作下数据的含义,从而可以分析数据。
8、人力资源部想按商店来分析雇员的工资。
本节将建立一个HR(人力资源)多维数据集,以进行雇员工资分析。
将把Employee(雇员)维度创建为父子维度。
然后使用该维度以及常规维度来生成HR多维数据集。
其中,事实数据表为salary(工资),维度为Employee(雇员)、Store(商店)、Time(时间)。
了解如何建立父子维度。
9、建立计算成员和成员属性。
在Sales多维数据集中建立“Averageprice”计算成员,思考建立该计算成员的目的。
市场部希望将Sales多维数据集分析功能扩展到根据客户的下列特征分析客户销售数据:
性别、婚姻状况、教育程度、年收入、在家子女数和会员卡。
需要向Customer维度添加以下六个成员属性:
Gender(性别)、Maritalstatus(婚姻状况)、Education(教育程度)、YearlyIncome(年收入)、NumChildrenAtHome(在家子女数)和MemberCard(会员卡)。
这些成员属性将限制Customer维度中的每个成员。
理解什么是计算成员和成员属性,为什么要建立?
10、已经为客户维度添加了六个成员属性,可以创建一个带有YearlyIncome(年收入)成员属性的虚拟维度,然后将这个新创建的维度添加到Sales多维数据集中。
使用虚拟维度,可以基于多维数据集中的维度成员的成员属性对多维数据集数据进行分析。
其优点是不占用磁盘空间或处理时间。
(1)为客户维度添加属性
(2)创建YearlyIncome虚拟维度
11、理解多维数据集角色和数据库角色的联系和区别、建立角色的目的。
(1)在sales中创建marketing角色
(2)在HR中创建HR角色
五、实验总结
1.实验过程中,我们可以对于一些特定的数据,通过事实数据表的选取和纬度的建立构建多维数据集,从而建立总体分析模型,然后从多个角度对数据进行分析。
多维联机分析处理不仅体现一种先进的技术和方法,更体现了一种思维方式。
可以将很抽象且没有联系的数据进行处理,从多种角度对原始数据中转化出来,得出一些具有关联且反应真实情况的实用数据。
2.OLAP利用存储在数据仓库中的数据完成各种分析操作,并一直观易懂的形式将分析结果返回给决策分析人员。