ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:855.60KB ,
资源ID:4007616      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4007616.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据仓库与数据挖掘实验指导书样本.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据仓库与数据挖掘实验指导书样本.docx

1、数据仓库与数据挖掘实验指导书样本实验一、DTS使用一、实验目:1、理解MS SQL Server 安装,熟悉MS SQL Server 数据库使用环境2、理解数据库和数据仓库关系,为数据仓库建立数据库3、纯熟使用MS SQL Server DTS,可以将各种数据源数据按照数据仓库设计规定导入到数据仓库二、实验内容:1、熟悉MS SQL Server 数据库和表基本操作。2、为数据仓库建立新数据库Mynorthwind。3、使用DTS导入TXT文本文献到Mynorthwind。4、使用DTS导入Access数据库到Mynorthwind。5、使用DTS导入Excel文献到Mynorthwind。

2、6、使用DTS从Northwind导出Products和Categories两个表到Mynorthwind。7、使用DTS查询导入,从Northwind导出Employees表到Mynorthwind,并将源表中first name和lastname列合成一种列fullname。8、使用DTS查询导入,从Northwind导出Orders表到Mynorthwind为Dates表,并将源表Orders表中OrderDate一列提成年、月、日、周、季五列,同步保存OrderDate一列。9、使用DTS查询导入,从Northwind导出Order Details表到Mynorthwind为Facts

3、表。一方面用Select语句将产品类别编号和员工编号等从各自表中取出,另一方面计算共计列值,计算办法为单价*(1-折扣)*数量,然后将Order Details表内容复制到Facts表各列。三、实验环节:1、启动Microsoft SQL Server“服务管理器”,打开“公司管理器”,在浮现“SQL Server Enterprise Manager”窗口中,单击加号找到数据库,右键选取“新建数据库”,打开对话框如图1.1所示,输入数据库名:Mynorthwind,点击拟定完毕创立。图1.1 “新建数据库”对话框2、在新建Mynorthwind数据库上点击右键,选取“所有任务”“导入数据”,

4、打开“DTS导入/导出向导”对话框,如图1.2所示。图1.2 “DTS导入/导出向导”对话框3、点击图1.2对话框中“下一步”,打开新对话框如图1.3所示。依照导入数据源不同格式在对话框下拉菜单中选取不同“数据源”,如:“文本文献”、“Microsoft Access”或“Microsoft Excel 97-”等。选定“数据源”后,点击“文献名”文本框后相应“.”按钮,选取需要导入文献,点击“下一步”,保持默认设立不变直到最后完毕导入。图1.3 “选取数据源”对话框4、在图1.3中选定“数据源”为“用于SQL ServerMicrosoft OLE DB提供程序”,在“数据库”下拉菜单中选取

5、源数据库为“Northwind”,点击“下一步”,拟定目“数据库”为“Mynorthwind”,点击“下一步”。对于简朴表格导出/导入操作,选取“从源数据库复制表和视图”,并按提示完毕导出/导入。对于查询导入选取“用一条查询指定要传播数据”,打开新对话框如图1.4所示,输入需要实现查询命令。图1.4 查询导出/导入对话框四、注意事项:1、观测数据库中数据字典形式。2、导入TXT文献时,中文输入法输入符号不能作为分隔符使用。五、思考与练习:1、数据仓库与数据库关系。 2、向数据仓库导入数据时候将日期分为年、月、日、季作用是什么? 实验二、数据备份还原和OLAP数据源建立一、实验目:1、熟悉Ana

6、lysis Service使用环境2、掌握数据仓库备份和还原操作,可觉得Analysis ServiceOLAP分析建立数据库和数据源二、实验内容:1、安装Analysis Service组件,熟悉Analysis Service包括基本内容和操作环境2、还原实验用数据库insur,熟悉数据库表构造和数据记录3、在Analysis Service中建立新分析数据库人寿保险实验,把insur设为数据源4、在Analysis Service中浏览人寿保险实验元数据和多维数据5、在Analysis Service中备份人寿保险实验为d:myinsur.cab6、删除既有人寿保险实验,还原备份数据库为

7、人寿保险实验三、实验环节:1、启动Microsoft SQL Server“服务管理器”,打开“公司管理器”,在浮现“SQL Server Enterprise Manager”窗口中,单击加号找到数据库,右键选取“所有任务”“还原数据库”,打开对话框如图2.1所示,输入“还原为数据库”名称为“insur”,选取“从设备”还原。图2.1 “还原数据库”对话框2、点击“选取设备”在弹出对话框中选取“添加”,在弹出对话框中查找相应数据库备份文献“insur”,拟定后返回到图2.1对话框,点击“选项”选项卡打开对话框如图2.2 所示。选中“在既有数据库上强制还原”,修改“移至物理文献名”内容为本地计

8、算机上对的途径,点击拟定完毕还原,还原后浏览“insur”数据库中表,理解表用途和表之间关系。图2.2 “还原数据库”对话框3、启动“Analysis Manager”,如图2.3所示。图2.3 打开“Analysis Manager”4、在“服务管理器”图标上点击右键选取“新建数据库”,打开对话框输入数据库名称为“人寿保险实验”,完毕分析数据库创立。点击打开新建数据库,在“数据源”上点击右键选取“新数据源”打开“数据链接属性”对话框,选取但愿连接数据为“Microsoft OLE DB Provider for SQL Server”,点击“下一步”打开对话框如图2.4所示,分别点击下拉菜单

9、选取相应服务器名称和服务器上数据库名称,点击拟定完毕数据源连接。图2.4 “连接数据源”对话框5、点击“数据源”相应“元数据”选项卡,查看元数据格式和内容。当前数据库意外丢失,或在公共环境下上机无法正常存档需要备份和还原分析数据库。在“人寿保险实验”上点击右键选取“将数据库存档”,打开对话框如图2.5所示。设立本地计算机适当保存途径,生成备份文献为“人寿保险实验.CAB”,既有数据库删除后可以还原此数据库。图2.5 备份数据库对话框四、注意事项:1、备份数据库时要注意途径选取。2、Analysis Service中无法浏览数据话安装Microsoft SQL Server补丁软件SP4。3、S

10、ql Server 中还原数据库时注意选取从设备还原,找到备份途径,设定还原后途径。五、思考与练习:1、Sql Server 中数据库与“设立聚合选项”对话框Analysis Service中数据库区别。实验三、维度创立一、实验目:1、理解维度基本概念2、掌握时间维度、原则维度等维度创立办法 二、实验内容:1、选取数据库中“保单”表中“时间”属性,建立“时间”维度,分为:年、季度、月、日四个层次2、选取数据库中“收付费类型明细”表,选取“收付费”,建立单一层次原则维度“收付费类型” 3、选取数据库中“投保人类型险种分类”表,建立多层次原则维度“险种_投保人类型分类”,涉及:投保人类型、险种名称

11、两个层次(注意层次先后关系)4、选取数据库中“机构区域分类”、“机构细分”、“机构业务员”表,选取“区域分类”、“机构名称”、“业务员名称”,建立多重关系型原则维度“区域_机构_业务员”(注意:维度向导中选取是雪花架构)5、编辑建立维度,在“收付费类型”维度中添加两个层次:收付费归并类型、收付费明细类型表达三、实验环节:1、创立“时间”维度(1)在“Analysis Manager”窗口中点击“人寿保险实验”左边加号,在列表项中“共享维度”上点击右键选取“新建维度”,选取“向导”,点击“下一步”打开“选取维度创立方式”对话框,如图3.1所示。图3.1 “选取维度创立方式”对话框(2)选取默认“

12、星型架构”,点击“下一步”浮现“选取维度表”对话框,在“可用表”中选取“保单”,相应可以看到字段信息和“浏览数据”,如图3.2所示。图3.2 “选取维度表”对话框(3)点击“下一步”,打开“选取维度类型”对话框,选取“时间维度”,在下拉菜单中选取“时间列”为“时间”,如图3.3所示。图3.3 “选取维度类型”对话框(4)点击“下一步”,弹出“创立时间维度级别”对话框,选取时间级别为“年、季度、月、日”,如图3.4所示。图3.4 “创立时间维度级别”对话框(5)点击“下一步”保持“选取高档选项”默认设立,点击“下一步”,打开“完毕”对话框,在“维度名称”中输入“时间”,可以同步看到“时间”维度层

13、次数据,如图3.5所示,点击“完毕”创立。图3.5 “完毕”对话框2、建立“收付费类型”维度(1)与上面建立“时间”维度环节类似,将3.2图中选取表改为“收付费类型明细”,点击“下一步”,打开“选取维度级别”对话框,选取“维度级别”为“收付费”,如图3.6所示。图3.6 “选取维度级别”对话框(2)点击“下一步”保持“指定成员键列”默认设立,点击“下一步”保持“选取高档选项”默认设立,点击“下一步”打开“完毕”对话框,在“维度名称”中输入“收付费类型” ,点击“完毕”创立。3、建立多层次原则维度“险种_投保人类型分类”(1)与上面建立“时间”维度环节类似,将3.2图中选取表改为“投保人类型险种

14、分类”,点击“下一步”,打开“选取维度级别”对话框,依次选取“维度级别”为“投保人类型”和“险种名称”两个层次,如图3.7所示。图3.7 “选取维度级别”对话框(2)点击“下一步”保持“指定成员键列”默认设立,点击“下一步”保持“选取高档选项”默认设立,点击“下一步”打开“完毕”对话框,在“维度名称”中输入“险种_投保人类型分类”,点击“完毕”创立。4、建立多重关系型原则维度“区域_机构_业务员”(1)在图3.1中选取“雪花架构:各种有关维度表”,点击“下一步”,在图3.2 中选取“机构区域分类”、“机构细分”、“业务员”三个表,点击“下一步”打开“创立和编辑联接”对话框,如图3.8所示。图3

15、.8 “创立和编辑联接”对话框(2)点击“下一步”,打开“选取维度级别”对话框,依次选取维度字段“区域分类”、“机构名称”、“业务员名称”,如图3.9所示。图3.9 “选取维度级别”对话框(3)点击“下一步”保持“指定成员键列”默认设立,点击“下一步”保持“选取高档选项”默认设立,点击“下一步”打开“完毕”对话框,在“维度名称”中输入“区域_机构_业务员”,点击“完毕”创立。5、编辑建立维度(1)在“收付费类型”维度上点击右键选取“编辑”,打开“维度编辑器”,在“收付费”上点击右键选取“新建级别”,如图3.10所示。图3.10 “维度编辑器”窗口(2)在弹出“插入级别”对话框中依次选取“收付费

16、归并类型”、“收付费明细类型表达”,点击拟定完毕编辑。四、注意事项:1、一方面熟悉insur数据库中表,理解各个表用途和互相之间联系。2、建立多重原则维度时注意维度显示,可以拖动维度以便对的显示连接关系。五、思考与练习:1、观测维度数据,理解维度原理和作用。2、维度与否可以随时添加。实验四、多维数据集创立一、实验目:1、理解多维数据集基本概念2、掌握基本多维数据集建立和编辑过程二、实验内容:1、建立“保单数据分析”多维数据集2、加入“时间”、“收付费类型”、“险种_投保人类型分类”、“区域_机构_业务员”维度3、插入“中间表”,连接事实表和各维度表4、保存并解决多维数据集三、实验环节:1、在“

17、人寿保险实验”中右键点击“多维数据集”,选取“新建多维数据集”“向导”,打开“多维数据集向导”对话框,选取事实表为“保单”,如图4.1所示。图4.1 “多维数据集向导”对话框2、点击“下一步”,打开度量值选取对话框,选取所有事实表数字列为“多维数据集度量值”,如图4.2所示。图4.2 度量值选取对话框3、点击“下一步”,打开维度选取对话框,选取所有维度为“多维数据集维度”,如图4.3所示。图4.3 维度选取对话框4、点击“下一步”,弹出“事实数据表行数”提示框,如图4.4所示,点击“是”。图4.4“事实数据表行数”提示框5、在弹出提示框中点击拟定,如图4.5所示。图4.5信息提示6、在弹出“完

18、毕”对话框中输入“多维数据集名称”为“保单数据分析”,点击完毕弹出“多维数据集编辑器”窗口,如图4.6所示。图4.6 “多维数据集编辑器”窗口7、在上图“架构”区域中右键点击空白区域,弹出“插入表”按钮,在“选取表”对话框中选取“中间表”,点击“添加”,关闭对话框。将各个表通过公共键连接起来,如图4.7所示。图4.7 表间连接8、选取“多维数据集编辑器”窗口“工具”菜单“解决多维数据集”,打开信息提示框,如图4.8所示。图4.8 信息提示9、点击“是”,打开“存储设计向导”对话框,点击“下一步”打开“选取数据存储类型”对话框,如图4.9所示,选取“MOLAP”选项。图4.9 “选取数据存储类型

19、”对话框10、点击“下一步”,打开“设立聚合选项”对话框,如图4.10所示,点击“开始”。图4.10 “设立聚合选项”对话框11、聚合后点击“下一步”,弹出“完毕”对话框,如图4.11所示,点击“完毕”,得到最后解决成果,如果4.12所示。图4.11 “完毕”对话框图4.12 “解决”对话框四、注意事项:1、建立“雪花模型”时候注意表之间连接操作。2、计算聚合时选是MOLAP而不是ROLAP。五、思考与练习:1、观测多维数据集数据,理解多维数据集原理和作用。2、聚合伙用。实验五、OLAP数据展示一、实验目:1、理解OLAP数据分析模式,掌握钻取、旋转等操作办法2、学习建立OLAP分析数据动态访

20、问方式,在Excel上建立OLAP数据透视,对多维立方体进行展示分析二、实验内容:1、按照时间对多维数据集数据进行展示,按照时间和投保人类型进行嵌套维度查询2、使用Excel进行数据展示,在Excel中建立与分析服务器连接,将分析成果显示到Excel上3、学习使用数据透视表进行数据分析展示,查看更细节数据。三、实验环节:1、左键点击“多维数据集”中“保单数据分析”,相应右边显示区里点击“数据”选项卡,如图5.1所示。图5.1 数据显示2、选取“时间”、“收付费类型”或“险种_投保人类型分类”维度某一种或组合分量查看查询数据,用鼠标左键拖动查询区域维度或显示区域维度,变化显示形式。3、新建Exc

21、el文献,选取“数据”菜单,打开“导入数据”,如图5.2所示。图5.2 导入数据菜单4、打开“选取数据源”对话框,如图5.3所示,点击“新建源”按钮,弹出“数据连接向导”对话框,如图5.4所示。图5.3 “选用数据源”对话框图5.4 “数据连接向导”对话框5、在打开“数据连接向导”中选取数据源为“Microsoft SQL Server OLAP服务”,点击“下一步”,在弹出对话框中输入服务管理器名称,点击“下一步”,在弹出对话框中“选取数据库”为“人寿保险实验”,选定多维数据集为“保单数据分析”,如图5.5所示。图5.5 “选取数据库和表”对话框6、点击“下一步”,点击“完毕”,点击“打开”

22、,弹出透视表视图向导,如图5.6所示,点击完毕。图5.6 数据透视向导对话框7、点击“格式”菜单,选取“自动套用格式”,打开对话框中选取“表1”格式,如图5.7所示。图5.7 显示区域8、将“数据透视表字段列表”中维度和度量值分别拖动到左边工作区域中,形成完整表格,如图5.8所示。图5.8 Excel中OLAP数据显示四、注意事项:1、Excel与数据源连接用菜单“导入外部数据”功能。2、注意Excel中显示数据表格格式。五、思考与练习:1、OLAP中旋转、钻取、切片、切块等操作如何实现。实验六、决策树挖掘与聚类挖掘一、实验目:1、掌握使用Analysis Services进行决策树分析和聚类

23、分析办法2、对Analysis Services提供分析成果进行解释二、实验内容:1、使用Analysis Services导入泰坦尼克乘客和心脏病诊断数据表2、对泰坦尼克乘客数据和心脏病数据分别进行决策树挖掘和聚类挖掘,给出自己对分析成果解释3、在泰坦尼克乘客Excel数据表中复制粘贴所有数据,使既有数据为原有数据两倍,重新进行决策树挖掘,给出自己对分析成果解释三、实验环节:1、运用实验一办法,将实验数据导入到数据库“insur”中,在“Analysis Manager”窗口中点开“人寿保险实验”,在“挖掘模型”上点击右键选取“新建挖掘模型”,打开向导,点击“下一步”,弹出“挖掘模型向导”对

24、话框,如图6.1所示。图6.1“挖掘模型向导”对话框2、点击“下一步”,选取“可用表”为新导入“sheet1$”,如图6.2所示。图6.2 “选取事例表”对话框3、点击“下一步”,在弹出对话框中选取“Microsoft 汇集”技术,如图6.3所示。图6.3“选取数据挖掘技术”对话框4、点击“下一步”,选取事例键列为“ID”,点击“下一步”,在弹出对话框中添加输入列,如图6.4所示。图6.4“选取输入列”对话框5、点击“下一步”,在弹出对话框中输入挖掘模型名称,如图6.5所示。图6.5 “完毕”对话框6、解决完后,查看“关系挖掘模型编辑器”窗口“内容”选项卡,得到数据挖掘成果,如图6.6所示。图6.6 聚类挖掘成果四、注意事项: 1、聚类挖掘中簇数目由属性设定决定。五、思考与练习:1、对比原有泰坦尼克乘客数据决策树挖掘成果与新数据挖掘成果不同,思考产生不同因素。2、观测选定不同数目输入列与聚类挖掘形成簇数目关系。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1