商务智能 课程实验指导书Word文件下载.docx

上传人:b****5 文档编号:19829670 上传时间:2023-01-10 格式:DOCX 页数:20 大小:413.92KB
下载 相关 举报
商务智能 课程实验指导书Word文件下载.docx_第1页
第1页 / 共20页
商务智能 课程实验指导书Word文件下载.docx_第2页
第2页 / 共20页
商务智能 课程实验指导书Word文件下载.docx_第3页
第3页 / 共20页
商务智能 课程实验指导书Word文件下载.docx_第4页
第4页 / 共20页
商务智能 课程实验指导书Word文件下载.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

商务智能 课程实验指导书Word文件下载.docx

《商务智能 课程实验指导书Word文件下载.docx》由会员分享,可在线阅读,更多相关《商务智能 课程实验指导书Word文件下载.docx(20页珍藏版)》请在冰豆网上搜索。

商务智能 课程实验指导书Word文件下载.docx

实验内容

建立SqlServer2005数据挖掘实验环境

一.实验目的

通过本实验使学生掌握SQLServer2005数据库及其数据仓库系统的工作原理以及应用方法;

掌握并熟悉SQLSERVERBIDEVSTUDIO开发环境。

二.实验类型基础型

三.实验学时2学时

四.实验原理及知识点

1.SQLServer服务

2.服务器注册

3.系统数据源连接

4.数据源视图处理

4.多维数据集

五.实验环境

1.硬件设备要求:

PC及其联网环境;

2.软件设备要求:

操作系统Windows,SQLServer2005,SQLServer2005BIDEVSTUDIO。

六.实验内容及步骤

1.启动SQLServer服务,打开BI开发环境

2.注册服务器

3.建立系统数据源连接

4.建立数据库和数据源视图

5.浏览多维数据集数据

6.编辑多维数据集数据

七.思考与练习

1.什么是SQLSever2005BIDEVSTUDIO?

它包含几个主要部分?

2.如何注册服务器?

3.如何设计数据源视图?

4.如何建立多维数据集?

5.如何在BI里浏览多维数据集数据?

6.如何在BI里查看数据挖掘模型?

挖掘算法实践I

通过本实验使学生理解关联分析功能和作用。

熟悉SQLServer2005中关联挖掘函数,使用DMX中的关联挖掘函数、数据库对象建立商业销售数据的关联挖掘模型,使用数据挖掘模型并以可视化方式显示有效的结果模式。

二.实验类型设计型

三.实验学时4学时

1.关联挖掘模型;

2.DMX关联挖掘函数;

3.查看挖掘模型结构;

4.查看挖掘结果

为某大型超市建立一个关联数据挖掘模型,挖掘出季节变化与食品的顾客消费行为之间的关联,如“每年的夏季,西瓜的销量会比春季上升70%”,为超市的商品摆放提供决策依据,并把挖掘的有效模式以图形化的方式显示出来。

1.构建挖掘事例表;

2.设计挖掘结构;

3.在设计好的挖掘结构上实现挖掘模型;

4.训练挖掘模型;

5.实现挖掘模型预测;

1.什么是挖掘结构?

它和挖掘模型有什么差别?

2.如果用DMX语言创建一个关联挖掘模型?

3.什么是训练数据集?

什么是测试数据集?

4.如何分析挖掘模型的预测结果?

挖掘算法实践II

通过本实验使学生理解决策树挖掘分析功能和作用。

熟悉SQLServer2005中决策树挖掘函数,使用DMX中的决策树挖掘函数、数据库对象建立商业销售数据的关联挖掘模型,使用数据挖掘模型并以可视化方式显示有效的结果模式。

1.决策树模型;

利用测试数据集,创建决策树数据挖掘模型,并把挖掘的有效模式以图形化的方式显示出来。

2.如果用DMX语言创建一个决策树挖掘模型?

通过本实验使学生理解分类挖掘的功能和作用。

熟悉SQLServer2005中决策树挖掘函数,如何使用DMX中的决策树挖掘函数、数据库对象建立决策树挖掘模型,使用决策树挖掘模型并以可视化方式显示有效的分类/决策树模式

1.数据预处理;

2.决策树挖掘模型;

4.查看挖掘结果。

以下2题任选1题

(1)据蘑菇数据库已知数据,建立数据仓库训练集,并在此基础上,利用决策树算法判断所给蘑菇是否有毒。

(2)AdventureWorksCycle公司的市场部需要标识其以前客户的特征,这些特征可以指示这些客户以后是否有可能购买其产品。

AdventureWorks数据库存储了描述其以前客户的人口统计信息。

通过使用Microsoft决策树算法分析这些信息,市场部可以生成一个模型,该模型根据有关特定客户的已知列的状态(如人口统计或以前的购买模式)预测该客户是否会购买产品。

1.下载相关数据库,并分析数据内容;

2.数据预处理,设计训练数据集及测试数据集;

3.设计挖掘结构;

4.在设计好的挖掘结构上实现挖掘模型;

5.训练挖掘模型;

6.实现挖掘模型预测;

7.分析预测结果

1.什么是数据预处理?

数据预处理主要有几种方法?

2.如何设计蘑菇数据库的测试数据集及训练数据集?

第二部分

实验指导

建立SqlServer2000数据挖掘实验环境

1.启动SQLServer服务

启动SQLServer实例时即启动了SQLServer服务。

启动SQLServer服务之后,用户便可与服务器建立新连接。

SQLServer服务可在本地或远程作为MicrosoftWindowsNT®

4.0或Windows®

2000服务启动和停止。

SQLServer服务若是默认实例,则被称为MSSQLServer;

若是命名实例,则被称为MSSQL$instancename。

a.右击一个服务器或服务器组,然后单击"

新建SQLServer注册"

命令。

b.在"

服务器"

框中,键入服务器名。

c.若要指定SQLServer企业管理器(作为客户端)与运行正在注册的Microsoft®

SQLServer™实例的服务器之间的连接,请执行下列操作之一:

单击"

使用Windows身份验证"

-或-单击"

使用SQLServer身份验证"

d.在"

服务器组"

列表中,单击一个服务器组。

e.执行下列一个或多个操作:

●选择"

在控制台中显示SQLServer服务器的状态"

复选框以打开服务轮询。

显示系统数据库和系统对象"

复选框以显示所有系统数据库和对象。

在连接时自动启动SQLServer"

复选框以自动启动SQLServer实例。

重复步骤a到e,在"

SQLServer企业管理器"

中注册每个服务器。

3.建立系统数据源连接

a.单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源(ODBC)”。

b.在“系统DSN”选项卡上单击“添加”按钮。

c.选择“MicrosoftAccess驱动程序(*.mdb)”,然后单击“完成”按钮。

d.在“数据源名”框中,输入“教程”,然后在“数据库”下,单击“选择”。

e.在“选择数据库”对话框中,浏览到“C:

\ProgramFiles\MicrosoftAnalysisServices\Samples”,然后单击“FoodMart2000.mdb”。

单击“确定”按钮。

4.建立数据库和数据源

●如何建立数据库结构

a.在AnalysisManager树视图中展开“AnalysisServers”。

b.单击服务器名称,即可建立与AnalysisServers的连接。

c.右击服务器名称,然后单击“新建数据库”命令。

d.在“数据库”对话框中的“数据库名称”框中,输入“教程”,然后单击“确定”按钮。

e.在AnalysisManager树窗格中展开服务器,然后展开刚才创建的“教程”数据库。

●建立数据源

a.在AnalysisManager树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。

在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“MicrosoftOLEDBProviderforODBCDrivers”。

b.单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程”。

c.单击“测试连接”以确保一切工作正常。

在“Microsoft数据链接”对话框中应出现一条消息,说明连接成功。

在消息框中单击“确定”按钮。

d.单击“确定”按钮关闭“数据链接属性”对话框。

5.建立多维数据集

FoodMart是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。

市场部想要按产品和顾客分析1998年进行的所有销售业务数据。

使用存储在公司数据仓库中的数据,您就能建立多维数据结构(多维数据集),以便在市场分析人员查询数据库时获取快速的响应。

建立一个多维数据集,用于进行销售分析。

a.打开多维数据集向导

在AnalysisManager树窗格中,“教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。

b.向多维数据集添加度量值

度量值是要进行分析的数据库中的量化值。

常用的度量值为销售、成本和预算数据。

度量值根据多维数据集不同的维度类别进行分析。

①在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。

②在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”。

③单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。

数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。

④若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。

对“store_cost”和“unit_sales”列重复此步骤,然后单击“下一步”按钮。

c.建立时间维度

在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。

此操作将调用维度向导。

①在“欢迎”步骤,单击“下一步”按钮。

②在“选择维度的创建方式”步骤,选择“星型架构:

单个维度表”选项,然后单击“下一步”按钮。

③在“选择维度表”步骤,单击“time_by_day”。

单击“浏览数据”按钮可以查看包含在“time_by_day”表中的数据。

查看完“time_by_day”表后,单击“下一步”按钮。

④在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。

⑤接下来,将定义维度的级别。

在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、季度、月”,然后单击“下一步”按钮。

⑥在“选择高级选项”步骤,单击“下一步”按钮。

⑦在向导的最后一步,输入“Time”作为新维度的名称。

⑧单击“完成”返回到多维数据集向导。

⑨在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。

d.建立产品维度

①再次单击“新建维度”命令。

在“欢迎进入维度向导”步骤,单击“下一步”按钮。

②在“选择创建维度的方式”步骤,选择“雪花架构:

多个相关维度表”选项,然后单击“下一步”按钮。

③在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表”。

单击“下一步”按钮。

④在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。

●l 

若要定义维度的级别,在“可用的列”下,按顺序双击“product_category”、“product_subcategory”和“brand_name”。

双击每列后,其名称显示在“维度级别”下。

在选择了所有三列后,单击“下一步”按钮。

在“指定成员键列”步骤,单击“下一步”按钮。

在“选择高级选项”步骤,单击“下一步”按钮。

在向导的最后一步,在“维度名称”框中,输入“Product”,并保持“与其它多维数据集共享此维度”复选框为选中状态。

单击“完成”按钮。

现在应能在“多维数据集维度”列表中看到“Product”维度。

e.建立客户维度

①单击“新建维度”命令。

②在“欢迎”步骤,单击“下一步”按钮。

③在“选择创建维度的方式”步骤,选择“星型架构:

单个维度表”选项,然后单击“下一步”按钮。

④在“选择维度表”步骤,单击“Customer”,然后单击“下一步”按钮。

⑤在“选择维度类型”步骤,单击“下一步”按钮。

⑥若要定义维度的级别,在“可用列”下,按顺序双击“Country”、“State_Province”、“City”和“lname”列。

双击每一列后,其名称将显示在“维度级别”下方。

选择完所有四个列之后,单击“下一步”按钮。

⑦在“指定成员键列”步骤,单击“下一步”按钮。

⑧在“选择高级选项”步骤,单击“下一步”按钮。

⑨在向导的最后一步,在“维度名称”框中,输入“Customer”。

保持“与其它多维数据集共享此维度”复选框的选中状态。

⑩在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Customer”维度。

f.完成多维数据集的生成

①在多维数据集向导中,单击“下一步”按钮。

②在“事实数据表行数”消息给出提示时,单击“是”按钮。

③在多维数据集向导的最后一步,将多维数据集命名为“Sales”,然后单击“完成”按钮。

④向导将关闭并随之启动多维数据集编辑器,其中包含刚刚创建的多维数据集。

单击蓝色或黄色的标题栏,对表进行排列。

一.SQLSEVER2005安装

1)SQLServer2005的一般部署步骤

当你第一次把SQLServer2005的CD或者DVD光盘放到Server里的时候,你会看到一个引导窗口(图A),上面是产品介绍和运行须知。

图A

SQLServer2005的引导页面。

要注意的是,即使你是用单张DVD进行安装,这个页面顶部的文字显示的还是“光盘1/2(Disc1of2)”。

要开始安装,就要选择“安装(Install)”标题下的“Server组件、工具、在线工具书和示例(Servercomponents,tools,BooksOnline,andsamples)”选项。

弹出的第一个画面是产品的最终用户许可证协议。

你需要勾选“我接受协议条款和条件(Iacceptthelicensingtermsandconditions)”,点击“下一步(Next)”按钮继续。

我在这里就不列出许可证页面了。

你对此可能已经很熟悉了。

下一个画面(图B)显示的是安装程序要提前安装的一些程序。

.NET框架2.0是这里的关键。

如果你决定在同一台Server上安装SQLServer2005以及其他应用程序,那就要确保它们都能够使用这个框架。

点击“安装(Install)”按钮来安装这些项目。

当这些项目安装完毕后,你可以点击“下一步”按钮。

图B

当所有需要预先安装的程序都安装到你的系统里之后,SQLServer2005的安装向导就会启动。

安装向导完成的第一项任务是扫描你的系统,以确保它满足SQLServer2005的最低要求。

在下面的图C里,你会看到系统检测提示有两个方面存在问题。

第一个是硬件的最低要求。

它之所以出现是因为我是用虚拟机来安装SQLServer2005的,而虚拟机分配到的内存只有384兆,这个问题很容易解决。

第二个是要求具有Internet信息服务功能(IISFeatureRequirement),这个有点严重。

SQLServer2005的一些服务,例如报告服务(ReportingServices)要求使用IIS。

所以,继续安装之前,我要退出SQLServer2005的安装过程,再在Server上安装IIS。

之后,才能继续进行安装。

图C

系统检测会检查出一些存在的问题,这样你可以在安装之前就解决它们,从而避免一些可能发生的错误。

安装的下一步(图D)就相当简单了。

填好你的名字、公司名和产品密钥。

点击“下一步”继续。

图D

在这一画面里,你需要选希望与SQLServer2005一起安装的组件。

如果这是你的第一台Server,那么就要选上SQLServer数据库服务(SQLServerDatabaseServices)选项。

为了保证完整性,我安装了所有的服务,但是本文不会讨论故障转移集群。

如果你想要选择更加详细的选项,或者更改默认的安装路径(C:

ProgramFilesMicrosoftSQLServer),点击“高级(Advanced)”按钮,然后会弹出一个更加常见的功能选择窗口。

下面的图E向你显示的是“组件选择(ComponentSelection)”画面。

在图F里,显示的是“高级(Advanced)”画面。

在窗口里,点击“下一步(Next)”继续安装。

图EQLServer2005的主要组件选择画面。

图F

SQLServer2005引入了SQLServer命名实例(namedinstance)的概念。

你可以选择升级已有的命名实例(图G),你也可以选择在安装SQLServer2005时默认的实例。

在本文的例子里,我使用的“默认(Default)”选项。

图G择你的实例。

正如以往,SQLServer服务需要使用特定的验证信息登录到系统。

你可以选择让所有的SQL服务都共享相同的验证信息,或者你可以为每个服务都提供自己的登录验证信息,我建议在进行更大范围安装时使用后面这种方式。

但是,在本文里,我让所有的服务都共享一个帐号,并使用内置的“本地系统(LocalSystem)”帐号。

这个画面还让你选择在安装完成之后启动哪些服务。

你可以在图H的屏幕截图中看到安装程序默认选择的服务是哪些。

图H为每项SQL服务选择服务帐号

在安装的下一个画面(图I)里,系统会问你是否想要使用混合模式的Windows身份验证(MixedModeAuthentication),这种模式让你可以使用SQLServer帐号。

除非你有充足的理由不使用,否则最好使用Windows身份验证模式。

用户帐号的维护更简单,这是你公司潜在安全漏洞较少的一个地方。

如果你需要使用混合模式,就要向安装程序提供你希望系统管理员(sa)帐号使用的密码。

图I

选择你的身份验证模式。

排序规则是不同的字符集和排序顺序的组,SQLServer正是通过它们才能够用于不同的区域和语言。

SQLServer2005安装程序让你可以选择“SQL排序规则(SQLCollations)”,这样你就可以向后兼容先前版本的SQLServer。

但是,如果你要安装“分析服务(AnalysisServices)”,SQL的排序规则就不能用于这项服务。

微软建议你使用Windows排序规则而不用SQL排序规则,除非你需要解决向后兼容性的问题。

Windows排序规则为你提供了同时用于Unicode和非Unicode文本的连续字符串比较功能。

在本文的安装示例里,我将用到用于SQL和分析服务的Latin1_general排序规则指示项(图J)和排序顺序。

图J

“安装进度(SetupProgress)”窗口让你能够了解安装程序安装各个组件到哪一步了。

图O

二、其他实验步骤及方法:

参考教材第3章。

SqlServer2005数据挖掘实验环境中多维数据组织与分析

定义多维数据集及其属性

1.在解决方案资源管理器中,右键单击“多维数据集”,然后单击“新建多维数据集”。

2.在“欢迎使用多维数据集向导”页上,单击“下一步”。

3.在“选择生成方法”页上,确认已选中“使用数据源生成多维数据集”选项和“自动生成”选项,然后单击“下一步”。

4.在“选择数据源视图”页上,确认已选中数据源视图,然后单击“下一步”。

5.该向导扫描在数据源对象中定义的数据库中的表,以标识事实数据表和维度表。

事实数据表包含相关的度量值,如售出的部件数等。

维度表包含有关这些度量值的信息,如售出产品、售出该产品的月份等。

6.在向导标识完事实数据表和维度表后,请在“检测事实数据表和维度表”页上单击“下一步”。

7.每个维度表必须链接到多维数据集中的一个事实数据表。

维度表具有下列关系类型之一:

与事实数据表的直接主键-外键关系。

这称为“星型架构”。

通过某个其他表与事实数据表的间接主键-外键关系。

这称为“雪花型架构”。

8.在“标识事实数据表和维度表”页上,还可以指定时间

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 其它课程

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1