BINo07Topic08BISampleDMXSQL Server.docx

上传人:b****5 文档编号:7268356 上传时间:2023-01-22 格式:DOCX 页数:13 大小:151.38KB
下载 相关 举报
BINo07Topic08BISampleDMXSQL Server.docx_第1页
第1页 / 共13页
BINo07Topic08BISampleDMXSQL Server.docx_第2页
第2页 / 共13页
BINo07Topic08BISampleDMXSQL Server.docx_第3页
第3页 / 共13页
BINo07Topic08BISampleDMXSQL Server.docx_第4页
第4页 / 共13页
BINo07Topic08BISampleDMXSQL Server.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

BINo07Topic08BISampleDMXSQL Server.docx

《BINo07Topic08BISampleDMXSQL Server.docx》由会员分享,可在线阅读,更多相关《BINo07Topic08BISampleDMXSQL Server.docx(13页珍藏版)》请在冰豆网上搜索。

BINo07Topic08BISampleDMXSQL Server.docx

BINo07Topic08BISampleDMXSQLServer

DMX实验

时间:

2009年11月1日课程:

商务智能(选修课)制作人:

赵亚伟

1.实验环境

服务器:

MicrosoftSQLServerAnalysisService2005、MicrosoftSQLServer2005

工具:

SQLServerBusinessIntelligenceDevelopmentStudio、SQLServerManagementStudio

2.数据模式

数据:

AdventureWorksDW数据仓库,选用表vTargetMail(视图)和ProspectiveBuyer。

表vTargetMail用于训练模型,表ProspectiveBuyer用于预测。

2.1挖掘用数据集市模式

 

2.2vTargetMail(视图)模式

 

2.3表ProspectiveBuyer模式

 

3.实验步骤

(1)在SQLServerManagementStudio中连接AS服务器;

(2)选定项目;

(3)新建查询;

(4)调试MDX。

4.决策树分类分析

下面是一个应用DMX创建挖掘结构、挖掘模型,训练挖掘模型及进行预测的完整过程例子。

条件:

在BesinessIntelligenceVisualStudio中建立了数据源AdventureWorksDW(与AdventureWorksDW连接)。

 

4.1模型创建

createminingmodelTarget_mail

CustomerKeylongkey,

AgelongContinuous,

CommuteDistanceTextDiscrete,

NumberCarsOwnedlongDiscrete,

NumberChildrenAtHomelongDiscrete,

RegionTextDiscrete,

TotalChildrenlongDiscrete,

YearlyIncomelongcontinuous,

BikeBuyerlongDiscretepredict

usingMicrosoft_Decision_Trees

--上述创建过程中,同时产生一个挖掘结构Target_mail_Structure和该结构化的一个挖掘模型Target_mail。

--也可以采用分步方式实现

--先定义结构Target_mail_Structure

/*

createminingstructureTarget_mail_Structure

CustomerKeylongkey,

AgelongContinuous,

CommuteDistanceTextDiscrete,

NumberCarsOwnedlongDiscrete,

NumberChildrenAtHomelongDiscrete,

RegionTextDiscrete,

TotalChildrenlongDiscrete,

YearlyIncomelongcontinuous,

BikeBuyerlongDiscrete

*/

--再基于该结构构建一个挖掘模型

/*

alterminingstructureTarget_mail_Structure

addminingmodelTarget_mail_1

(CustomerKeynotnull,--notnull:

建模标志

Age,

CommuteDistance,

NumberCarsOwned,

NumberChildrenAtHome,

Region,

TotalChildren,

YearlyIncome,

BikeBuyerpredict--predict预测子句

usingMicrosoft_Decision_Trees;

*/

4.2模型训练

InsertintoTarget_mail

CustomerKey,

Age,

CommuteDistance,

NumberCarsOwned,

NumberChildrenAtHome,

Region,

TotalChildren,

YearlyIncome,

BikeBuyer

openquery([AdventureWorksDW],

'select--属性与上述对应

CustomerKey,

Age,

CommuteDistance,

NumberCarsOwned,

NumberChildrenAtHome,

Region,

TotalChildren,

YearlyIncome,

BikeBuyer

fromvTargetMail

')

--查看模型内容,模型必须训练后才可以查看

select*

fromTarget_mail.CONTENT

select

attribute_name,

node_type,node_caption,

[children_cardinality],

node_description,

marginal_rule

fromTarget_mail.CONTENT

orderbynode_caption

 

4.3预测查询

--简单预测,单独预测

有一个用户:

年龄40,距离5Miles,1座房子,0个轿车,0个孩子,0个孩子在家,年收入50000,即

[Age]=35,

[CommuteDistance]='5Miles',

[HouseOwnerFlag]='1',

[NumberCarsOwned]=0,

[TotalChildren]=0,

[NumberChildrenAtHome]=0,

[YearlyIncome]=50000

查询:

他会买自行车吗?

SELECT

[Target_mail].[BikeBuyer],

PredictHistogram([BikeBuyer])

FROM

[Target_mail]

NATURALPREDICTIONJOIN

(SELECT

35AS[Age],

'5Miles'AS[CommuteDistance],

'1'AS[HouseOwnerFlag],

0AS[NumberCarsOwned],

0AS[TotalChildren],

0AS[NumberChildrenAtHome],

50000AS[YearlyIncome])ASt

结论:

85%可能会买

注意:

将4个属性值映射到模型,如果已知的值过少则预测效果受影响,如一下仅给定年龄,无论年龄取什么值,结果都是0。

SELECT

[Target_mail].[BikeBuyer],

PredictHistogram([BikeBuyer])

FROM

[Target_mail]

NATURALPREDICTIONJOIN

(SELECT50AS[Age]

)ASt

 

--成批预测

SELECT

t.[ProspectAlternateKey],

[Target_mail].[BikeBuyer],

PredictProbability([Target_mail].[BikeBuyer])

From

[Target_mail]

PREDICTIONJOIN

OPENQUERY([AdventureWorksDW],

'SELECT

[ProspectAlternateKey],

[YearlyIncome],

[NumberChildrenAtHome],

[HouseOwnerFlag],

[NumberCarsOwned]

FROM

[dbo].[ProspectiveBuyer]'

)ASt

ON

[Target_mail].[YearlyIncome]=t.[YearlyIncome]AND

[Target_mail].[NumberChildrenAtHome]=t.[NumberChildrenAtHome]AND

[Target_mail].[NumberCarsOwned]=t.[NumberCarsOwned]

ON子句定义了源查询中的列与挖掘模型中的列之间的映射。

该映射用于将源查询中的列定向到挖掘模型中的列,这样在创建预测时便可将这些列用作输入。

4.4对比:

贝叶斯模型

采用贝叶斯模型验证上述决策树模型,与SQLServerBusinessIntelligenceDevelopmentStudio中的决策树模型对比,注意贝叶斯模型“Age”及“YearlyIncome”属性做了离散化处理,连续数值属性模型不支持。

--创建结构、模型

createminingmodelTarget_mail_BY

CustomerKeylongkey,

AgelongDiscrete,

CommuteDistanceTextDiscrete,

NumberCarsOwnedlongDiscrete,

NumberChildrenAtHomelongDiscrete,

RegionTextDiscrete,

TotalChildrenlongDiscrete,

YearlyIncomelongDiscrete,

BikeBuyerlongDiscretepredict

usingMicrosoft_NAIVE_BAYES

 

--模型训练

InsertintoTarget_mail_BY

CustomerKey,

Age,

CommuteDistance,

NumberCarsOwned,

NumberChildrenAtHome,

Region,

TotalChildren,

YearlyIncome,

BikeBuyer

openquery([AdventureWorksDW],

'select--属性与上述对应

CustomerKey,

Age,

CommuteDistance,

NumberCarsOwned,

NumberChildrenAtHome,

Region,

TotalChildren,

YearlyIncome,

BikeBuyer

fromvTargetMail

')

--预测查询

SELECT

t.[ProspectAlternateKey],

[Target_mail_BY].[BikeBuyer],

PredictProbability([Target_mail_BY].[BikeBuyer])

From

[Target_mail_BY]

PREDICTIONJOIN

OPENQUERY([AdventureWorksDW],

'SELECT

[ProspectAlternateKey],

[YearlyIncome],

[NumberChildrenAtHome],

[HouseOwnerFlag],

[NumberCarsOwned]

FROM

[dbo].[ProspectiveBuyer]'

)ASt

ON

[Target_mail_BY].[YearlyIncome]=t.[YearlyIncome]AND

[Target_mail_BY].[NumberChildrenAtHome]=t.[NumberChildrenAtHome]AND

[Target_mail_BY].[NumberCarsOwned]=t.[NumberCarsOwned]

 

4.5模型结构及模型删除

--模型结构删除

DROPMININGSTRUCTURETarget_mail_Structure

--模型删除

DROPMININGMODELTarget_mail

4.6模型复制

SELECT*INTOnew_Target_mail--新模型,可以选部分属性列,也可以全选

usingMicrosoft_Decision_Trees--指定算法

fromTarget_mail--已有模型

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1