农业智能决策系统开发实验指导2Word文档下载推荐.docx

上传人:b****0 文档编号:13468913 上传时间:2022-10-11 格式:DOCX 页数:17 大小:226.28KB
下载 相关 举报
农业智能决策系统开发实验指导2Word文档下载推荐.docx_第1页
第1页 / 共17页
农业智能决策系统开发实验指导2Word文档下载推荐.docx_第2页
第2页 / 共17页
农业智能决策系统开发实验指导2Word文档下载推荐.docx_第3页
第3页 / 共17页
农业智能决策系统开发实验指导2Word文档下载推荐.docx_第4页
第4页 / 共17页
农业智能决策系统开发实验指导2Word文档下载推荐.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

农业智能决策系统开发实验指导2Word文档下载推荐.docx

《农业智能决策系统开发实验指导2Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《农业智能决策系统开发实验指导2Word文档下载推荐.docx(17页珍藏版)》请在冰豆网上搜索。

农业智能决策系统开发实验指导2Word文档下载推荐.docx

二、实验器材与环境:

计算机、Windows操作系统、SQLServer200X。

三、实验内容

使用SQLServer200X构建一个基于FoodMart(SQLServer所带的一个示例数据库)的数据仓库。

使用SQLServer200X的SSIS完成数据的抽取并将数据装载到数据仓库。

创建数据立方,并使用SQLServer200X的SSAS,进行决策支持的OLAP;

四、实验原理

使用SQLServer200X创建数据仓库逻辑结构的方法(关系数据库管理系统SQLServer200X同时用作数据仓库的管理系统);

使用SQLServer200X的SSIS进行ETL的方法;

使用SQLServer200X的SSAS进行OLAP的方法。

五、实验步骤

1、按照实验内容要求设计和创建数据仓库,使用SQLServer200X构建其逻辑结构;

2、设计和使用ETL,使用SQLServer200X的SSIS完成数据仓库的数据装载;

3、创建OLAP数据立方,为专门的OLAP奠定基础;

4、使用SQLServer200X的SSAS,进行决策支持的OLAP;

5、分析实验过程和结果,写出实验报告。

六、实验要求:

详细记录在实验过程中出现的问题、解决方法以及实验结果。

对实验结果进行分析,写出心得体会及改进意见。

提交《数据仓库的构建与使用实验》实验报告。

实验三聚类分析方法决策应用(4学时)

通过实验教学,加深对聚类分析技术方法的理解与认识,了解聚类分析技术的基本使用方法。

深入理解基于聚类分析的决策系统开发与实现过程。

掌握聚类分析应用程序设计技术。

能根据实际问题,完成应用程序开发。

计算机、Windows操作系统、MATLAB/SPSS/自编软件。

三、实验内容:

为了研究世界各国森林、草原资源的分布规律,共抽取了21个国家的数据,每个国家4项指标,原始数据见表3-1。

使用该原始数据对国别进行聚类分析。

表3-1抽样数据表

国别

森林面积(万公顷)

森林覆盖率(%)

林木蓄积量(亿立方米)

草原面积(万公顷)

中国

11978

12.5

93.5

31908

美国

28446

30.4

202.0

23754

日本

2501

67.2

24.8

58

德国

1028

28.4

14.0

599

英国

210

8.6

1.5

1147

法国

1458

26.7

16.0

1288

意大利

635

21.1

3.6

514

加拿大

32613

32.7

192.8

2385

澳大利亚

10700

13.9

10.5

45190

前苏联

92000

41.1

841.5

37370

捷克

458

35.8

8.9

168

波兰

868

27.8

11.4

405

匈牙利

161

17.4

2.5

129

南斯拉夫

929

36.3

640

罗马尼亚

634

11.3

447

保加利亚

385

34.7

200

印度

6748

20.5

29.0

1200

印尼

2180

84.0

33.7

尼日利亚

1490

16.1

0.8

2090

墨西哥

4850

24.6

32.6

7450

四、实验原理:

聚类分析的原理、编程方法或MATLAB/SPSS的使用方法。

1、研究实际聚类分析对象;

2、确定使用的聚类分析方法;

3、自编聚类分析程序或使用MATLAB/SPSS完成聚类分析;

4、分析实验过程和结果,写出实验报告。

详细记录实验过程中出现的问题、解决方法以及实验结果,并对实验结果进行细致分析,写出聚类分析的原理、程序开发要点(自编软件时)或者聚类分析操作方法与过程(使用MATLAB/SPSS时),以及体会和认识。

提交《聚类分析方法决策应用实验》实验报告。

实验四基于ID3方法的决策树构建(4学时)

通过实验教学,加深对数据挖掘的理解与认识。

深入理解ID3方法的基本原理,掌握基于ID3方法的决策树构建方法及应用程序设计技术,并能用于解决某些特定实际问题。

计算机、Windows操作系统、VC++/SQLServer200X。

根据天气、气温、湿度和风四个属性,可以将气候分成两类分别为P、N。

请按表4-1给出的一个训练集。

由ID3算法得出一棵正确分类训练集中每个实体的决策树,如图4-1所示。

然后用于其它情况下的气候分类。

表4-1气候分类训练样本集

样本号

属性

类别

天气

气温

湿度

1

无风

N

2

有风

3

多云

P

4

适中

5

正常

6

7

8

9

10

11

12

13

14

图4-1气候分类的ID3决策树

四、实验原理或算法描述

按照ID3基本思想,工作过程是,首先找出最有判别力(信息增益,informationgain)的属性,把数据分成多个子集,每个子集又选择最有判别力的属性进行划分,一直进行到所有子集仅包含同一类型的数据为止。

最后得到一棵决策树,可以用它来对新的实例进行分类。

ID3算法包括主算法和建树算法,具体描述如下:

1、主算法

(1)从训练集中随机选择一个既含正例又含反例的子集(称为“窗口”)。

(2)用“建树算法”对当前窗口形成一棵决策树。

(3)对训练集(窗口除外)中的例子用所得决策树进行类别判定,找出错判的例子。

(4)若存在错判的例子,把它们插入窗H,转2,否则结束。

主算法流程如图6-2所示。

其中,PE、NE分别表示正例集和反例集,它们共同组成训练集。

PE’、PE”和NE’、NE”分别表示正例集和反例集的子集。

主算法中每迭代循环一次,生成的决策树将会不相同。

图4-2ID3主算法流程

2、建树算法

建树算法的操作步骤如下:

(1)对当前例子集合,计算各属性的互信息。

(2)选择互信息最大的属性Ak。

(3)把在Ak处取值相同的例子归于同一子集,Ak取几个值就得几个子集。

(4)对既含正例又含反例的子集,递归调用建树算法。

(5)若子集仅含正例或反例,对应分支标上P或N,返回调用处。

对于气候分类问题给出以下具体计算和操作说明,以便理解建树算法中关键操作的内容和具体实现方法。

(1)信息熵计算

信息熵:

类别ui出现概率:

|S|表示例子集S的总数,|ui|表示类别ui的例子数。

对9个正例u1和5个反例u2有:

P(u1)=9/14P(u2)=5/14

H(U)=(9/14)log(14/9)+(5/14)log(14/5)=0.94bit

(2)条件熵计算

条件熵:

属性A1取值vj时,类别ui的条件概率:

A1=天气的取值:

v1=晴,v2=多云,v3=雨

在A1处取值“晴”的例子5个,取值“多云”的例子4个,取值“雨”的例子5个,故:

P(v1)=5/14P(v2)=4/14P(v3)=5/14

取值为晴的5个例子中有两个正例、3个反例,故:

P(u1/v1)=2/5,P(u2/v1)=3/5

同理有:

P(u1/v2)=4/4,P(u2/v2)=0

P(u1/v3)==:

2/5,P(u2/v3)=3/5

H(U|V)=(5/14)((2/5)log(5/2)+(3/5)log(5/3))+(4/14)((4/4)log(4/4)+0)+(5/14)((2/5)log(5/2)+(3/5)log(5/3))=0.694bit

(3)互信息计算

对A1=天气,有:

I(天气)=H(U)一H(U|V)=0.94—0.694=0.246bit

类似可得:

I(气温)=0.029bit

I(湿度)=0.151bit

I(风)=0.048bit

(4)建决策树的树根和分支

ID3算法将选择互信息最大的属性“天气”作为树根,在14个例子中对“天气”的3个取值进行分支,3个分支对应3个子集,分别是:

F1=(1,2,8,9,11),F2={3,7,12,13},F3={4,5,6,10,14}

其中,F2中的例子全属于P类,因此对应分支标记为P,其余两个子集既含有正例P又含有反例,将递归调用建树算法。

(5)递归建树

分别对F1和F3子集利用ID3算法,在每个子集中对各属性(仍为4个属性)求互信息。

①F1中的天气全取“晴”值,则H(U)=H(U|V),有I(U|V)=0,在余下3个属性中求出“湿度”互信息最大,以它为该分支的根结点。

再向下分支,“湿度”取“高”的例子全为N类,该分支标记N;

取值“正常”的例子全为P类,该分支标记P。

②在F3中,对4个属性求互信息,得到“风”属性互信息最大,则以它为该分支的根结点。

再向下分支,“风”取“有风”时全为N类,该分支标记N;

取“无风”时全为P类,该分支标记P。

这样就得到如图6-1所示的决策树。

1、按照实验原理中给出的ID3算法,编制正确分类训练集中每个实体的决策树的构建程序;

2、上机对气候分类决策树的构建程序进行调试与修改;

3、运行气候分类决策树的构建程序,构建气候分类决策树;

4、利用气候分类决策树,对其他情况的气候进行分类;

六、实验要求

提交《知识发现与数据挖掘实验》实验报告,附构建气候分类决策树的源程序、可执行文件(电子文档)和使用说明。

实验五遗传算法优化求解(4学时)

通过实验教学,加深对遗传算法的理解与认识

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 小学教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1