最新秋浙江大学数据挖掘作业必做在线.docx

上传人:b****3 文档编号:858588 上传时间:2022-10-13 格式:DOCX 页数:14 大小:62KB
下载 相关 举报
最新秋浙江大学数据挖掘作业必做在线.docx_第1页
第1页 / 共14页
最新秋浙江大学数据挖掘作业必做在线.docx_第2页
第2页 / 共14页
最新秋浙江大学数据挖掘作业必做在线.docx_第3页
第3页 / 共14页
最新秋浙江大学数据挖掘作业必做在线.docx_第4页
第4页 / 共14页
最新秋浙江大学数据挖掘作业必做在线.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

最新秋浙江大学数据挖掘作业必做在线.docx

《最新秋浙江大学数据挖掘作业必做在线.docx》由会员分享,可在线阅读,更多相关《最新秋浙江大学数据挖掘作业必做在线.docx(14页珍藏版)》请在冰豆网上搜索。

最新秋浙江大学数据挖掘作业必做在线.docx

最新秋浙江大学数据挖掘作业必做在线

单选题

1.置信度(confidence)是衡量兴趣度度量()的指标。

A简洁性

B确定性

C实用性

D新颖性

正确答案:

B

单选题

2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?

A上卷

B下钻

C切块

D转轴

正确答案:

A

单选题

3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A关联分析

B分类和预测

C聚类分析

D演变分析

正确答案:

A

单选题

4.下列哪个描述是正确的?

A分类和聚类都是有指导的学习

B分类和聚类都是无指导的学习

C分类是有指导的学习,聚类是无指导的学习

D分类是无指导的学习,聚类是有指导的学习

正确答案:

C

单选题

5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?

A算术平均值

B截尾均值

C中位数

D众数

正确答案:

B

单选题

6.规则:

age(X,”19-25”)∧buys(X,“popcorn”)=>buys(X,“coke”)是一个()。

A单维关联规则

B多维关联规则

C混合维关联规则

D不是一个关联规则

正确答案:

B

单选题

7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

A关联分析

B分类和预测

C孤立点分析

D演变分析

E概念描述

正确答案:

E

单选题

8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?

A数据清理

B数据集成

C数据变换

D数据归约

正确答案:

A

单选题

9.进行数据规范化的目的是()。

A去掉数据中的噪声

B对数据进行汇总和聚集

C使用概念分层,用高层次概念替换低层次“原始”数据

D将属性按比例缩放,使之落入一个小的特定区间

正确答案:

D

单选题

10.平均值函数avg()属于哪种类型的度量?

A分布的

B代数的

C整体的

D混合的

正确答案:

B

单选题

11.下面哪种分类方法是属于统计学的分类方法?

A判定树归纳

B贝叶斯分类

C后向传播分类

D基于案例的推理

正确答案:

B

单选题

12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A关联分析

B分类和预测

C聚类分析

D演变分析

正确答案:

A

单选题

13.支持度(support)是衡量兴趣度度量()的指标。

A实用性

B确定性

C简洁性

D新颖性

正确答案:

A

单选题

14.以下哪个范围是数据仓库的数据库规模的一个合理范围?

A1-100M

B100M-10G

C10-1000G

D100GB-数TB

正确答案:

D

单选题

15.下面那种数据挖掘方法可以用来检测孤立点?

A概念描述

B分类和预测

C聚类分析

D演变分析

正确答案:

C

单选题

16.字段Hair_color={auburn,black,blond,brown,grey,red,white}属于那种属性类型?

A标称属性

B二元属性

C序数属性

D数值属性

正确答案:

A

单选题

17.下面哪种分类方法是属于神经网络学习算法?

A判定树归纳

B贝叶斯分类

C后向传播分类

D基于案例的推理

正确答案:

C

单选题

18.哪种数据变换的方法将数据沿概念分层向上汇总?

A平滑

B聚集

C数据概化

D规范化

正确答案:

C

单选题

19.下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。

A选择任务相关的数据

B选择要挖掘的知识类型

C模式的兴趣度度量

D模式的可视化表示

正确答案:

B

单选题

20.孤立点挖掘适用于下列哪种场合?

A目标市场分析

B购物篮分析

C模式识别

D信用卡欺诈检测

正确答案:

D

单选题

21.下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?

A上卷(roll-up)

B选择(select)

C切片(slice)

D转轴(pivot)

正确答案:

B

单选题

22.下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?

A空间填充曲线

B散点图矩阵

C平行坐标

D圆弓分割

正确答案:

B

单选题

23.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A关联分析

B分类和预测

C演变分析

D概念描述

正确答案:

B

单选题

24.下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

A关联分析

B分类和预测

C聚类分析

D演变分析

正确答案:

D

单选题

25.数据归约的目的是()。

A填补数据种的空缺值

B集成多个数据源的数据

C得到数据集的压缩表示

D规范化数据

正确答案:

C

单选题

26.数据的噪声是指()。

A孤立点

B空缺值

C测量变量中的随即错误或偏差

D数据变换引起的错误

正确答案:

C

单选题

27.存放最低层汇总的方体称为()。

A顶点方体

B方体的格

C基本方体

D维

正确答案:

C

单选题

28.数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。

A所涉及的算法的复杂性

B所涉及的数据量

C计算结果的表现形式

D是否使用了人工智能技术

正确答案:

B

单选题

29.以下哪种聚类方法可以发现任意形状的聚类?

A划分的方法

B基于模型的方法

C基于密度的方法

D层次的方法

正确答案:

C

单选题

30.帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。

A关联分析

B分类和预测

C聚类分析

D孤立点分析

E演变分析

正确答案:

C

单选题

31.以下哪个指标不是表示对象间的相似度和相异度?

AEuclidean距离

BManhattan距离

CEula距离

DMinkowski距离

正确答案:

C

单选题

32.字段Size={small,medium,large}属于那种属性类型?

A标称属性

B二元属性

C序数属性

D数值属性

正确答案:

C

单选题

33.根据关联分析中所处理的值类型,可以将关联规则分类为()。

A布尔关联规则和量化关联规则

B单维关联规则和多维关联规则

C单层关联规则和多层关联规则

D简答关联规则和复杂关联规则

正确答案:

A

单选题

34.()通过将属性域划分为区间,从而减少给定连续值的个数。

A概念分层

B离散化

C分箱

D直方图

正确答案:

B

多选题

35.OLAP系统和OLTP系统的主要区别包括()。

AOLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据

B在数据的存取上,OLTP系统比OLAP系统有着更多的写操作

C对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多

DOLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据

正确答案:

ABD

多选题

36.Apriori算法所面临的主要的挑战包括()。

A会消耗大量的内存

B会产生大量的候选项集

C对候选项集的支持度计算非常繁琐

D要对数据进行多次扫描

正确答案:

BCD

多选题

37.下列哪些是数据变换可能涉及的内容?

A数据压缩

B数据概化

C维归约

D规范化

正确答案:

BD

多选题

38.下面哪些问题是我们进行数据预处理的原因?

A数据中的空缺值

B噪声数据

C数据中的不一致性

D数据中的概念分层

正确答案:

ABC

多选题

39.以下哪些是数据仓库的主要应用?

A信息处理

B互联网搜索

C分析处理

D数据挖掘

正确答案:

ACD

多选题

40.根据关联分析中所涉及的数据维,可以将关联规则分类为()。

A布尔关联规则

B单维关联规则

C多维关联规则

D多层关联规则

正确答案:

BC

多选题

41.数据清理的目的是处理数据中的()。

A空缺值

B噪声数据

C不一致数据

D敏感数据

正确答案:

ABC

多选题

42.从结构的角度看,数据仓库模型包括以下几类()。

A企业仓库

B数据集市

C虚拟仓库

D信息仓库

正确答案:

ABC

多选题

43.根据关联分析中所涉及的抽象层,可以将关联规则分类为()。

A布尔关联规则

B单层关联规则

C多维关联规则

D多层关联规则

正确答案:

BD

多选题

44.数据仓库的三层架构主要包括以下哪三部分?

A数据源

B数据仓库服务器

COLAP服务器

D前端工具

正确答案:

BCD

多选题

45.以下哪些原因可能引起空缺值?

A设备异常

B命名规则的不一致

C与其他已有数据不一致而被删除

D在输入时,有些数据因为得不到重视而没有被输入

正确答案:

ACD

加入错题集关闭

窗体底端

一、某市某社区,常住人口7414人,外来人口731人,社区内60岁以上老人1191人(占16%),该社区有7名卫生服务人员(2名全科医生,2明护士,2名助理医生和一名公共卫生人员),2014年该社区卫生服务站开始责任医生进家庭试点工作,并开展社区慢性病管理工作,根据以上情况,回答下列问题:

(本题总分25分)

  1、若在该社区开展健康信息的收集工作,齐基本步骤包括哪些方面?

(7分)P7(小本)

  1)收集资料前的准备

  2)明确调查对象

  3)知情同意

  4)开始调查

  5)记录表的核查

  6)结束,调查员签名,日期,联系电话等

  7)资料的保存

  2、社区慢性病管理所使用的健康调查表一般包括哪些内容?

(7分,P2、9、14)

  1)个人基本信息

  2)生活方式信息

  3)健康体检信息

  3、如何识别不合逻辑的健康信息记录?

(6分,P24)

  4、看对信息判断,是否有违背常识的数据

  1)直接审阅所收集人健康记录表

  2)建立计算机数据库结构时对相应变量设定范围或合法输入值

  3)在数据录入完成后应用计算机进行逻辑言错误识别,可通过编程序找出不和逻辑的的变量值。

  5、对已收集的健康相关信息从哪几个方面进行信息管理?

(5分,P26)

  1)录入人员培训

  2)数据导入

  3)录入数据的签到和核实

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 法语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1