最新秋浙江大学数据挖掘作业必做在线.docx
《最新秋浙江大学数据挖掘作业必做在线.docx》由会员分享,可在线阅读,更多相关《最新秋浙江大学数据挖掘作业必做在线.docx(14页珍藏版)》请在冰豆网上搜索。
最新秋浙江大学数据挖掘作业必做在线
单选题
1.置信度(confidence)是衡量兴趣度度量()的指标。
A简洁性
B确定性
C实用性
D新颖性
正确答案:
B
单选题
2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?
A上卷
B下钻
C切块
D转轴
正确答案:
A
单选题
3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A关联分析
B分类和预测
C聚类分析
D演变分析
正确答案:
A
单选题
4.下列哪个描述是正确的?
A分类和聚类都是有指导的学习
B分类和聚类都是无指导的学习
C分类是有指导的学习,聚类是无指导的学习
D分类是无指导的学习,聚类是有指导的学习
正确答案:
C
单选题
5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?
A算术平均值
B截尾均值
C中位数
D众数
正确答案:
B
单选题
6.规则:
age(X,”19-25”)∧buys(X,“popcorn”)=>buys(X,“coke”)是一个()。
A单维关联规则
B多维关联规则
C混合维关联规则
D不是一个关联规则
正确答案:
B
单选题
7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。
A关联分析
B分类和预测
C孤立点分析
D演变分析
E概念描述
正确答案:
E
单选题
8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?
A数据清理
B数据集成
C数据变换
D数据归约
正确答案:
A
单选题
9.进行数据规范化的目的是()。
A去掉数据中的噪声
B对数据进行汇总和聚集
C使用概念分层,用高层次概念替换低层次“原始”数据
D将属性按比例缩放,使之落入一个小的特定区间
正确答案:
D
单选题
10.平均值函数avg()属于哪种类型的度量?
A分布的
B代数的
C整体的
D混合的
正确答案:
B
单选题
11.下面哪种分类方法是属于统计学的分类方法?
A判定树归纳
B贝叶斯分类
C后向传播分类
D基于案例的推理
正确答案:
B
单选题
12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A关联分析
B分类和预测
C聚类分析
D演变分析
正确答案:
A
单选题
13.支持度(support)是衡量兴趣度度量()的指标。
A实用性
B确定性
C简洁性
D新颖性
正确答案:
A
单选题
14.以下哪个范围是数据仓库的数据库规模的一个合理范围?
A1-100M
B100M-10G
C10-1000G
D100GB-数TB
正确答案:
D
单选题
15.下面那种数据挖掘方法可以用来检测孤立点?
A概念描述
B分类和预测
C聚类分析
D演变分析
正确答案:
C
单选题
16.字段Hair_color={auburn,black,blond,brown,grey,red,white}属于那种属性类型?
A标称属性
B二元属性
C序数属性
D数值属性
正确答案:
A
单选题
17.下面哪种分类方法是属于神经网络学习算法?
A判定树归纳
B贝叶斯分类
C后向传播分类
D基于案例的推理
正确答案:
C
单选题
18.哪种数据变换的方法将数据沿概念分层向上汇总?
A平滑
B聚集
C数据概化
D规范化
正确答案:
C
单选题
19.下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。
A选择任务相关的数据
B选择要挖掘的知识类型
C模式的兴趣度度量
D模式的可视化表示
正确答案:
B
单选题
20.孤立点挖掘适用于下列哪种场合?
A目标市场分析
B购物篮分析
C模式识别
D信用卡欺诈检测
正确答案:
D
单选题
21.下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?
A上卷(roll-up)
B选择(select)
C切片(slice)
D转轴(pivot)
正确答案:
B
单选题
22.下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?
A空间填充曲线
B散点图矩阵
C平行坐标
D圆弓分割
正确答案:
B
单选题
23.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。
A关联分析
B分类和预测
C演变分析
D概念描述
正确答案:
B
单选题
24.下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。
A关联分析
B分类和预测
C聚类分析
D演变分析
正确答案:
D
单选题
25.数据归约的目的是()。
A填补数据种的空缺值
B集成多个数据源的数据
C得到数据集的压缩表示
D规范化数据
正确答案:
C
单选题
26.数据的噪声是指()。
A孤立点
B空缺值
C测量变量中的随即错误或偏差
D数据变换引起的错误
正确答案:
C
单选题
27.存放最低层汇总的方体称为()。
A顶点方体
B方体的格
C基本方体
D维
正确答案:
C
单选题
28.数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。
A所涉及的算法的复杂性
B所涉及的数据量
C计算结果的表现形式
D是否使用了人工智能技术
正确答案:
B
单选题
29.以下哪种聚类方法可以发现任意形状的聚类?
A划分的方法
B基于模型的方法
C基于密度的方法
D层次的方法
正确答案:
C
单选题
30.帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。
A关联分析
B分类和预测
C聚类分析
D孤立点分析
E演变分析
正确答案:
C
单选题
31.以下哪个指标不是表示对象间的相似度和相异度?
AEuclidean距离
BManhattan距离
CEula距离
DMinkowski距离
正确答案:
C
单选题
32.字段Size={small,medium,large}属于那种属性类型?
A标称属性
B二元属性
C序数属性
D数值属性
正确答案:
C
单选题
33.根据关联分析中所处理的值类型,可以将关联规则分类为()。
A布尔关联规则和量化关联规则
B单维关联规则和多维关联规则
C单层关联规则和多层关联规则
D简答关联规则和复杂关联规则
正确答案:
A
单选题
34.()通过将属性域划分为区间,从而减少给定连续值的个数。
A概念分层
B离散化
C分箱
D直方图
正确答案:
B
多选题
35.OLAP系统和OLTP系统的主要区别包括()。
AOLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据
B在数据的存取上,OLTP系统比OLAP系统有着更多的写操作
C对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多
DOLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据
正确答案:
ABD
多选题
36.Apriori算法所面临的主要的挑战包括()。
A会消耗大量的内存
B会产生大量的候选项集
C对候选项集的支持度计算非常繁琐
D要对数据进行多次扫描
正确答案:
BCD
多选题
37.下列哪些是数据变换可能涉及的内容?
A数据压缩
B数据概化
C维归约
D规范化
正确答案:
BD
多选题
38.下面哪些问题是我们进行数据预处理的原因?
A数据中的空缺值
B噪声数据
C数据中的不一致性
D数据中的概念分层
正确答案:
ABC
多选题
39.以下哪些是数据仓库的主要应用?
A信息处理
B互联网搜索
C分析处理
D数据挖掘
正确答案:
ACD
多选题
40.根据关联分析中所涉及的数据维,可以将关联规则分类为()。
A布尔关联规则
B单维关联规则
C多维关联规则
D多层关联规则
正确答案:
BC
多选题
41.数据清理的目的是处理数据中的()。
A空缺值
B噪声数据
C不一致数据
D敏感数据
正确答案:
ABC
多选题
42.从结构的角度看,数据仓库模型包括以下几类()。
A企业仓库
B数据集市
C虚拟仓库
D信息仓库
正确答案:
ABC
多选题
43.根据关联分析中所涉及的抽象层,可以将关联规则分类为()。
A布尔关联规则
B单层关联规则
C多维关联规则
D多层关联规则
正确答案:
BD
多选题
44.数据仓库的三层架构主要包括以下哪三部分?
A数据源
B数据仓库服务器
COLAP服务器
D前端工具
正确答案:
BCD
多选题
45.以下哪些原因可能引起空缺值?
A设备异常
B命名规则的不一致
C与其他已有数据不一致而被删除
D在输入时,有些数据因为得不到重视而没有被输入
正确答案:
ACD
加入错题集关闭
窗体底端
一、某市某社区,常住人口7414人,外来人口731人,社区内60岁以上老人1191人(占16%),该社区有7名卫生服务人员(2名全科医生,2明护士,2名助理医生和一名公共卫生人员),2014年该社区卫生服务站开始责任医生进家庭试点工作,并开展社区慢性病管理工作,根据以上情况,回答下列问题:
(本题总分25分)
1、若在该社区开展健康信息的收集工作,齐基本步骤包括哪些方面?
(7分)P7(小本)
1)收集资料前的准备
2)明确调查对象
3)知情同意
4)开始调查
5)记录表的核查
6)结束,调查员签名,日期,联系电话等
7)资料的保存
2、社区慢性病管理所使用的健康调查表一般包括哪些内容?
(7分,P2、9、14)
1)个人基本信息
2)生活方式信息
3)健康体检信息
3、如何识别不合逻辑的健康信息记录?
(6分,P24)
4、看对信息判断,是否有违背常识的数据
1)直接审阅所收集人健康记录表
2)建立计算机数据库结构时对相应变量设定范围或合法输入值
3)在数据录入完成后应用计算机进行逻辑言错误识别,可通过编程序找出不和逻辑的的变量值。
5、对已收集的健康相关信息从哪几个方面进行信息管理?
(5分,P26)
1)录入人员培训
2)数据导入
3)录入数据的签到和核实