商务智能题库整理文档格式.docx

资源描述

商务智能题库整理文档格式.docx

《商务智能题库整理文档格式.docx》由会员分享，可在线阅读，更多相关《商务智能题库整理文档格式.docx（12页珍藏版）》请在冰豆网上搜索。

商务智能题库整理文档格式.docx

A．substring（）

B．rand（）

C．sum（）

D．trunc（）

6.关于数据仓库数据的时变性，如下描述不正确的是D

A操作型系统存储的是当前数据，而数据仓库中的数据是历史数据

B数据仓库中的数据是按照时间顺序追加的，它们都带有时间属性

C数据仓库的数据时限一般要远远长于操作型数据的数据时限

D数据仓库对响应时间要求不严格，处理时间从几秒到几分钟，有时甚至几小时

7.数据仓库是面向主题的，逻辑意义上每一个商业主题都对应与企业决策包含的分析对象，一家保险公司的数据仓库的主题可能包含哪些B

A顾客储蓄账

B顾客、账户、索赔

C顾客保险金额

D顾客账单

8.假如警察要得到某犯罪嫌疑人在指定时间段的通话记录最有可能在（C）系统中获得

A决策支持系统

B电信营业账务系统

C电信数据仓库系统

D元数据管理系统

9.下面关于数据粒度的描述不正确的是B

A数据综合度越高，粒度也就越大，级别也就越高

B数据越详细，粒度就越小，级别也就越高

C粒度是指数据仓库小数据单元的详细程度和级别

D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量

10.数据仓库并非只是数据的简单累积，而是要经过一系列的处理过程，即ETL，ETL过程包括哪些C

A数据操作、数据挖掘、数据转义

B数据存储、数据维护、数据分析

C数据抽取、数据转换、数据装载

D数据定义、数据建模、数据管理

11.企业要建立预测模型，需准备建模数据集，以下四条描述建模数据集正确的A

A尽可能多的适合的数据

B得分集数据是建模集数据的一部分

C数据越多越好

D以上三条都正确

12.关于基本数据的元数据是指D

A基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息

B基本元数据包括日志文件和简历执行处理的时序调度信息

C基本元数据包括与企业相关的管理方面的数据和信息

D基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息

13.数据立方体中的数据单元格中的数据可以通过如下哪些函数获得？

A分布聚集函数count（）、sum（）、min（）、max（）和代数聚集函数avg（）、stddev（）

B分析函数

C分布聚集函数count（）、sum（）、min（）、max（）

D聚集函数avg（）、stddev（）

14.关于OLAP和OLTP的说法，下列不正确的是B

A．OLTP以应用为核心,是应用驱动的

B．OLAP事务量大，但事务内容比较简单且重复率高

C．OLAP的最终数据来源与OLTP不一样

D．OLTP面对的是决策人员和高层管理人员

15.数据挖掘是通过（）的方式在海量数据中主动找寻模型，自动发掘隐藏在数据中的价值信息，OLAP分析结果为挖掘提供分析依据。

A演绎

B集成

C归纳

D转换

16.数据仓库的逻辑模型雪花模型是星型模型的扩展，某些维表中的数据可以进一步分解到附加的表中，其操作原理是（）C

A.减小数据粒度

B.便于数据集成

C.减少冗余，节省存储空间

D.定义外键约束，方便数据操作

17.有关数据仓库的开发特点，不正确的描述是C

A.数据仓库的开发是一个不断循环的过程,是启发式的开发

B.在数据仓库环境中，并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据

C.数据仓库开发要从数据出发

D.数据仓库使用的需求在开发初期就要明确

18.（）技术可用于数据挖掘过程展示、数据挖掘结果展示C

A.数据仓库

B.ETL

C.可视化

D.数据挖掘

19.关于OLAP的特性，下面正确的是（）

（1）快速性

（2）可分析性（3）多维性（4）共享性D

A.（3）（4）

（2）（3）（4）

（1）

（2）（3）（4）

（1）

（2）（3）

20.OLAP技术的核心是A

A.多维分析

B.在线性

C.互操作性

D.用户的快速响应

21.如下图所示数据仓库的逻辑模型是？

A.星型模型

B.雪花模型

C.衍生模型

D.星系模型

22.数据立方体中的数据单元格和坐标分别被称为（）B

A.维，角度

B.度量，维

C.数据，多维数据

D.事实，取值

二．判断题

T1.星型模型的核心是事实表，事实表把各种不同的维表连接起来

F2.决策是在充分的信息和知识基础上的判断，因此决策是没有风险的。

T3.数据仓库主要有面向主题、集成性、数据的非易失性、数据的时变性等特征。

T4.企业的数据处理大致分为两类，一类是从操作型处理，也称做联机事务处理，另一类是分析型处理，一般针对某些主题的历史数据进行分析，支持管理决策。

T5.在线分析处理比较常用的操作包括对多维数据的切片与切块、上钻与下钻以及旋转等。

T6.业务系统一般存储细粒度的事务型数据，而数据仓库中的数据是用于查询、分析，因此需要多种不同粒度的数据，这些不同粒度的数据可以通过对细粒度的事务型数据进行聚合而产生。

F7.数据仓库只是数据的简单积累，不需要抽取、转换和装载的过程，即可完成数据仓库数据的组装

T8.元数据是关于数据的数据，主要包括数据源的描述、数据的抽取规则、数据的转换规则、数据加载频率、数据仓库模型等

F9.数据仓库的数据为历史数据，从来不需要更新

F10.数据仓库的数据量越大，其应用价值也越大

T11.数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合，用以支持管理决策的过程

F12.OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理

F13.数据仓库的维度建模方式与关系数据库的实体-关系建模无关，维度分析撇开原有的关系模型，单独构建事实表和维表。

T14.对于企业而言，由于不同用户提供的数据可能来自不同的数据源，数据内容、数据格式和质量千差万别，数据的准确性、真实性和完整性都不同，实施数据共享和数据分析就需要对数据进行整合，有效的数据集成就显得十分重要。

F15.数据立方体由3维构成，Z轴表示事实数据

T16.数据是记录、描述和识别事物的符号，信息是经过某种提炼、加工和集成后的数据。

知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。

T17.数据仓库中的数据的装载方式分为初始装载、增量装载、完全刷新这几种方式

T18.商业智能系统与一般交易系统之间在系统设计上的主要区别在于：

后者把结构强加于商务之上，一旦系统设计完毕，其程序和规则不会轻易改变；

而前者则是一个学习型系统，能自动适应商务不断变化的要求

F19.数据仓库“粒度”越细，记录数越少

F20.数据仓库的数据量越大，其应用价值也越大

T21.商务智能指收集、转换、分析和发布数据的过程，目的是为了更好的决策

F22.数据仓库中间层OLAP服务器只能采用关系型OLAP

T23.数据仓库中事实表所指的事实数据指的是不同维度在某一取值下的度量。

F24.数据是商务智能系统的基础，只能包括企业内部数据，内部数据包括企业各种应用系统、办公自动化等产生的业务数据、文档等。

F25.OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理

T26.维是人们观察数据的特定角度，是考虑问题时的一类属性

一．选择题（第二次作业）

1.某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？

A．聚类

B．关联规则发现

C．分类

D．自然语言处理

2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务C

A.数据流挖掘

B.频繁模式挖掘

C.数据预处理

D.分类和预测

3.评价一个数据挖掘项目的成败，主要看数据挖掘的结果是否解决了C

A.部署问题

B.建模问题

C.业务问题

D.数据问题

4.如下缺陷记录表，条件项i2，结果项i3，i5的支持度，置信度是A

A.33.3%，50%

B.41.7%，100%

C.41.7%，83.4%

D.33.3%，71.53%

5.设X={1，2，3}是频繁项集，则可由X产生____个关联规则B

A.7

B.6

C.5

D.4

6.下面哪种不属于数据预处理的方法？

A.离散化

B.估计遗漏值

C.变量代换

D.聚集

7.如图统计数据其中a1~a6是对象Jack、Mary和Tim的属性，都为非对称二元变量，他们之间的距离用Jaccard系数计算分别为A

A.d（Jack,Mary）=1/3,d（Jack,Tim）=2/3,d（Mary,Tim）=3/4

B.d（Jack,Mary）=1/3,d（Jack,Tim）=1/3,d（Mary,Tim）=3/5

C.d（Jack,Mary）=1/4,d（Jack,Tim）=2/5,d（Mary,Tim）=3/5

D.d（Jack,Mary）=1/6,d（Jack,Tim）=1/3,d（Mary,Tim）=1/2

8.假设从潜在的顾客群中抽取一定数量的样本进行市场推广，发现有30%的响应者，而利用分类模型挑选同样数量的潜在客户进行推广，有65%的响应者，那么此分类模型的提升度为B

A.lift=65%+30%=95%

B.lift=65%/30%=2.17

C.lift=65%-30%=35%

D.lift=30%/65%=0.46

9.若关联规则U->

V的支持度和置信度分别大于或等于用户指定的最小支持度minsupport和最小置信度minconfidence，则称关联规则U->

V为C

A.弱关联规则

B.多层次关联规则

C.强关联规则

D.分离关联规则

10.Hadoop重要的基础是？

A.非关系型数据库

B.Hive数据仓库

C.ETL工具

D.MapReduce编程框架和分布式文件系统HDFS

12.K—均值类别侦测要求输入的数据类型必须是A

A.数值型

B.逻辑型

C.整型

D.字符型

13.（）是一个观测值，它与其他观测值的差别如此之大，以至于怀疑它是由不同的机制产生的D

A.质心

B.核心点

C.边界点

D.离群点

14.当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？

A.关联分析

B.聚类

C.隐马尔可夫链

D.分类

15.通过引进表示样本间相似程度的度量标准把性质相似的对象归为一类，这些度量标准称为聚类统计量，最常用的聚类统计量可分为（）和相似系数等，这些统计量处理数值型数据比较有效D

A.无偏估计

B.概率

C.置信度

D.距离

16.下面选项中t不是s的子序列的是B

A.s=<

{2,4},{3,5,6},{8}>

t=<

{2},{8}>

B.s=<

{1,2},{3,4}>

{1},{2}>

C.s=<

{2,4},{2,4}>

{2},{4}>

D.s=<

{2},{3,6},{8}>

17.只有非零值才重要的二元属性被称作D

A.计数属性

B.对称属性

C.离散属性

D.非对称的二元属性

18.在完成了构造和评价一个回归模型后，可以A

A.以给定的自变量的值估计因变量的值

B.估计未来所需样本的容量

C.以给定的因变量的值估计自变量的值

D.计算相关系数和判定系数

19.Apriori算法的最基本思想是找出所有的频繁项集，然后由频繁项集产生强关联规则，这些规则必须满足B

A.提升度大于1

B.最小支持度和最小置信度

C.置信度大于90%

D.支持度大于25%

F1.离散属性总是具有有限个值

T2.置信度反映了关联规则的正确程度，即购买了项集U中的商品的顾客同时也购买了V中商品的可能性（条件概率）有多大

T3.频繁项集的任何子集也一定是频繁的，非频繁项集的超集一定是非频繁的

T4.没有高质量的数据，就没有高质量的挖掘结果

F5.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法，待分样本的分类结果取决于各类域中样本的全体

F6.聚类（clustering）是这样的过程：

它找出描述并区分数据类或概念的模型（或函数），以便能够使用模型预测类标记未知的对象类

F7.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则

T8.离群点可以是合法的数据对象或者值

T9.数据挖掘的目标不在于数据采集策略，而在于对于已经存在的数据进行模式的发掘

F10.决策树方法特别适合于处理数值型数据

F11.回归分析通常用于挖掘关联规则

F12.在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差

T13.商业智能系统与一般交易系统之间在系统设计上的主要区别在于：

T14.序列模式挖掘是从序列数据库中发现事件之间在时序上的规律

T15.数据挖掘的主要任务是从数据中发现潜在的规则，从而能更好的完成描述数据、预测数据等任务

T16.分类和回归都可用于预测，分类的输出是离散的类别值，而回归的输出是连续数值

F17.离群点在数据挖掘时总是被视为异常、无用数据而丢弃

F18.Web数据挖掘是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息

F19.决策树方法通常用于关联规则挖掘

展开阅读全文