CPDA考试真题与答案Word文档下载推荐.docx

上传人:b****1 文档编号:13221620 上传时间:2022-10-08 格式:DOCX 页数:13 大小:20.10KB
下载 相关 举报
CPDA考试真题与答案Word文档下载推荐.docx_第1页
第1页 / 共13页
CPDA考试真题与答案Word文档下载推荐.docx_第2页
第2页 / 共13页
CPDA考试真题与答案Word文档下载推荐.docx_第3页
第3页 / 共13页
CPDA考试真题与答案Word文档下载推荐.docx_第4页
第4页 / 共13页
CPDA考试真题与答案Word文档下载推荐.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

CPDA考试真题与答案Word文档下载推荐.docx

《CPDA考试真题与答案Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《CPDA考试真题与答案Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。

CPDA考试真题与答案Word文档下载推荐.docx

B、DROP

C、CLEAR

D、REMORE

A

2.数据库系统是由()组成的

A、数据库、数据库管理系统和用户

B、数据文件、命令文件和报表

C、数据库文件结构和数据

D、常量、变量和函数

3.假如学生考试成绩以“优”.“良”.“及格”和“不及格”来记录,为了说明全班同学考试成绩的水平高低,其集中趋势的测度()

A、可以采用算术平均数

B、可以采用众数或中位数

C、只能采用众数

D、只能采用四分位数

C

4.以下哪个变量可以反映客户的忠诚度?

()

A、购买频次

B、购买金额

C、最后一次购买时间

D、购买金额波动率

5.以下哪个类型的变量在作预测客户流失的模型中最有解释力度?

A、人口基本数据,比如年龄和性别

B、基本社会状态数据,比如收入和职业

C、业务数据,比如消费频次

D、业务数据的衍生变量,比如最近3个月消费频次的变化情况

D

6.下面关于聚类分析说法错误的是()

A、一定存在一个最优的分类

B、聚类分析是无监督学习

C、聚类分析可以用于判断异常值

D、聚类分析即:

物以类聚,人以群分

7.某小区60%居民订晚报,45%订青年报,30%两报均订,随机抽一户。

则至少订一种报的概率为()

A、0.82

B、0.85

C、0.80

D、0.75

8.在Excel工作表中,在某单元格内输入数值123,不正确的输入形式是()

A、123

B、=123

C、+123

D、*123

9.在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么

A、违反了建模的假设条件

B、加大了处理的难度

C、无法针对分区后各个数据集的特征分别做数据清洗

D、无法对不同数据清理的方法进行比较,以选择最优方法

10.当一个连续变量的缺失值占比在85%左右时,以下哪种方式最合理()

A、直接使用该变量

B、根据是否缺失,生成指示变量,仅使用指示变量作为解释变量

C、使用多重插补的方法进行缺失值填补

D、直接删除该变量

B

11.NaiveBayes是属于数据挖掘中的什么方法?

A、聚类

B、分类

C、时间序列

D、关联规则

12.有一条关联规则为A→B,此规则的信心水平(confidence)为60%,则代表()

A、买B商品的顾客中,有60%的顾客会同时购买A

B、同时购买A,B两商品的顾客,占所有顾客的60%

C、买A商品的顾客中,有60%的顾客会同时购买B

D、两商品A,B在交易数据库中同时被购买的机率为60%

13.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()

A、数据越多越好

B、尽可能多的适合的数据

C、数据越少越好

D、以上三条都不正确

14.在有指导的数据挖掘中,有关测试集的说法错误的是()

A、测试集和训练集是相互联系的

B、测试集是用以测试模型的数据集

C、通常测试集大约占总样本的三分之一

D、K-次交叉验证中,测试集只有1个,训练集有K-1个

15.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()

A、2倍

B、3倍

C、4倍

D、5倍

16.回归分析的第一步是()

A、确定解释量和被解释变量

B、确定回归模型

C、建立回归方程

D、进行检验

17.关于主成分数目的选取,正确的是()

A、保留多少个主成分取决于累计方差在方差总和中所占百分比

B、一般选择50%以上

C、选择前两个就可以

D、选择的数目和变量的个数一致

18.下列四项中,不属于数据库特点的是()

A、数据共享

B、数据完整性

C、数据冗余很高

D、数据独立性高

19.将复杂的地址简化成北、中、南、东四区,是在进行?

A、数据正规化

B、数据一般化

C、数据离散化

D、数据整合

B

20.以下哪个指标不能用于线性回归中的模型比较()

A、R方

B、调整R方

C、AIC

D、BIC

21.RFM方法中的F说明客户的()

A、兴趣度

B、粘性

C、当前价值

D、未来价值

22.数据挖掘技术包括三个主要的部分()

A、数据、模型、技术

B、算法、技术、领域知识

C、数据、建模能力、算法与技术

D、建模能力、算法与技术、领域知识

23.下面关于因子分析的说法正确的是()

A、因子分析就是主成分分析

B、因子之间可相关也可不相关

C、因子受量纲的影响

D、可以对因子进行旋转,使其意义更明显

24.以下叙述正确的是()

A、极差较少受异常值的影响

B、四分位差较少受异常值的影响

C、方差较少受异常值的影响

D、标准差较少受异常值的影响

25.以下关于人工神经网络(ANN)的描述错误的有()

A、神经网络对训练数据中的噪声非常鲁棒

B、可以处理冗余特征

C、训练ANN是一个很耗时的过程

D、至少含有一个隐藏层的多层神经网络

26.当时间序列的环比增长速度大体相同时,适宜拟合()

A、指数曲线

B、抛物线

C、直线

D、对数曲线

27.某家长为了使孩子在第3-6年上大学的4年中,每年年初得到10000元助学基金,他应在2年前在银行存入多少钱?

(年利率按5%计算)()

A、33771

B、30291

C、32163

D、45256

28.苹果公司对IPHONE的降价行为属于()

A、地域性差别定价

B、时间性差别定价

C、非线性定价或数量折扣定价

D、其他形式的定价

29.设X={1,2,3}是频繁项集,则可由X可产生()个关联规则。

A、3

B、4

C、5

D、6

30.以下哪些分类方法可以较好地避免样本的不平衡问题?

A、KNN

B、SVM

C、Bayes

D、神经网络

三、多选题

1.以下哪个聚类分析的方法是利用统计学定义的距离进行度量()

A、层次聚类法

B、快速聚类法(K-Means)

C、基于密度的聚类法

D、基于网格的聚类法

AB

2.天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行()

A、对变量进行标准化

B、对变量进行百分位秩或Turkey正态性转换

C、对变量进行因子分析或聚类分析

D、对变量进行分箱处理

BD

3.如下表student中,如何筛选type为包含数学或语文的记录?

IDtypescore

A01数学78

A02语文76

A03英语90

A04数学68

A05英语84

A、select*fromstudentwheretype=”数学”andtype=”语文”

B、select*fromstudentwheretype=”数学”ortype=”语文”

C、select*fromstudentwheretypein(”数学”,”语文”)

D、select*fromstudentwheretypein(”数学”、”语文”)

BC

4.以下哪个分布是右偏分布()

A、均匀分布

B、卡方分布

C、F分布

D、对数正态分布

BCD

5.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示()

A、有充足的理由否定原假设

B、原假设必定是错误的

C、犯错误的概率不大于a

D、犯错误的概率不大于b

E、在H。

成立的情况下发生了小概率事件

ACE

6.若检验统计量F近似等于1,说明()

A、组间方差中不包含系统因素的影响

B、组内方差中不包含系统因素的影响

C、组间方差中包含系统因素的影响

D、方差分析中不应拒绝原假设

AD

7.下列何种算法可以帮助我们做数值的预测(Prediction)?

A、Apriori

B、DecisionTree

C、NaiveBayes

D、LinearRegression

8.某种产品的生产总费用2003年为50万元,比2002年多2万元,而单位产品成本2003年比2002年降低5%,则()

A、生产费用总指数为104.17%

B、生产费用指数为108.56%

C、单位成本指数为95%

D、产量指数为109.65%

E、由于成本降低而节约的生产费用为2.63万元

ACDE

9.配合一元线性回归方程须具备下列前提条件()

A、现象间确实存在数量上的相互依存关系

B、现象间的关系是直线关系,这种直线关系可用散点图来表示

C、具备一组自变量与因变量的对应资料,且能明确哪个是自变量,哪个是因变量

D、两个变量之间不是对等关系

ABCD

10.回归变差(或回归平方和)是指()

A、被解释变量的实际值与平均值的离差平方和

B、被解释变量的回归值与平均值的离差平方和

C、被解释变量的总变差与剩余变差之差

D、解释变量变动所引起的被解释变量的变差

11.产品成本费用按其与产量变化的关系分为()

A、可变成本

B、固定成本

C、付现

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1