CPDA考试真题与答案2.docx

上传人:b****8 文档编号:9560550 上传时间:2023-02-05 格式:DOCX 页数:16 大小:39.60KB
下载 相关 举报
CPDA考试真题与答案2.docx_第1页
第1页 / 共16页
CPDA考试真题与答案2.docx_第2页
第2页 / 共16页
CPDA考试真题与答案2.docx_第3页
第3页 / 共16页
CPDA考试真题与答案2.docx_第4页
第4页 / 共16页
CPDA考试真题与答案2.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

CPDA考试真题与答案2.docx

《CPDA考试真题与答案2.docx》由会员分享,可在线阅读,更多相关《CPDA考试真题与答案2.docx(16页珍藏版)》请在冰豆网上搜索。

CPDA考试真题与答案2.docx

CPDA考试真题与答案2

CPDA考试真题与答案-2

一、判断题

1.数据根据计量尺度不同可以分为分类数据和数值型数据。

正确答案:

×

2.多次抛一枚硬币,正面朝上的频率是1/2。

正确答案:

×

3.归纳法是一种从个别到一般的推理方法。

正确答案:

4.datahoop中输入的数据必须是数值型的。

正确答案:

×

5.置信水平是假设检验中犯第一类错误的概率。

正确答案:

×

6.当两种产品为互补品时,其交叉弹性小于零。

正确答案:

7.时间序列分解法可以有乘法模型和加法模型两种表示方式,其中乘法模型都是相对值来表示预测值的,加法模型都是用绝对值来表示预测值的。

正确答案:

×

8.需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。

正确答案:

×

9.盈亏平衡分析是静态分析,不考虑资金的时间价值和项目寿命周期内的现金流量的变化。

正确答案:

14.标准差越小,表示离散程度越小,风险越大;反之离散程度越大,风险越小。

正确答案:

×

15.离群点是一个实际观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。

正确答案:

二、单选题

1.SQL语言中,删除一个表中所有数据,但保留表结构的命令是()

A、DELETE

B、DROP

C、CLEAR

D、REMORE

正确答案:

A

2.数据库系统是由()组成的

A、数据库、数据库管理系统和用户

B、数据文件、命令文件和报表

C、数据库文件结构和数据

D、常量、变量和函数

正确答案:

A

3.假如学生考试成绩以“优”.“良”.“及格”和“不及格”来记录,为了说明全班同学考试成绩的水平高低,其集中趋势的测度()

A、可以采用算术平均数

B、可以采用众数或中位数

C、只能采用众数

D、只能采用四分位数

正确答案:

C

4.以下哪个变量可以反映客户的忠诚度?

()

A、购买频次

B、购买金额

C、最后一次购买时间

D、购买金额波动率

正确答案:

A

5.以下哪个类型的变量在作预测客户流失的模型中最有解释力度?

A、人口基本数据,比如年龄和性别

B、基本社会状态数据,比如收入和职业

C、业务数据,比如消费频次

D、业务数据的衍生变量,比如最近3个月消费频次的变化情况

正确答案:

D

6.下面关于聚类分析说法错误的是()

A、一定存在一个最优的分类

B、聚类分析是无监督学习

C、聚类分析可以用于判断异常值

D、聚类分析即:

物以类聚,人以群分

正确答案:

A

7.某小区60%居民订晚报,45%订青年报,30%两报均订,随机抽一户。

则至少订一种报的概率为()

A、0.82

B、0.85

C、0.80

D、0.75

正确答案:

D

8.在Excel工作表中,在某单元格内输入数值123,不正确的输入形式是()

A、123

B、=123

C、+123

D、*123

正确答案:

D

9.在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么

A、违反了建模的假设条件

B、加大了处理的难度

C、无法针对分区后各个数据集的特征分别做数据清洗

D、无法对不同数据清理的方法进行比较,以选择最优方法

正确答案:

D

10.当一个连续变量的缺失值占比在85%左右时,以下哪种方式最合理()

A、直接使用该变量

B、根据是否缺失,生成指示变量,仅使用指示变量作为解释变量

C、使用多重插补的方法进行缺失值填补

D、直接删除该变量

正确答案:

B

11.NaiveBayes是属于数据挖掘中的什么方法?

A、聚类

B、分类

C、时间序列

D、关联规则

正确答案:

B

12.有一条关联规则为A→B,此规则的信心水平(confidence)为60%,则代表()

A、买B商品的顾客中,有60%的顾客会同时购买A

B、同时购买A,B两商品的顾客,占所有顾客的60%

C、买A商品的顾客中,有60%的顾客会同时购买B

D、两商品A,B在交易数据库中同时被购买的机率为60%

正确答案:

C

13.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()

A、数据越多越好

B、尽可能多的适合的数据

C、数据越少越好

D、以上三条都不正确

正确答案:

B

14.在有指导的数据挖掘中,有关测试集的说法错误的是()

A、测试集和训练集是相互联系的

B、测试集是用以测试模型的数据集

C、通常测试集大约占总样本的三分之一

D、K-次交叉验证中,测试集只有1个,训练集有K-1个

正确答案:

A

15.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()

A、2倍

B、3倍

C、4倍

D、5倍

正确答案:

C

16.回归分析的第一步是()

A、确定解释量和被解释变量

B、确定回归模型

C、建立回归方程

D、进行检验

正确答案:

A

17.关于主成分数目的选取,正确的是()

A、保留多少个主成分取决于累计方差在方差总和中所占百分比

B、一般选择50%以上

C、选择前两个就可以

D、选择的数目和变量的个数一致

正确答案:

A

18.下列四项中,不属于数据库特点的是()

A、数据共享

B、数据完整性

C、数据冗余很高

D、数据独立性高

正确答案:

C

19.将复杂的地址简化成北、中、南、东四区,是在进行?

A、数据正规化

B、数据一般化

C、数据离散化

D、数据整合

正确答案:

B

20.以下哪个指标不能用于线性回归中的模型比较()

A、R方

B、调整R方

C、AIC

D、BIC

正确答案:

A

21.RFM方法中的F说明客户的()

A、兴趣度

B、粘性

C、当前价值

D、未来价值

正确答案:

A

22.数据挖掘技术包括三个主要的部分()

A、数据、模型、技术

B、算法、技术、领域知识

C、数据、建模能力、算法与技术

D、建模能力、算法与技术、领域知识

正确答案:

C

23.下面关于因子分析的说法正确的是()

A、因子分析就是主成分分析

B、因子之间可相关也可不相关

C、因子受量纲的影响

D、可以对因子进行旋转,使其意义更明显

正确答案:

D

24.以下叙述正确的是()

A、极差较少受异常值的影响

B、四分位差较少受异常值的影响

C、方差较少受异常值的影响

D、标准差较少受异常值的影响

正确答案:

B

25.以下关于人工神经网络(ANN)的描述错误的有()

A、神经网络对训练数据中的噪声非常鲁棒

B、可以处理冗余特征

C、训练ANN是一个很耗时的过程

D、至少含有一个隐藏层的多层神经网络

正确答案:

A

26.当时间序列的环比增长速度大体相同时,适宜拟合()

A、指数曲线

B、抛物线

C、直线

D、对数曲线

正确答案:

A

27.某家长为了使孩子在第3-6年上大学的4年中,每年年初得到10000元助学基金,他应在2年前在银行存入多少钱?

(年利率按5%计算)()

A、33771

B、30291

C、32163

D、45256

正确答案:

A

28.苹果公司对IPHONE的降价行为属于()

A、地域性差别定价

B、时间性差别定价

C、非线性定价或数量折扣定价

D、其他形式的定价

正确答案:

B

29.设X={1,2,3}是频繁项集,则可由X可产生()个关联规则。

A、3

B、4

C、5

D、6

正确答案:

D

30.以下哪些分类方法可以较好地避免样本的不平衡问题?

()

A、KNN

B、SVM

C、Bayes

D、神经网络

正确答案:

A

三、多选题

1.以下哪个聚类分析的方法是利用统计学定义的距离进行度量()

A、层次聚类法

B、快速聚类法(K-Means)

C、基于密度的聚类法

D、基于网格的聚类法

正确答案:

AB

2.天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行()

A、对变量进行标准化

B、对变量进行百分位秩或Turkey正态性转换

C、对变量进行因子分析或聚类分析

D、对变量进行分箱处理

正确答案:

BD

3.如下表student中,如何筛选type为包含数学或语文的记录?

IDtypescore

A01数学78

A02语文76

A03英语90

A04数学68

A05英语84

A、select*fromstudentwheretype=”数学”andtype=”语文”

B、select*fromstudentwheretype=”数学”ortype=”语文”

C、select*fromstudentwheretypein(”数学”,”语文”)

D、select*fromstudentwheretypein(”数学”、”语文”)

正确答案:

BC

4.以下哪个分布是右偏分布()

A、均匀分布

B、卡方分布

C、F分布

D、对数正态分布

正确答案:

BCD

5.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示()

A、有充足的理由否定原假设

B、原假设必定是错误的

C、犯错误的概率不大于a

D、犯错误的概率不大于b

E、在H。

成立的情况下发生了小概率事件

正确答案:

ACE

6.若检验统计量F近似等于1,说明()

A、组间方差中不包含系统因素的影响

B、组内方差中不包含系统因素的影响

C、组间方差中包含系统因素的影响

D、方差分析中不应拒绝原假设

正确答案:

AD

7.下列何种算法可以帮助我们做数值的预测(Prediction)?

A、Apriori

B、DecisionTree

C、NaiveBayes

D、LinearRegression

正确答案:

BD

8.某种产品的生产总费用2003年为50万元,比2002年多2万元,而单位产品成本2003年比2002年降低5%,则()

A、生产费用总指数为104.17%

B、生产费用指数为108.56%

C、单位成本指数为95%

D、产量指数为109.65%

E、由于成本降低而节约的生产费用为2.63万元

正确答案:

ACDE

9.配合一元线性回归方程须具备下列前提条件()

A、现象间确实存在数量上的相互依存关系

B、现象间的关系是直线关系,这种直线关系可用散点图来表示

C、具备一组自变量与因变量的对应资料,且能明确哪个是自变量,哪个是因变量

D、两个变量之间不是对等关系

正确答案:

ABCD

10.回归变差(或回归平方和)是指()

A、被解释变量的实际值与平均值的离差平方和

B、被解释变量的回归值与平均值的离差平方和

C、被解释变量的总变差与剩余变差之差

D、解释变量变动所引起的被解释变量的变差

正确答案:

BCD

11.产品成本费用按其与产量变化的关系分为()

A、可变成本

B、固定成本

C、付现成本

D、沉没成本

正确答案:

AB

12.统计决策的基本原则是()

A、可行性

B、发展性

C、合理性

D、经济性

正确答案:

ACD

13.随机抽样方法有()

A、等距随机抽样

B、综合随机抽样

C、简单随机抽样

D、分群随机抽样

正确答案:

ACD

14.完全竞争性的市场具有()等特点。

A、任一企业无法操纵市场

B、少数企业可以影响交易数量

C、多个竞争企业同时存在

D、企业必须采取随行就市定价法

正确答案:

ACD

15.在全面调查和抽样调查中都存在的误差是()

A、系统误差

B、登记性误差

C、责任心误差

D、技术性误差

正确答案:

BCD

16.在作逻辑回归时,如果区域这个变量,当Region=A时Y取值均为1,无法确定是否出现的是哪个问题?

A、共线性

B、异常值

C、拟完全分离(Quasi-completeseparation)

D、缺失值

正确答案:

ABD

17.下面给出的t检验的结果,()表明接受原假设,显著性水平为0.05。

A、0.000

B、0.039

C、0.092

D、0.124

正确答案:

CD

18.下面关于季度模型的叙述,不正确的是( )

A、季度模型以季度数据为样本

B、季度模型主要用于季度预测

C、季度模型注重长期行为的描述

D、季度模型一般规模较大

正确答案:

AB

19.营销观念是营销过程中如何处理()利益关系。

A、企业

B、员工

C、顾客

D、社会

正确答案:

ACD

20.投资项目的现金流量中经营成本与会计中的“总成本费用”概念有根本的不同,不包括

A、利息支出

B、摊销费

C、折旧费

D、维修费

正确答案:

ABC

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1