CDALevel1模拟题.docx
《CDALevel1模拟题.docx》由会员分享,可在线阅读,更多相关《CDALevel1模拟题.docx(12页珍藏版)》请在冰豆网上搜索。
CDALevel1模拟题
“考试时间2小时。
本次80道选择题,60道单选,20道多选。
时间来不及,有的公式估计还是要背的,复杂的就随它去吧。
。
看下来可能有计算题,即使有也不会多。
说是不用怎么背,其实个人感觉就一级的层面这些软件一刷就出来了,特别枯燥的原理去背诵没有实际意义,但是分子分母的一些关系幕数需要知道。
”
CDALEVEL业务分析师模拟题:
、单选
77560元,月平均工资为6463元.
1.北京市统计局发布2014年度全市职工平均工资为
众多网友直呼“被平均”,你认为下面哪种统计量测度平均工资会更被信服()
A几何平均数
B众数
C极差
D中位数答案:
D
2.某企业2000年实现利润为200万元,2005年为300万元,则年平均增长速度为()
A.5%B.11%C.10%D.8.4%
答案:
D
3.当一组数据属于左偏分布时,则()
4.
答案:
D
5.作为一家制造类企业,以下哪个图适合比较不同产品各年的销售变化情况()
A.分组饼形图
B.堆叠面积图
C.堆叠柱形图
D.分组柱形图答案:
D
6.横截面数据主要注意以下哪个数据问题()
A.异方差
B.不独立
C.非正态分布
D.不随机答案:
A.
7.以下叙述正确的是()
A.极差较少受异常值的影响
B.四分位差较少受异常值的影响
C.方差较少受异常值的影响
D.标准差较少受异常值的影响答案:
Bo
8.某汽车品牌预测到未来不同型号汽车的利润率和销售量会发生变化,希望根据利润
最大化得到最优产量,这属于哪类数据分析过程()
A.预测型建模
B.预报
C.优化
D.报警答案:
C
9.为研究某种减肥茶减肥效果是否显著,可以采用()分析方法。
A、单样本t检验B、两独立样本t检验C、两配对样本t检验D、方差分析
答案:
C
A.样本相互独立
B.样本具有相同分布
C.样本足够大
D.样本服从正态分布答案:
D
10.下列场合下,()适合用t检验统计量
A.样本为小样本,且总体方差已知
B.样本为大样本,且总体方差已知
C.样本为小样本,且总体方差未知
D.样本为大样本,且总体方差未知
答案:
C
方差来离差平
自由度均方差F值
源方和
14245.8
组间
34748.612.16
答案:
12.某信用卡公司为了分析客户教育程度对授信额度是否有显著性差异,已知教育程度
分为5种,每个教育程度取30个客户,则因素的水平为()
A5
B6
C30
D150
13.给出下列结论:
拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的
拟合效果越好;
(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合
效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的
带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
以上结论中,正确的有(B)个.
A.
1B.2C.3D.4
A.合理限度内,施肥量和平均单位产量之间的关系
B.产品产量与单位产品成本之间的关系
C.商品的流通费用与销售利润之间的关系
D.流通费用率与商品销售量之间的关系答案:
A
15.下列关于SQL的说法错误的是()
ASQL对大小写不敏感
BSQL为非过程化编程语言
C不同的数据库的SQL完全一致
D一种数据库查询和程序设计语言,用于存取数据以及查询?
更新和管理关系数据库系
答案:
C
16.要查询book表中所有书名中以“中国”开头的书籍的价格,可用()语句。
SELECTpriceFROMbookWHEREbook_name中国*'
(B)
SELECTpriceFROMbookWHEREbook_nameL‘中国*'
(C)
SELECTpriceFROMbookWHEREbook_name中国%'
(D)
SELECTpriceFROMbookWHEREbook_nameLlKl中国%
答案:
D
17.为名为“zhangsan”的用户分配对数据库“studb”的“stuinfo”表查询和插入
数据权限的语句是()
A.grantselectjnsertonstudb.stuinfofor
'zhangsan'@localhost'
B.grantselect,insertonstudb.stuinfoto
‘zhangsan'@localhost'
C.grant‘zhangsan'@localhost
'toselect,insertforstudb.stuinfo
D.grant‘zhangsan'@localhost
'tostudb.stuinfoonselect,insert
答案:
B
号,
18.对于表A(tel,net,?
),其中tel为手机号,net为订购的上网流量套餐,如50M100M等,若未订购则为空为了分析客户上网对客户总费用的影响情况下列哪种对空值的处理方式最合理的?
()
A将空缺观测全部删除
B用所有客户上网套餐的中位数来替代
C用所有客户上网套餐的众数来替代
D单独作为一类或者填为0答案:
D
19.以下哪种方法不属于预测性(有监督学习)模型
A.决策树
B.线性归
C.关联分析
D.判别分析答案:
C
20.主成分分析计算分为根据相关系数和协方差矩阵两种方式,以下哪种情况适合用协
方差矩阵计算()
A.全部变量的量纲相同
B.全部变量的方差相同
C.全部变量的值域相同
D.任何变量都可以
答案:
C.
21.下面关于因子分析的说法正确的是()
A因子分析就是主成分分析
B因子之间互相关也可不相关
C因子受量纲的影响
D可以对因子进行旋转,使其意义更明显答案:
D
22.以下哪种聚类方法需要实现指定聚类个数()
A.层次聚类
B.K均值聚类
C.基于密度的聚类
D.基于网格的聚类答案:
B.
23.对快速聚类说法错误的是()
A占内存少?
计算量小?
处理速度快
B可以样本聚类,也可以对变量聚类
C适合大样本
D需要事先确定多少个类别答案:
B
24.关于逻辑斯回归分析(logisticregrssionmodle)
说法正确的是()
A:
逻辑斯回归的因变量为数值变量
B:
逻辑斯回归的因变量为定性变量
C:
逻辑斯回归的因变量只能有两种取值
D:
逻辑斯回归自变量只能是一个
答案:
B
25.通过广告费分析销售收入,丙公司的销售经理根据
36个月销售收入和广告费用的
关系开发了简单线性回归模型。
该模型如下所示,且给模型的判定系数为
0.90。
丫=2000兀+2.50X
其中,丫代表销售收入,X代表广告费用。
如果丙公司某月的广告费用为200元,那么销售收入的估计值为()
A.2550兀
B.2500兀
C.2350兀
D.500兀
答案:
B
26.以下哪一种方法不能用来分析时间序列数据?
()
A.德尔菲法
B.移动平均法
D.指数平滑法答案:
A
27.根据时间序列乘法模型的原理,为了测度季节变动,需要从时间序列中
A.减去长期趋势和循环变动
B.减去长期趋势、循环变动和不规则变动
C.除去长期趋势和循环变动
D.除去长期趋势、循环变动和不规则变动答案:
D
28.关于数据挖掘的方法论CRISP-DM说法正确的是()
A这是SPSS公司,DaimlerChrysler提出的数据挖掘流程
B主要分为六步,业务理解,数据理解,数据准备,模型搭建,模型评估与模型发布
C该方法论已经成功的在SASEM中进行了实施
D这六个过程有严格的前后顺序,一气呵成,分析过程中不能逆转或者跳转答案:
B
29.RFM方法中的F说明客户的()
A.兴趣度
B.粘性
C.
C.当前价值
D.未来价值
答案:
A
30.某汽车品牌委托某公司及时收集客户在微博上关于该品牌汽车的负面留言,这属于
哪类商业智能系统()
A.常规报表
B.即席查询
C.多维分析
D.预警
答案:
D
选择,与另一跨国公司联合投资或不联合投资。
总会计师提供了以下信息:
500000兀。
()
F列哪项分别正确地反映了联合投资与不联合投资的期望值?
A.800000元和-1700000元
B.-700000元和-500000元
C.800000元和-500000元
D.-700000元和-1700000元答案:
C
32.某公司在进行市场调研,以决定是否推出一款新产品。
调研得出的结论是:
出现有
利结果的概率为60%出现不利结果的概率为40%。
如果结果有利,则产品成功的概率为
70%如果结果不利,则产品失败的概率会达到75%。
如果产品成功,该公司预期年利润
将达到5000000元;如果产品失败,该公司每年将损失2000000元。
那么,这款新产品的年利润期望值为()
A.1500000
B.1640000
C.2000000
D.2650000
答案:
B
、多选题
1.以下哪个分布是右偏分布()
A.均匀分布
B.卡方分布
C.F分布
D.对数正态分布答案:
BCD
2.在假设检验中
当我们做出拒绝原假设而接受备择假设的结论时,表示(ACE)
A有充足的理由否定原假设
B原假设必定是错误的
C犯错误的概率不大于a
D犯错误的概率不大于b
E在H。
成立的情况下发生了小概率事件
3.若检验统计量F近似等于1,说明()
A.组间方差中不包含系统因素的影响
B.组内方差中不包含系统因素的影响
C.组间方差中包含系统因素的影响
D.方差分析中不应拒绝原假设答案:
AD
4.以下哪些变量使用RFM方法构造出来的()
A.最近3期境外消费金额
B.最近6期网银消费交易笔数
C.信用额度
D.距最近一次逾期的月数答案:
ABD
type为包含数学或语文的记录?
IDtype
■
■
■
scor
e
A01数
学78
A02语
文76
J
A03英
语90
A04数
学68
A05英
语84
5.如下表student
中,如何筛选
Aselect*fromstudentwheretype=
数学”andtype=”语文”
Bselect*fromstudentwheretype=
数学”ortype二”语文”
Cselect*fromstudentwheretypein(
”数学”,”语文”)
Dselect*fromstudentwheretypein(
”数学”?
”语文”)
答案:
BC
6.主成分分析计算分选择相关系数计算法时,确定主成分个数的大致原则包括()
A.特征根值大于1
B.特征根值大于0.8
C.累积特征根值加总占总特征根值的
80%以上
D.累积特征根值加总占总特征根值的
90%以上
答案:
AC
7.以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
A.层次聚类法
B.快速聚类法
C.基于密度的聚类法
D.基于网格的聚类法答案:
AB
8.以下关于皮尔森相关分析叙述正确的是()
A.两变量独立,两者的皮尔森相关系数必然等于0
B.两变量皮尔森相关系数不等于0,两者必然不独立
D.皮尔森相关系数是否等于零,不能指明两变量是否独立
E.两变量不独立,两者的皮尔森相关系数必然不等于答案:
AB
9.在客户关系管理中,客户的生命周期都包括那几个阶段()
A.潜在客户
B.响应客户
C.即得客户
D.流失客户答案:
ABCD.
10.天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不
应该进行:
()
A.对变量进行标准化
B.对变量进行百分位秩或Turkey正态性转换
C.对变量进行因子分析或变量聚类
D.对变量进行分箱处理答案:
BD