CPDA测验真题与答案3Word文档下载推荐.docx
《CPDA测验真题与答案3Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《CPDA测验真题与答案3Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
C
2.表示职称为副教授、性别为男的表达式为()
A、职称='
副教授'
OR性别='
男'
B、职称='
AND性别='
C、BETWEEN'
AND'
D、IN('
'
)
B
3.对于下列实验数据:
1,108,11,8,5,6,8,8,7,11,描述其集中趋势用()最为适宜,其值是()。
A、平均数,14.4
B、中位数,8.5
C、众数,8
D、以上都可以
4.()是进行项目投资效益评价的最终依据。
A、现金流量
B、盈亏平衡点
C、净现金流量
D、现金流入量
5.有一组数据其均值是20,对其中的每一个数据都加上10,那么得到的这组新数据的均值是()。
A、20
B、10
C、15
D、30
D
6.分类变量使用以下哪个统计量进行缺失值填补较合适
A、均值
B、最大值
C、众数
D、中位数
7.假设{BCE}为一频繁项目集(FrequentItemset),则根据AprioriPrinciple以下何者不是子频繁项目?
A、BC
B、CE
C、C
D、CD
8.请问以下何者属于时间序列的问题?
A、信用卡发卡银行侦测潜在的卡奴
B、基金经理人针对个股做出未来价格预测
C、电信公司将人户区分为数个群体
D、以上均不是
9.数据正规化(DataNormalization)是在知识发掘处理(KnowledgeDiscoveryProcess)中的哪一个阶段进行?
A、数据清洗
B、数据选择
C、数据编码
D、数据扩充
10.已知事件A的概率P(A)=0.6,U为必然事件,则P(A+U)=1,P(AU)=_______
A、0.4
B、0.6
C、0
D、1
11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()
A、直线
B、二次抛物线
C、三次抛物线
D、指数曲线
A
12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()
A、方差分析
B、回归分析
C、聚类分析
D、主成分分析
13.若数据量较大,下面哪种方式比较适合()
A、系统聚类
B、快速聚类(k-means)
C、A和B都可以
D、A和B都不可以
14.在建立线性回归(LinearRegression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?
A、皮尔森相关系数
B、卡方检定
C、T-检定
D、Z-Score
15.ROC曲线凸向哪个角,代表模型越理想?
A、左上角
B、右上角
C、左下角
D、右下角
16.决策树中的InformationGain的计算是用来?
A、剪枝
B、使树成长
C、处理缺失值和异常值
D、砍树
17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
A、分类
B、聚类
C、关联分析
D、隐马尔可夫链
18.开始将N个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并
为一类,此种聚类方法是()
A、K-means
B、SOM聚类
C、系统聚类
D、有序聚类
19.关于回归分析,下列说法中错误的是()
A、作回归分析的变量之间要有实际意义,不能把毫无关联的两种现象随意进行回归分析,要结合专业知识对两事物之间是否存在因果关系作出合理解释和结论。
B、在进行线性回归分析进行的数据准备的时候,要求因变量y和自变量x都是符合总体正态的随机变量。
C、回归直线不要随意外延
D、所有非线性回归都可以转化为线性回归
20.下列说明错误的是()
A、性别=“男”=>
职业=“司机”,是布尔型关联规则
B、性别=“女”=>
avg(收入)=2300,是一个数值型关联规则
C、肝炎=>
ALT(丙氨酸转氨酶)升高,是一个单层关联规则
D、性别=“女”=>
职业=“秘书”,是多维关联规则
21.在ID3算法中信息增益是指()
A、信息的溢出程度
B、信息的增加效益
C、熵增加的程度最大
D、熵减少的程度最大
22.如下哪个不是最近邻分类器的特点()
A、它使用具体的训练实例进行预测,不必维护源自数据的模型
B、分类一个测试样例开销很大
C、最近邻分类器基于全局信息进行预测
D、可以生产任意形状的决策边界
23.关于混合模型聚类算法的优缺点,下面说法正确的是()
A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布。
C、混合模型很难发现不同大小和椭球形状的簇。
D、混合模型在有噪声和离群点时不会存在问题。
24.关于K均值和DBSCAN的比较,以下说法不正确的是()
A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。
B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。
C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。
D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。
25.检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测
A、统计方法
B、邻近度
C、密度
D、聚类技术
26.倒传递神经网络(BP神经网络)的训练顺序为何?
(A:
调整权重;
B:
计算误差值;
C:
利用随机的权重产生输出的结果)
A、BCA
B、CAB
C、BAC
D、CBA
27.假设检验中,拒绝域的边界称为()
A、临界值
B、临界点
C、置信水平
D、边际值
28.在有关数据仓库测试,下列说法不正确的是()
A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试
B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试
D、在测试之前没必要制定详细的测试计划
29.某项目预计运行5年后的净现值为4500万元,如折现率为16%,其终值应为()万元(说明:
结果保留两位小数)
A、8045.86
B、6996.21
C、9451.54
D、7000.02
30.迈克尔·
波特的“五力模型”中,五种竞争力量中不包括()
A、新进入者
B、供应商议价能力
C、其他利益相关者力量
D、行业中现有竞争者
三、多选题
1.敏感性分析的计算指标有()
A、盈亏平衡点
B、敏感度系数
C、临界点
D、净现值
BCD
2.在Excel中,要选定A到E列单元格,操作正确的是()
A、用鼠标左键单击列号A,然后向右拖动鼠标至列号E,再释放鼠标左键
B、左键单击列号A,再按下shift键不放并用鼠标左键单击列号E,最后释放shift键
C、单击列号A,然后先按下Ctrl键不放,再用鼠标单击B,C,D,E列号,最后释放Ctrl键
D、按shift键不放,用鼠标左键单击A,B,C,D,E的每个列号
ABC
3.季节变动主要是由()引起的。
A、自然灾害
B、政治事件
C、制度、法律、习俗
D、自然界的季节变化
CD
4.货币时间价值用相对值来表示时,在数量上应当理解为扣除()后的社会平均利润率。
A、时间因素
B、通货膨胀因素
C、纯粹利率
D、风险因素
BD
5.概率分析中,应计算出()表明该风险因素的风险程度。
A、变异系数
B、期望值
C、方差
D、标准差
ABCD
6.定基发展速度与环比发展速度的关系有()。
A、各环比发展速度之和等于相应的定基发展速度
B、各环比发展速度之积等于相应的定基发展速度
C、两个环比发展速度之商等于相应的定基发展速度
D、两个定基发展速度之商等于相应的环比发展速度
7.促销预算的方法主要有()。
A、量入为出法
B、竞争对等法
C、销售比例法
D、目标任务法
8.行业分析数据采集方法有()。
A、一手资料
B、实地考察法
C、专家访谈法
D、收集媒体信息
9.决策树法分析问题的主要步骤包括()。
A、结构化问题
B、设计可能结果发生的概率
C、设计结果的得益
D、分析问题
10.能消除时间序列中的不规则变动和季节变动的方法是()
A、移动平均法
B、指数平滑法
C、时间序列乘法模型
D、季节指数
AD
11.确定一个投资方案可行的必要条件是()。
A、净现值大于零
B、现值指数大于1
C、投资回收期小于1年
D、内部报酬率较高
AB
12.随机对比实验的调查方法的优点是()
A、能够测算实验误差
B、可以提高实验结果的可靠性
C、可以节省分析过程和时间
D、费用开支小
13.下列说法中不正确的是()
A、任何两个变量都具有相关关系
B、人的知识与其年龄具有相关关系
C、散点图中的各点是分散的没有规律
D、根据散点图求得的回归直线方程都是有意义的
ACD
14.相关分析的任务有()
A、判定现象之间有无关系
B、判定现象之间关系的方向
C、判定相关关系的紧密程度
D、说明现象之间联系的具体形式
ABCD
15.在比较不同预测方法的精确度时,通常采用()等误差指标来衡量预测误差的大小。
A、绝对误差
B、相对误差
C、平均误差
D、随机误差
ABC
16.如果自变量有连续型变量,则适用的分类预测方法有()
A、逻辑回归
B、神经网络
C、SVM算法
D、C4.5算法
17.KANO模型定义的顾客需求层次有()
A、兴奋型需求
B、喜爱型需求
C、基本型需求
D、期望型需求
18.下面有关HAVING子句的说法中正确的是()
A、HAVING子句必须与GROUPBY子句同时使用,不能单独使用
B、使用HAVING子句的同时不能使用WHERE子句
C、使用HAVING子句的同时可以使用WHERE子句
D、使用HAVING子句的作用是限定分组的条件
ACD
19.在有关数据仓库测试,下列说法中正确的是()
D、在测试之前可以不制定详细的测试计划,测试过程中实时调整。
20.对于计算期不等的项目(方案)比选,可采纳的决策方法有()
A、最小公倍数法
B、内部收益率法
C、等年值法
D、获利指数法
AC