1、CPDA考试真题与答案 3一、 判断题1.样本容量是指从总体中抽取的个体。正确答案: 2.品质数据既可以用整数值表示,也可以用连续值表示。正确答案: 3.需求弹性大的产品价格与销售收入反向变化。正确答案: 4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。正确答案: 5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案: 6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成本才与产品产销量的增减变化发生关系。正确答案: 7.如
2、果两个变量不独立,那这两者的相关系数必然不等于0。正确答案: 8.数据库类型是按照数据存取的方法来划分的。正确答案: 9.SQL语言中,条件年龄 BETWEEN 15 AND 35,表示年龄在15至35之间,且包括15岁但不包括35岁。正确答案: 10.资本成本就是资金的时间价值。正确答案: 11.一组数据排序后处于25%和75%位置上的值称为四分位数。正确答案: 12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。正确答案: 13.内部收益率考虑了资金时间价值,受折现率高低的影响。正确答案: 14.边际收入是指每增加1单位销量所带来的总收入的增加额度。正确答案: 15.分类预测
3、时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即F1-Score。正确答案: 二、 单选题1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为( )A、1B、-1C、+1或-1D、0正确答案: C 2.表示职称为副教授、性别为男的表达式为( )A、职称=副教授 OR 性别=男B、职称=副教授 AND 性别=男C、BETWEEN 副教授 AND 男D、IN (副教授,男)正确答案: B 3.对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用( )最为适宜,其值是( )。A、平均数,14.4
4、B、中位数,8.5C、众数, 8 D、以上都可以正确答案: C 4.( )是进行项目投资效益评价的最终依据。A、现金流量B、盈亏平衡点C、净现金流量D、现金流入量正确答案: C 5.有一组数据其均值是 20 ,对其中的每一个数据都加上 10 ,那么得到的这组新数据的均值是( )。A、20B、10C、15D、30正确答案: D 6.分类变量使用以下哪个统计量进行缺失值填补较合适A、均值B、最大值C、众数D、中位数正确答案: C 7.假设BCE为一频繁项目集(Frequent Itemset),则根据Apriori Principle以下何者不是子频繁项目?A、BCB、CEC、CD、CD正确答案:
5、 D 8.请问以下何者属于时间序列的问题?A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上均不是正确答案: B 9.数据正规化(Data Normalization)是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段进行?A、数据清洗B、数据选择C、数据编码D、数据扩充正确答案: C 10.已知事件A的概率P(A)0.6,U为必然事件,则 P(A+U)1,P()_A、0.4B、0.6C、0D、1正确答案: B 11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型( )A、直线B、
6、二次抛物线C、三次抛物线D、指数曲线正确答案: A 12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响( )A、方差分析B、回归分析C、聚类分析D、主成分分析正确答案: C 13.若数据量较大,下面哪种方式比较适合( )A、系统聚类B、快速聚类(k-means)C、A和B都可以D、A和B都不可以正确答案: B 14.在建立线性回归(Linear Regression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?A、皮尔森相关系数B、卡方检定C、T-检定D、Z-Score正确答案: A 15.ROC曲线凸向哪个角,代表模型越理想?A、左上角B、右上角C、左下角D、右下角正
7、确答案: A 16.决策树中的Information Gain的计算是用来?A、剪枝B、使树成长C、处理缺失值和异常值D、砍树正确答案: B 17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A、分类B、聚类C、关联分析D、隐马尔可夫链正确答案: B 18.开始将个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类,此种聚类方法是( )A、meansB、SOM聚类C、系统聚类D、有序聚类正确答案: C 19.关于回归分析,
8、下列说法中错误的是( )A、作回归分析的变量之间要有实际意义,不能把毫无关联的两种现象随意进行回归分析,要结合专业知识对 两事物之间是否存在因果关系作出合理解释和结论。B、在进行线性回归分析进行的数据准备的时候,要求因变量y和自变量x都是符合总体正态的随机变量。C、回归直线不要随意外延D、所有非线性回归都可以转化为线性回归正确答案: D 20.下列说明错误的是( )A、性别=“男”= 职业=“司机”,是布尔型关联规则B、性别=“女”= avg(收入)=2300,是一个数值型关联规则C、肝炎= ALT(丙氨酸转氨酶)升高,是一个单层关联规则D、性别=“女”= 职业=“秘书”,是多维关联规则正确答
9、案: C 21.在ID3算法中信息增益是指( ) A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵减少的程度最大正确答案: D 22.如下哪个不是最近邻分类器的特点( )A、它使用具体的训练实例进行预测,不必维护源自数据的模型B、分类一个测试样例开销很大C、最近邻分类器基于全局信息进行预测D、可以生产任意形状的决策边界正确答案: C 23.关于混合模型聚类算法的优缺点,下面说法正确的是( )A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布。C、混合模型很难发现不同大小和椭球形状的簇。D、
10、混合模型在有噪声和离群点时不会存在问题。正确答案: B 24.关于K均值和DBSCAN的比较,以下说法不正确的是( )A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。正确答案: A 25.检测一元正态分布中的离群点,属于异常检测中的基于( )的离群点检测A、统计方法B、邻近度C、密度D、聚类技术正确答案: A 26.倒传递神经网
11、络(BP神经网络)的训练顺序为何?( A:调整权重; B:计算误差值; C:利用随机的权重产生输出的结果) A、BCAB、CABC、BACD、CBA正确答案: D 27.假设检验中,拒绝域的边界称为( )A、临界值B、临界点C、置信水平D、边际值正确答案: A 28.在有关数据仓库测试,下列说法不正确的是( )A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D、在测试之前没必要制定详细的测试计划正确答案: D 29.某项
12、目预计运行5年后的净现值为4500万元,如折现率为16,其终值应为( )万元 (说明:结果保留两位小数)A、8045.86B、6996.21C、9451.54D、7000.02正确答案: C 30.迈克尔波特的“五力模型”中,五种竞争力量中不包括( )A、新进入者B、供应商议价能力C、其他利益相关者力量D、行业中现有竞争者正确答案: C 三、 多选题1.敏感性分析的计算指标有( )A、盈亏平衡点B、敏感度系数C、临界点D、净现值正确答案: BCD 2.在Excel 中,要选定A到E列单元格,操作正确的是( )A、用鼠标左键单击列号A,然后向右拖动鼠标至列号E,再释放鼠标左键B、左键单击列号A,
13、再按下shift 键不放并用鼠标左键单击列号E,最后释放shift键C、单击列号A, 然后先按下Ctrl 键不放,再用鼠标单击B,C,D,E 列号,最后释放Ctrl 键D、按shift键不放,用鼠标左键单击A,B,C,D,E的每个列号正确答案: ABC3.季节变动主要是由( )引起的。A、自然灾害B、政治事件C、制度、法律、习俗D、自然界的季节变化正确答案: CD 4.货币时间价值用相对值来表示时,在数量上应当理解为扣除( )后的社会平均利润率。A、时间因素B、通货膨胀因素C、纯粹利率D、风险因素正确答案: BD 5.概率分析中,应计算出( )表明该风险因素的风险程度。A、变异系数B、期望值C
14、、方差D、标准差正确答案: ABCD 6.定基发展速度与环比发展速度的关系有( )。A、各环比发展速度之和等于相应的定基发展速度B、各环比发展速度之积等于相应的定基发展速度C、两个环比发展速度之商等于相应的定基发展速度D、两个定基发展速度之商等于相应的环比发展速度正确答案: BD 7.促销预算的方法主要有( )。A、量入为出法B、竞争对等法C、销售比例法D、目标任务法正确答案: ABCD 8.行业分析数据采集方法有( )。A、一手资料B、实地考察法C、专家访谈法D、收集媒体信息正确答案: ABCD 9.决策树法分析问题的主要步骤包括( )。A、结构化问题B、设计可能结果发生的概率C、设计结果的
15、得益D、分析问题正确答案: ABCD 10.能消除时间序列中的不规则变动和季节变动的方法是( )A、移动平均法B、指数平滑法C、时间序列乘法模型D、季节指数正确答案: AD 11.确定一个投资方案可行的必要条件是( )。A、净现值大于零B、现值指数大于1C、投资回收期小于1年D、内部报酬率较高正确答案: AB 12.随机对比实验的调查方法的优点是( )A、能够测算实验误差B、可以提高实验结果的可靠性C、可以节省分析过程和时间D、费用开支小正确答案: AB 13.下列说法中不正确的是( )A、任何两个变量都具有相关关系B、人的知识与其年龄具有相关关系C、散点图中的各点是分散的没有规律D、根据散点
16、图求得的回归直线方程都是有意义的正确答案: ACD 14.相关分析的任务有( )A、判定现象之间有无关系B、判定现象之间关系的方向C、判定相关关系的紧密程度D、说明现象之间联系的具体形式正确答案: ABCD15.在比较不同预测方法的精确度时,通常采用( )等误差指标来衡量预测误差的大小。A、绝对误差B、相对误差C、平均误差D、随机误差正确答案: ABC 16.如果自变量有连续型变量,则适用的分类预测方法有( )A、逻辑回归B、神经网络C、SVM算法D、C4.5算法正确答案: ABC 17.KANO模型定义的顾客需求层次有( )A、兴奋型需求B、喜爱型需求C、基本型需求D、期望型需求正确答案:
17、ACD 18.下面有关HAVING子句的说法中正确的是( )A、HAVING子句必须与GROUP BY子句同时使用,不能单独使用B、使用HAVING子句的同时不能使用WHERE子句C、使用HAVING子句的同时可以使用WHERE子句D、使用HAVING子句的作用是限定分组的条件正确答案: ACD19.在有关数据仓库测试,下列说法中正确的是( )A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D、在测试之前可以不制定详细的测试计划,测试过程中实时调整。正确答案: ABC 20.对于计算期不等的项目(方案)比选,可采纳的决策方法有 ( )A、最小公倍数法B、内部收益率法C、等年值法D、获利指数法正确答案: AC
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1