CDA题库.docx
《CDA题库.docx》由会员分享,可在线阅读,更多相关《CDA题库.docx(48页珍藏版)》请在冰豆网上搜索。
CDA题库
1现有两个投资项目甲和乙,已知甲、乙方案的期望值分别为10%、25%,标准离差分别为20%、49%,那么(A)。
A、甲项目的风险程度大于乙项目的风险程度
B、甲项目的风险程度小于乙项目的风险程度
C、甲项目的风险程度等于乙项目的风险程度
D、不能确定
2多个方案比较时,标准离差越小的方案,其风险(B)
A、越大B、越小C、两者无关D、无法判断
3在Excel2003中,柱形图类型属于图表中的(B)
A、复合类型B、标准类型C、简单类型D、自定义类型
4n个标准正态分布的平方和为(A)
A、卡方分布B、t分布C、F分布D、正态分布
5(B)是依据样本估计总体分布中所含的未知参数或未知参数的函数。
通常它们是总体的某个特征值,如数学期望、方差和相关系数等。
A、区间估计B、点估计C、参数估计D、无偏估计
6(C)用于计算间隔不等的连续时点序列的评价发展水平。
A、算术平均数B、几何平均数C、加权平均数D、调和平均数
7当置信水平一定时,置信区间的宽度(A)
A、随着样本量的增大而减小B、随着样本量的增大而增大
C、与样本量的大小无关D、与样本量的平方根成正比
8下列不能描述变量离期望值大小的指标是(D)
A、变异系数B、标准差C、方差D、相关系数
9EXCEL中,求标准差的函数是(D)
A、AVERAGEB、MEDIANC、MODED、STDEV
10结构化数据根据连续性可分为(B)
A、品质数据和数值型数据B、连续型数据和离散型数据
C、截面数据、时间序列数据和面板数据D、一手数据和二手数据
11结构化数据根据时间特点可分为(C)
A、品质数据和数值型数据B、连续型数据和离散型数据
C、截面数据、时间序列数据和面板数据D、一手数据和二手数据
12某企业拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。
已知甲方案净现值的期望值为1000万元,标准差为300万元;乙方案净现值的期望值为1200万元,标准差为330万元。
下列结论中正确的是(B)。
A、甲方案优于乙方案B、甲方案的风险大于乙方案
C、甲方案的风险小于乙方案D、无法评价甲、乙方案的风险大小
13参数估计分为(A)
A、点估计和区间估计B、区间估计和无偏估计
C、点估计和无偏估计D、区间估计和一致估计
14求C5和H5两单元格平均值的函数形式是(B)
A、AVERAGE(C5:
H5)B、AVERAGE(C5,H5)
C、SUM(C5:
H5)/2D、SUM(C5,H5)
15下列四项中,不正确的提法是(C)
A、SQL语言是关系数据库的国际标准语言
B、SQL语言具有数据定义、查询、操纵和控制功能
C、SQL语言可以自动实现关系数据库的规范化
D、SQL语言称为结构查询语言
16无量纲化后各变量的标准差为(B)
A、0B、1C、-1D、原标准差
17在Excel2003中,数据源发生变化时,相应的图表(B)
A、手动跟随变化B、自动跟随变化C、不跟随变化D、不受任何影响
18事件A的概率P(A)必须满足(C)
A、0<P(A)<1B、P(A)=1C、0≤P(A)≤1D、P(A)=0或1
19EXCEL中,求中位数的函数是(B)
A、AVERAGEB、MEDIANC、MODED、STDEV
20标准正态分布的均值为(A)
A、0B、1C、-1D、不能确定
21启动Excel后自动建立的工作簿文件中自动带有电子工作表有(B)
A、4个B、3个C、2个D、1个
22在Excel中,能够很好地通过矩形块反映每个对象中不同属性值大小的图表类型是(C)。
A、饼图B、折线图C、柱形图D、散点图
23在Excel中,能反映出同一属性数据变化趋势的图表类型是(A)
A、折线图B、散点图C、饼图D、气泡图
24生活中“最佳”、“最受欢迎”等与(C)有关
A、平均数B、中位数C、众数D、标准差
25下列调查中,适合用全面调查方式的是(A)
A、了解某班学生“50米跑”的成绩B、了解一批灯泡的使用寿命
C、了解一批炮弹的杀伤半径D、了解一批袋装食品是否含有防腐剂
26估计量的含义是指(A)
A、用来估计总体参数的统计量的名称B、用来估计总体参数的统计量的具体数值
C、总体参数的名称D、总体参数的具体取值
27在10件同类产品中,其中8件为正品,2件为次品从中任意抽出3件的必然事件是(D)
A、3件都是正品B、至少有1件是次品
C、3件都是次品D、至少有1件是正品
28指出下面的说法哪一个是正确的(A)
A、置信水平越大,估计的可靠性越大B、置信水平越大,估计的可靠性越小
C、置信水平越小,估计的可靠性越大D、置信水平的大小与估计的可靠性无关
29对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为(B)回归方程可能是正确的。
A、y=125-10xB、y=-50+8xC、y=150-20xD、y=-15-6x
30要了解一批电视机的使用寿命,从中任意抽取30台电视机进行试验,在这个问题中,30是(C)
A、个体B、总体C、样本容量D、总体的一个样本
1根据数据量级别,数据可分为(AB)。
A、传统数据B、大数据C、结构化数据D、非结构化数据
2下列关于统计量的表述中,正确的有(ABCD)
A、估计统一总体参数可以用多个不同统计量B、统计量是样本的函数
C、统计量不含有未知参数D、统计量的分布成为抽样分布
3互联网生成的数据包括(ABC)
A、电子商务B、移动互联网APPC、网络游戏D、传感器数据
4访问法包括(ABCD)
A、小组访谈法B、街头访问C、企业调研D、网上调查
5数据库是一个(ABCD)数据集合
A、长期存储在计算机内的B、有组织的
C、可共享的D、统一管理的
6数据转换的类型有(ABCD)
A、变量计算B、加权处理C、标准化D、分类汇总
7描述数据离散趋势的统计量有(ABCD)
A、极差B、方差C、标准差D、变异系数
8数据清洗工作主要包括处理(ABCD)
A、缺失数据清洗B、异常数据清洗
C、逻辑错误数据清洗D、重复数据清洗
9字段合并是将多个单元格的文字或数字合并成一个单元格。
常用(BC)
A、VLOOKUPB、&C、CONCATENATED、MID
10可采集到的网站访问数据包括(ABCD)
A、访问者属性B、访问者访问网站的频率
C、每次访问停留的时间D、访问者浏览路径
11数据产生的主要来源有(ABCD)
A、局域网B、离线储存数据C、互联网D、物联网
12下列可描述相关关系的图表类型有(AC)
A、散点图B、饼图C、气泡图D、瀑布图
13描述数据集中趋势的统计量有(ABD)
A、平均数B、中位数C、标准差D、众数
14如果参与分类的变量较多时(比如大于1000),可以选用的方法是(BC)
A、层次聚类法B、K-均值聚类法
C、两步聚类法D、混合聚类法
15下列可描述数据走势或趋势的图表类型有(ABC)
A、柱形图B、折线图C、面积图D、饼图
1VCD连锁店各个商店的每月销售额(万元)和每月用在以上两种媒介的广告支出(见下表所示数据)。
利用SPSS进行多元回归分析。
(1)在SPSS中,将销售额选入因变量。
(2)建立多元回归方程,其中电视广告支出的系数为12.041.
(3)观察SPSS的回归结果输出,广播广告支出的系数是否通过检验。
是
(4)分别使用向前引入法和向后剔除法进行多元回归,两者输出的模型结果是否相同。
是
2以下数据是某公司一年以来的销售额,试采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。
求平均销售额(保留两位小数)(93945.92)
求销售额中位数(75402.5)
求销售额的标准差(保留一位小数)(44667.3)
求销售额的最大值(174498)
3以下数据是20个不同产品的两个参数,用SPSS软件按要求进行排序。
排序依据为L1,要求升序排列时,排在第六位的产品编号为(12)。
排序依据为L2,要求降序排列时,排在第十位的产品编号为(9)。
排序依据为L1和L2,要求先按L1升序排列,后按L2降序排列,排在第9位的产品编号为
(2)。
排序依据为L1和L2,要求先按L1降序排列,后按L2升序排列,排在第6位的产品编号为(15)。
4某对外汉语培训中心对在该中心学习的外国留学生进行了一项汉语学习动机问卷调查。
使用李克特五级式量表。
第一级为最不喜欢,第五级为最喜欢。
随机抽取18人参加调查。
整理数据如下
(1)观察Bartlett球度检验的P值,说明应该(拒绝)原假设。
(答案填写“接受”或“拒绝”)
(2)结果中,(成分得分系统矩阵)是将因子表示成变量的组合。
(答案填写“成分矩阵”,“成分转换矩阵”,“成分得分系数矩阵”或“成分得分协方差矩阵”)
(3)观察结果中给出的各变量的信息被提取的比例,说明提取比例最低的是(汉语戏剧)。
(答案填写“兴趣”,“书法”,“汉语歌曲”或“汉语戏剧”)
(4)这里选取了(3)个因子。
(答案填写阿拉伯数字“1,2,3……”)
5聚类分析在市场细分中应用广泛,可以帮助企业对市场上的产品进行分类,从而更准确地指定营销策略。
例如,某饮料企业收集了市场上16种饮料的热量、咖啡因、钠含量和价格4种变量数据,如下表所示。
(1)将处理过(消除量纲)的变量使用K-means聚成3类,从输出的方差分析表中看出,在显著性水平为0.05条件下,聚类在“钠”这个指标上是否有显著差异?
(是)(填“是”或“否”)
(2)将处理过(消除量纲)的变量使用K-means聚成3类,编号为8的饮料属于第
(1)类。
(答案填写阿拉伯数字“1,2,3……”)
(3)将处理过(消除量纲)的变量使用系统聚类法聚成2至4类,从输出的结果看出编号为5的饮料和编号为(6)的饮料距离最近。
(答案填写阿拉伯数字“1,2,3……”)
(4)使用系统聚类法,若分成4类,编号为7的饮料属于第(3)类。
(答案填写阿拉伯数字“1,2,3……”)
6某地1983年至1993年财政收入及棉花产量的资料如下:
(1)简单指数平滑方法能做
(1)期预测.(答案填写阿拉伯数字“1,2,3……”)
(2)棉花产量选用(简单指数平滑)方法做预测。
(答案填写“回归直线”,“简单指数平滑”,“holt指数平滑”或“Winter指数平滑”)
(3)利用SPSS的holt指数平滑方法预测1999年该地区的财政收入为(157.46)元。
(保留两位小数)
(4)财政收入除了可以选用holt指数平滑法预测,还可以选用(回归直线)方法做预测。
(答案填写“回归直线”,“简单指数平滑”,“哑变量回归法”或“Winter指数平滑”)
7某百货公司从1995年到2001年的季度收入情况如下:
单位:
百万美元用SPSS进行时间序列季节分解预测注意:
本案例预测时使用的时间序列的乘积模型如下:
Y=T×S×I(即:
长期趋势×季节指数×不规则因素)
(1)计算出1995年第一季度的季节指数(0.9126)(保留四位小数)
(2)计算出1995年第一季度的非季节变化收入(10168.7458)(保留四位小数)
(3)第(4)个季节的季节指数最大.(答案填写阿拉伯数字“1,2,3……”)
(4)用趋势项对时间t做线性回归,建立的回归方程中的常数项系数为(8977.463)。
(保留3位小数)
8用SPSS软件对以下输入数据做异常值分析和处理。
对这些数据做异常值查找时,可选择“分析”->“描述统计”->(探索)。
(可填答案“频率”、“描述”、“探索”、“交叉表”)
完成第一步操作后,我们只找异常值,则需要在统计量中选择(界外值)。
(可填答案“描述性”、“M_估计量”、“界外值”、“百分位数”)
在输出结果中列出的五个最大值中排在第一的数值是(174498)
在输出结果中列出的五个最小值中排在第一的数值是(4765)
9用SPSS软件做替换缺失值处理,完成下列题目。
1.用连续均值填补缺失值后,10月销售额为(83.02)
2.用附近点的平均值填补缺失值后,10月销售额为(116.48)
3.用线性插值填补缺失值后,10月销售额为(115.1)
4.用点的线性趋势填补缺失值后,10月销售额为(115.77)
10用SPSS软件处理下列重复数据,完成下列题目。
需要给重复个案做标记,产生一个新标记变量的SPSS操作是选定“数据”选项下的(标识重复个案)选项。
(可填答案“标识异常个案”、“标识重复个案”、“个案选择”
标记重复个案新生成的变量用(0)标记重复个案。
(可填答案为0或1)
标记重复个案新生成的变量用
(1)标记基本个案。
(可填答案为0或1)
删除重复数据时,需要选定数据->选择个案->选定如果条件满足框输入重复标记=1,输出框选择(删除未选定个案)。
(可写答案:
“过滤掉未选个案”、“将选定个案复制到新数据集”、“删除未选定个案”)
11某班20名学生考试成绩如下表所示,采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。
求这20名学生的考试成绩均分(保留一位小数)(83.7)
求这20名学生的考试成绩的中位数(83)
求这20名学生的考试成绩的众数(83)
求这20名学生的考试成绩标准差(保留两位小数)(7.66)
12某百货公司从1995年到2001年的季度收入情况如下:
单位:
(百万美元)
用SPSS进行季节哑变量多元回归预测
(1)协变量应放置(数值)类型的变量.(答案填“数值”,“字符”,“日期”,“二进制”)
(2)SPSS选用的参照项是第(4)季度.(答案填写阿拉伯数字“1,2,3……”)
(3)虚拟变量1的参数估计值为(-4561.141)(保留三位小数)
(4)此案例建立的哑变量回归方程中有(3)个虚拟变量.(答案填写阿拉伯数字“1,2,3……”)
13我国钢材消费量(万吨)与国民收入(亿元)的资料如下。
利用SPSS进行一元回归分析。
(1)令钢材消费量为(因变量)。
(答案填写“自变量”或“因变量”)
(2)建立回归方程,用最小二乘法进行参数估计,求出a,b(a为斜率,b为截距)。
算出b的值为(-460.5282)。
(结果保留3位小数)
(3)观察SPSS结果中的模型汇总表,回归直线对样本数据点是否拟合良好(是)(填“是”或“否”)
(4)若1981年至1985年,国民收入以4.5%的速度递增,则国民收入见下表。
利用SPSS预测1981年的钢材消费量为(3006.69)万吨。
(四舍五入保留两位小数)
14以下数据是XX2011年-2014年各季度的营业收入,试采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。
求营业收入的均值(保留两位小数)(69.18)
求营业收入的中位数(保留两位小数)(62.50)
求营业收入的标准差(保留整数)(32)
求营业收入的最大值(135.2)
15下表是某单位年终奖金分配表,采用EXCEL数据分析描述统计功能,求解该单位年终奖金分配中的最高金额、最低金额、平均金额、中间金额、众数金额等。
求该单位年终奖金分配中的最高金额(50000)
求该单位年终奖金分配中的最低金额(6000)
求该单位年终奖金分配中的平均金额(22750)
求该单位年终奖金分配中的众数金额(15000)
四、判断题
1中位数具有不唯一性(×)
2聚类分析中,各变量的取值不应有数量级上的过大差异(√)
3原假设是指研究者想收集证据予以反对的假设,通常指参数没有变化或变量之间没有关系。
(√)
4分销网络的区位选择属于间接的短期刺激(×)
5标准差越大,正态分布曲线越平坦,概率分布密度越低。
(√)
6顾客要求提供的产品或服务比较优秀,但并不是“必须”的产品属性或服务行为是兴奋型需求。
(×)
7在多元线性回归模型中,解释变量可以有相关性(×)
8描述数据成分关系时,若成分过多可使用复合饼图或复合条饼图。
(√)
9标准差越大,正态曲线越高越陡峭。
(×)
10KANO模型定义了四个层次的顾客需求。
(×)
11客户获取通常发生在客户生命周期中的考察期(√)
12bigint是SQL的数据类型。
(√)
13拟合优度R方越大,回归直线的拟合程度越好(√)
14正态分布曲线的两个尾端无限接近横轴且理论上不会与之相交。
(√)
15异常值是指一批数据中的个别值,其数值明显偏离该批数据的其余值,也称离群值。
(√)
一、单选题
1无量纲化后各变量的标准差为(B)
A、0B、1C、-1D、原标准差
2在Excel中,数据类型包括(D)
A、数值型数据B、字符型数据C、逻辑型数据D、以上全部
3下列调查中,适合用全面调查方式的是(A)
A、了解某班学生“50米跑”的成绩B、了解一批灯泡的使用寿命C、了解一批炮弹的杀伤半径D、了解一批袋装食品是否含有防腐剂
4下列调查方式中适合的是(C)
A、要了解一批节能灯的使用寿命,采用普查方式
B、调查你所在班级同学的身高,采用抽样调查方式
C、环保部门调查某段水域的水质情况,采用抽样调查方式
D、调查全市中学生每天的就寝时间,采用普查方式
5估计量的含义是指(A)
A、用来估计总体参数的统计量的名称B、用来估计总体参数的统计量的具体数值C、总体参数的名称D、总体参数的具体取值
6在Excel2010的单元格中,输入函数=sum(10,25,13),得到的值为(B)
A、25B、48C、10D、28
7n个标准正态分布的平方和为(A)
A、卡方分布B、t分布C、F分布D、正态分布
8下列四项中,不属于数据库特点的是(C)
A、数据共享B、数据完整性C、数据冗余很高D、数据独立性高
9在Excel2010的工作表中,假定C3:
C6区域内保存的数值依次为10、15、20和45,则函=AVERAGE(C3:
C6)的值为(B)
A、22B、22.5C、45D、90
10已知甲、乙两班学生统计学考试成绩:
甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。
由此可知两个班考试成绩的离散程度(A)。
A、甲班较大B、乙班较大C、两班相同D、无法作比较
11Excel2003工作簿文件的默认扩展名为(A)
A、xlsB、docC、mbdD、ppt
12(B)用于计算平均发展速度
A、算术平均数B、几何平均数C、加权平均数D、调和平均数
13在SQL中,用来显示数据库信息的系统存储过程是(D)
A、sp-dbhelpB、sp-dbC、sp-helpD、sp-helpdb
14(A)用于计算时期序列的平均发展水平或间隔相等的连续时点序列的平均发展水平。
A、算术平均数B、几何平均数C、加权平均数D、调和平均数
15在Excel2003中,柱形图类型属于图表中的(B)
A、复合类型B、标准类型C、简单类型D、自定义类型
16EXCEL中,求中位数的函数是(B)
A、AVERAGEB、MEDIANC、MODED、STDEV
17当向Excel2003工作簿文件中插入一张电子工作表时,默认的表标签中的英文单词为(A)
A、SheetB、BookC、TableD、List
18下列不能描述变量离期望值大小的指标是(D)
A、变异系数B、标准差C、方差D、相关系数
19标准离差率是标准离差与(D)相比求出的相对数。
A、投资报酬B、风险报酬C、原始投资D、期望值
20下列说法正确的为(C)
A、概率就是频率B、概率为1的事件可以不发生C、概率为0的事件一定不会发生D、概率不可以是一个无理数
21服从参数为x的泊松分布数学方差为(A)
A、xB、1/x
22求C5和H5两单元格平均值的函数形式是(B)
A、AVERAGE(C5:
H5)B、AVERAGE(C5,H5)C、SUM(C5:
H5)/2D、SUM(C5,H5)
23SQL中基本查询语句是(A)
A、SELECTB、SELECTFROMC、WHERED、CREAT
24变异系数越大,表示风险程度越(A)
A、大B、小C、不变D、等于零
25任一随机事件出现的概率为(D)
A、在-1到1之间B、小于0C、不小于1D、在0与1之间
26在Excel2003中,图表被建立在(A)
A、二维坐标系中B、一维坐标系中C、三维坐标系中D、更高维坐标系中
27目前,(A)数据库系统已经逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的商用数据库系统。
A、关系B、面向对象C、分布D、层次
28一个95%的置信区间是指(C)
A、总体参数有95%的概率落在这一区间内
B、总体参数有5%的概率未落在这一区间内
C、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。
D、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。
29结构化数据根据采集方式可分为(D)
A、品质数据和数值型数据B、连续型数据和离散型数据C、截面数据、时间序列数据和面板数据D、一手数据和二手数据
30计算平均数的基本要求是所要的平均数的总体单位应是(B)
A、大量的B、同质的C、差异的D、少量的
二、多选题
1访问法包括(ABCD)
A、小组访谈法B、街头访问C、企业调研D、网上调查
2在SQL中,对象的数据类型包括的属性有(ABCD)
A、数据种类B、数据的长度或大小C、数值的精度D、数值中的小数位数
3如果参与分类的变量较多时(比如大于1000),可以选用的方法是(BC)
A、层次聚类法B、K-均值聚类法C、两步聚类法D、混合聚类法
4热力图的作用有(ABD)
A、考察访问者是否按照产品预设的逻辑进行操作
B、是否有一些没有被发现的习惯或行为
C、考察访问者访问流程
D、对于访问者在导航页的点击哪些是正确的,哪些是有问题的
5数据产生的主要来源有(ABCD)
A、局域网B、离线储存数据C、互联网D、物联网
6一组数据的(AC)一定是原始数据中的真实值。
A、众数B、平均数C、中位数(数据个数为奇数