ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:77.43KB ,
资源ID:8096486      下载积分:12 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8096486.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(CDA数据分析师认证试题库精选.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

CDA数据分析师认证试题库精选.docx

1、CDA数据分析师认证试题库精选CDA等级考试模拟题库:基础理论部分第一部分:判断题1.统计学是研究社会领域和自然领域的规律的实质性科学。2.大量观察法是统计研究的最基本的方法。3.总体单位的属性既可以用数值表示,也可以用文字表示。4.对任何一事物进行统计研究的前提是构成统计总体的各个个体单位必须具有的差异性。5.构成总体的各个个体单位至少在某一属性上相同,才能准确地确定总体围。6.统计学与哲学相同,属于认识客观世界的最一般的方法论科学。7.运用统计方法可以研究和解释事物发展的原因和规律。8.总体的同质性、变异性、大量性是平均法的应用前提。9.在用计算机数据进行汇总时,往往将男性用“ 1”来表示

2、,女性用“ 0”来表示,所以可以讲性别视为量别变量。10.在人工干预或操作情况下收集的数据称为实验数据。11.截面数列按分组标志不同可以分为品质数列和变量数列。12.同龄人的身高,用频数曲线描述一般表现为钟型分布。13.欲掌握我国人口是否具有老龄化特征,对人口按年龄分组,适合采用等距式分组。14.对在校大学生的年龄进行分组适合采用组距式分组。15.在组距式分组中,采用组中值作为每组一般水平的代表值。16.直方图仅适合用于显示连续型分组数据。17.茎叶图不仅能够反映数据的分布情况,还能显示数据的原始信息。18.频数分布表中的组距在茎叶图中称为步长。19.变异指标与集中趋势指标成正比。20.箱索图

3、的优点是便于同时比较多组数据的分布特征。21.如果一组数据呈正态分布,则算术平均数的大小不会受极端值的影响。22.计算加权算术平均数时,若各组权数相同,权数对算术平均数结果没有影响。23.若一组数据的众数大于算术平均数时,该数据呈右偏分布。24.当一组数据分布明显偏斜时,不宜采用算术平均数作为中心趋势的测度值。25.当一组数据的各个观察值与该组数据的算术平均数的离差平方和等于零。26.中位数与众数相同,具有唯一性的特点。27.依据组距式分组数据计算的加权算术平均数有时会产生较大的误差。28.任一组数据都可以计算算术平均数、众数和中位数三个集中趋势指标。第二部分:单项选择题1.调查城镇居民对政府

4、服务的满意度,需要抽取足够的居民,这种方法称为( )A.随机抽样法B.统计分组法C .回归分析法D .大量观察法2.用部分数据推断总体数据的方法,属于( )A.理论统计学的容B.应用统计学的容C推断统计学的容D .描述统计学的容3.构成一个统计总体,必须具有若干特征,下列不属于统计总体特征的是( )C.变异性 D. 大量性4.下列不属于原始数据来源的是( )A.行政记录B.统计调查C.统计年鉴D.实验5.在进行普查时,必须要规定标准时间,其目的是为了( )A.避免登记的重复和遗漏B.确定调查对象的围C .确定调查单位D .保证调查的及时性6.某出口企业对其产品质量进行检验,采用的调查方式是(

5、)A.普查 B. 随机抽样调查C.判断抽样调查 D. 方便抽样调查7.了解居民消费水平的变化状况,一般采用入户调查。确定样本户的方式是( )A .系统抽样B.分层抽样C.整群抽样D.多步抽样8.抽样调查与普查的根本区别是( )A.作用不同 B. 灵活程度不同C.选取观察值的方法不同 D. 精确度不同9.在抽样调查中, ( )A.不会出现登记性误差,只会出现代表性误差B.会出现登记性误差,不会出现代表性误差C.既会出现登记性误差,也会出现代表性误差D既不会出现登记性误差,也不会出现代表性误差10.统计调查表中的调查项目就是( )A.统计指标 B. 统计数值C. 统计分组 D. 统计标志11.街头

6、拦截获得样本数据的方式属于( )A.普查 B. 方便抽样调查C.判断抽样调查 D.随机抽样调查12.普查中的标志时间是指( )A.进行调查工作的时间 B. 调查数据所属时间C.记录数据的时间 D. 数据上报的时间13.某次调查收集了 300 名学生的性别、专业和月手机支出额的数据,这项调查的变量个数 有( )A.1 个 B.2 个 C.3 个 D.300 个14.构成截面数据的两个要素是( )A组距和各组频数 B 组限和各组频数C组中值和各组频数 D 分组标志和各组频数15.在全距既定的情况下( )A.组数越多则组距越大B.组数越多则组距越小C.组数越少则组距越小D.组数与组距无对应关系16.

7、适合编制单值数列的数据是( )A.连续型变量且数据变动围较小B.离散型变量且数据变动围较小C连续型变量且数据变动围较大D.离散型变量且数据变动围较大17.在编制等距式分组数列时如果全距 57 ,组数为 7, 为了计算方便,组距应当取( )A.8.1 B. 8 C. 7 D. 1018.在平面直角坐标轴中,横轴刻度表示直方图的( )A.频数 B. 组中值C.组距 D. 组限19.对数据进行分组时,采用等距分组还是异组距分组,取决于( )A.变量值的多少B.次数的多少C .研究现象的特点D.组数的多少20.对工业企业按经济类型分组和按利润额分组( )A.都属于质别标志分组B.都属于量别标志分组C.

8、前者属于质别标志分组,后者属于量别标志分组D.前者属于量别标志分组,后者属于质别标志分组21.集中趋势描述指标中最常用的是( )A.算术平均数 B. 几何平均数 C. 众数 D. 中位数22.在离中趋势的描述指标中,最容易受极端值影响的是( )A 变异系数 B 方差C全距 D 标准23.用组中值来计算均值时,假定各组变量( )A. 次数相等B.组限是封闭的C.在组均匀分布或对称分布D .组中值是整数24.两组数据的均值不等,但标准差相等,则(25.已知甲班学生“统计学”的平均成绩为 86 分,标准差是 12.8 分,乙班学生“统计学” 的平均成绩是 90 分,标准差是 10.3 分,下列表述正

9、确的是( )乙班平均成绩的代表性高于甲班甲班平均成绩的代表性高于乙班 甲、乙两班平均成绩的代表性相同 甲、乙两班平均成绩的代表性无法比较26.对同一变量数列,以不同集中趋势指标为中心计算标准差,标准差数值最小的是( )A.以中位数为中心计算的标准差B.以算术平均数为中心计算的标准差C.以众数为中心计算的标准差D .以几何平均数为中心计算的标准差27.某地区城镇居民家庭年收入最多的是 7.2 万元,家庭年收入的平均数是 8 万元,该地区 家庭年收入的分布为( )A.左偏分布 B. 右偏分布 C.J 型分布 D. 对称分布28.权数对算术平均数的影响取决于( )。A 权数的总和 B 权数的绝对值

10、C 权数的平均数 D 权数的相对数29.某市有各类书店 500 家,其中大型 50 家,中型 150 家,小型 300 家。为了调查该市图书 销售情况,拟抽取 30 家书店进行调查。如果采用分层等比例抽样法,下列在大型、中型、 小型书店中样本的正确分配量为( )A.5、15、10 B.7 、10、13 C.10 、10、10 D.3 、9、1830.抽样调查中,无法避免和消除的是( )A.登记误差 B. 系统性误差C.随机误差 D. 测量工具误差31.估计量的数学期望等于总体参数这一性质称为( )A. 一致性 B. 无偏性C.有效性 D. 随机性32.总体均值的置信区间等于样本均值加减估计误差

11、,其中的估计误差等于置信水平的临界 值乘以( )A.样本均值的抽样标准差 B. 样本标志差C. 样本方差 D. 总体标志差33.下列关于统计量的表述中,不正确的是( )A.统计量是样本的函数B.估计同一总体参数可以用多个不同统计量C.统计量是随机变量D.统计量的数值是唯一的34.某品牌袋装白糖每袋重量的标志是 500 5 克。为了检验该产品的重量是否符合标准, 现从某日生产的这种糖果中随机抽查 10 袋,测得平均每袋重量为 498 克。下列说法中错误 的是( )A.样本量为10 B. 抽样误差是2克C.样本平均每袋重量是估计量 D点估计值为498克35.对一部贺岁片收视率进行调查,随机抽取 1

12、00 人,其中有 20 人没有看过该部贺岁片, 则看过该部贺岁片人数点估计值为( )20% B.20 C.80 D.80%36.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的 95%置信度的置信区间是( 56%,64%)。下列正确的表述是( )。A.总体比率的95%置信度的置信区间为(56% 64%B.总体真实比率有 95%勺可能落在(56% 64%中C.区间(56% 64%)有95%勺概率包含了总体真实比率D.由100次抽样构造的100个置信区间中,约有 95个覆盖了总体真实比率第三部分:多项选择题1.统计学的容包括(E.数据的整理方法2.统计数据必须具有的特点是(A.

13、数量性 B. 客观性C.具体性 D. 通用性E.总和性3.描述统计学的容包括( )A.收集数据的方法B.整理数据的方法C .用集中趋势量数描述数据D .用离中趋势量数描述数据E.用样本数据对总体数据进行推断4.推断统计学的容包括( )A.收集数据的方法B.怎样从总体中抽取样本C .用集中趋势量数描述数据D.怎样控制样本对总体的代表性误差E.用样本数据对总体数据进行推断5.统计数据的特点( )A.大量性B.客观性C.具体性D.总合性E.数量性6.统计数据按来源分类,可以分为( )A. 质别数据B.次级数据C.量别数据D.初级数据E.截面数据7.在抽样调查中,产生非抽样误差的原因有( )A.错误地

14、定义调查总体 B. 问卷设计的不合理C .抽样方法不正确 D. 被调查人员的配合程度E.调查人员的工作态度和业务水平8.调查过程中产生登记误差的原因是( )A.调查者记录数据有误B .调查者计算数据有误C.调查者汇总数据有误D.被调查者提供数据有误E.调查样本分布不合理9.对采集来的初级数据在整理之前应该进行( )A. 相关性审核B .完整性审核C .时效性审核D .适用性审核E.准确性审核10. 统计调查方案包括的容有( )A.调查的目的 B. 确定调查的对象C.确定调查项目和调查表 D.确定调查时间和地点E.确定调查的组织计划11.对于次级数据,应该进行以下一些方面的审核( )A.完整性

15、B. 准确性C.时效性 D. 适用性E. 合理性12.统计分组应该遵循的基本原则是( )A. 穷尽B.适用C.互斥D.合理E.随机13.关于离散型变量,下列表述正确的是( )A.可以采用单值分组B.可以采用组距分组C.相邻组的上下限可以间断D .相邻的上下限可以重叠E.可按“上限不在组”原则处理上下限相同的变量14.编制频数分布表的目的是( )A.显示数据的差异B.显示数据的分布状况C.显示数据的中心D.显示数据的相互关系E.显示数据的属性15.编制组距数列时,对于组限的确定, ( )A.最小组的下限应大于最小变量值B.最小组的下限应略小于最小变量值C.最大组的上限应小于最大变量值D.最大组的

16、上限应略大于最大变量值E.最小组的下限和最大组的上限应分别等于最小和最大变量值16.下列可以表示连续型变量的统计图有( )A. 条型图 B. 直方图C.折线图 D. 饼图E.茎叶图17.正确计算组中值的方法是( )A. (上限 +下限) /2B上限+下限/2C.上限-下限/2D上限-邻组组距/2E.下限+邻组组距/218.计算变异系数是为了比较( )A.不同变量数列的相对集中趋势B.不同变量数列的相对离中趋势C.不同变量数列的绝对离中趋势D.均值不同的变量数列的相对集中趋势E.均值不同的变量数列的相对离中趋势19.茎叶图包含如下信息( )A.变量的原始数据信息B.变量的频数信息C.累积频数信息

17、D.数据的分布形态信息E.数据的众数信息20.一组数据的标准差数值越小,说明该组数据的( )A 分布远离集中趋势指标 B 集中趋势指标具有较高的代表性C 分布比较接近集中趋势指标 D 集中趋势指标具有较低的代表性E 分布呈均匀分布21.这五个统计量是 ( )箱索图是用一组数据的五个顺序统计量来描述数据的分布状况的,A 中位数众数四分位数D 极值算术平均数22.变异系数抽象了(23.24.关于中位数,下列说法正确的有(C.E. 是根据所有标志值计算出来的)是一组数据一般水平的代表值D.当数据高度偏斜时更能描述集中趋势25.关于众数,下列说法正确的有(A.是数据中出现次数最多的标志值B.不受极端数

18、值的影响C.是一组数据一般水平的代表值D.对一个变量数列来说不一定存在E.是根据所有观测值计算出来的26.基本的随机抽样设计有( )A. 整群抽样B.分层抽样C.简单随机抽样D系统抽样E.多步抽样27.下列哪些情况符合使用正态分布的条件?( )A.从正态总体中抽取小样本,总体标志差已知B.从正态总体中抽取大样本,总体标志差已知C.从非正态总体中抽取小样本,总体标准差已知D.从非正态总体中抽取大样本,总体标志差未知E.从正态总体中抽取小样本,总体标准差未知28.以下哪些属于优良估计量的评价标准(A. 一致性 B. 把握性C.有效性 D. 无偏性E. 正态性29.在对总体均值进行区间估计时,影响置

19、信区间宽度的影响是( )A.总体中各个数据的差异程度B.抽取样本的方式C.样本容量的大小D.估计的可靠性E.总体数量的大小30.要提高抽样判断的精度,可采用的方法有( )A.增加样本单位数目B.减少样本单位数目C.缩小观测值之间的差异程度D.改善抽样的组织方式E .改善抽样的方法SPSS部分(一)单选题1.SPSS 主要应用于以下哪种类型的数据 ( )A、横截面数据B数据序列数据C面板数据D以上都不对2.SPSS 处理多选题格式在以下哪个菜单里进行( )A、设定表B多响应集C均值过程D交叉表3.检查异常值常用的统计图形( )A、条形图B箱体图C帕累托图D线图4.使用SPSS变换长形或宽形数据结构的过程是( )A、排列变量B正交设计C数据重组D数据转置5.线性回归里的残差分析不可能用于诊断( )A、残差独立性B变量分布C异常值侦察D最大迭代次数6.使用单尾还是双尾检验主要依据( )A、统计检验B理论依据C样本量大小D偏度或峰度值

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1