统计学复习题目Word文档格式.docx
《统计学复习题目Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学复习题目Word文档格式.docx(20页珍藏版)》请在冰豆网上搜索。
4、总量指标和平均指标反映了现象总体的规模和一般水平。
但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。
()
5、普查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法
6、抽样调查是指为特定目的专门组织的非经常性全面调查
7、直方图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的
8、条形图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义
9、直方图的各矩形通常是连续排列,条形图则是分开排列
10、茎叶图(stem-and-leafdisplay)是用于显示未分组的原始数据的分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字
11、中间数是一组数据中出现次数最多的变量值
12、众数(mode)是一组数据中出现次数最多的变量值
13、中位数(median)是数据排序后处于中间位置上的值
14、四分位数(quartile)是数据排序后处于25%和75%位置上的值
15、平均差是(range)一组数据的最大值与最小值之差
16、平均差(meandeviation)是各变量值与其平均数离差绝对值的平均数
17、自由度是指附加给独立的观测值的约束或限制的个数。
从字面涵义来看,自由度是指一组数据中可以自由取值的个数,当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。
按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。
18、标准分数的(性质)是均值等于0,方差等于1
19、标准分数(性质)是:
z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1
20、经验法则表明:
当一组数据对称分布时:
约有68%的数据在平均数加减1个标准差的范围之内,约有95%的数据在平均数加减2个标准差的范围之内
约有99%的数据在平均数加减3个标准差的范围之内
21、离散系数(coefficientofvariation)是标准差与其相应的均值之比
22、系统抽样(stratifiedsampling)是将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
23、分层抽样(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位
24、整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
25、多阶段抽样(multi-stagesampling)是先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将该方法推广,使抽样的段数增多,就称为多阶段抽样。
26、样本分布(populationdistribution)总体中各元素的观察值所形成的分布,分布通常是未知的,可以假定它服从某种分布
27、总体分布(populationdistribution)总体中各元素的观察值所形成的分布,分布通常是未知的,可以假定它服从某种分布
28、样本分布(sampledistribution)一个样本中各观察值的分布,也称经验分布,当样本容量n逐渐增大时,样本分布逐渐接近总体的分布
29、总体分布(sampledistribution)一个样本中各观察值的分布,也称经验分布,当样本容量n逐渐增大时,样本分布逐渐接近总体的分布
30、抽样分布(samplingdistribution),样本统计量的概率分布,是一种理论分布,在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。
31、样本均值的数学期望是:
32、统计一词包含统计工作、统计资料、统计学等三种涵义。
33、样本均值的方差:
重复抽样
34、样本均值的方差:
不重复抽样
35、比例(proportion)总体(或样本)中具有某种属性的单位与全部单位总数之比,不同性别的人与全部人数之比,合格品(或不合格品)与全部产品总数之比。
36、样本比例可表示为:
37、总体比例可表示为
38、样本比例的抽样分布在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布,是一种理论概率分布。
当样本容量很大时,样本比例的抽样分布可用正态分布近似
39、样本比例的抽样分布(数学期望与方差),样本比例的数学期望:
40、样本比例的方差,重复抽样:
41、样本比例的方差,不重复抽样:
42、样本比例的方差,不重复抽样:
43、推断统计(descriptivestatistics)是研究数据收集、整理和描述的统计学分支
44、两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差
45、两个样本均值之差的抽样分布服从正态分布,其分布的方差为各自的方差之和。
46、分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似,分布的数学期望为
47、分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似,分布的方差为各方差之和:
48、点估计(pointestimate)是用样本的估计量的某个取值直接作为总体参数的估计值。
49、点估计无法给出估计值接近总体参数程度的信息,虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值
50、区间估计(intervalestimate)是在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到,根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。
51、标志变异指标数值越大,则平均指标的代表性就越小。
52、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度
53、推断统计是(inferentialstatistics)研究如何利用样本数据来推断总体特征的统计学分支
54、截面数据(cross-sectionaldata)是在相同或近似相同的时间点上收集的数据
55、回归分析与相关分析的区别是:
相关分析中,变量x变量y处于平等的地位;
回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化
56、相关系数的经验解释:
|r|≥1时,可视为两个变量之间高度相关
0.5≤|r|<
0.8时,可视为中度相关
0.3≤|r|<
0.5时,视为低度相关
|r|<
0.3时,说明两个变量之间的相关程度极弱,可视为不相关
上述解释必须建立在对相关系数的显著性进行检验的基础之上
57、时间序列数据(timeseriesdata)是在不同时间上收集到的数据
58、样本是指所研究的全部个体(数据)的集合,其中的每一个个体也称为元素
二、多项选择题(有2个或者以上的答案)
1、下列标志中属于数量标志的有( )
A.性别 B.工种 C.工资 D.民族 E.年龄
2、某工业企业1900年产值为2000万元,1998年为1990年的150%,则年平均增长速度、平均增长量为( )
A.年平均增长速度=6.25% B.年平均增长速度=5.2%C.年平均增长速度=4.6%D.年平均平等量=125万元 E.年平均增长量=111.11万元
3、如果用P表示商品价格,用Q表示商品零售量,则公式ΣP1Q1-ΣP0Q1的意义是( )
A.综合反映价格变动和销售量变动的绝对额
b.综合反映多种商品价格变动而增减的销售额
C.综合反映总销售额变动的绝对额
D.综合反映多种商品销售量变动的绝对额
E.综合反映由于价格变动而使消费者增减的货币支出额
4、抽样估计的优良标准有( )
A.无偏性B.有效性C.准确性D.一致性E.系统性
5、平均数的种类有()。
A.算术平均数B.众数C.中位数
D.调和平均数E.几何平均数
6、下列属于正相关的现象是()
A.家庭收入越多,其消费支出也越多
B.某产品产量随工人劳动生产率的提高而增加
C.流通费用率随商品销售额的增加而减少
D.生产单位产品所耗工时随劳动生产率的提高而减少
E.产品产量随生产用固定资产价值的减少而减少
7、下列哪些关系是相关关系()
A.圆的半径长度和周长的关系
B.农作物收获和施肥量的关系
C.商品销售额和利润率的关系
D.产品产量与单位成品成本的关系
E.家庭收入多少与消费支出增长的关系
8、下列属于负相关的现象是()
A.商品流转的规模愈大,流通费用水平越低
B.流通费用率随商品销售额的增加而减少
C.国民收入随投资额的增加而增长
E.某产品产量随工人劳动生产率的提高而增加
9、若两个变量之间的相关系数为-1,则这两个变量是()
A.负相关关系B.正相关关系C.不相关
D.完全相关关系E.不完全相关关系
10、相关系数是零,说明两个变量之间的关系()
A.完全不相关B.高度相关C.低度相关
D.不相关E.显著相关
11、总体参数估计有()和()两种方法。
A、点估计B、精确估计C、区间估计
12、下列变量中属于离散变量的有()。
A.车床台数B.学生人数
C.耕地面积D.粮食产量
E.汽车产量
13、直线回归分析中()。
A.自变量是可控制量、因变量是随机的
B.两个变量不是对等的关系
C.利用一个回归方程、两个变量可以互相推算
D.根据回归系数可以判断相关的方向
14、下列属于正相关的现象是()
A.家庭收入越多,其消费支出也越高
B.某产品产量随工人劳动生产率的提高而增加
C.流通费用率随商品销售额的增加而减少
D.生产单位产品所耗工时随劳动生产率的提