9、若时间序列有18年的数据,采用3年移动平均,修匀后的时间序列中剩下的数据有16个。
1、具有我国国籍并在我国境内长住的人(指自然人)、每一个人
2、频数密度6、7.1%
3、饼图、条形 7、t
4、286.5 8、P<α
5、44% 9、16
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分)
1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于()
①、应用统计学②、描述统计学③、推断统计学
2、若某总体次数分布呈轻微左偏分布,则成立的有()
①、
>
>
②、
<
<
③、
>
>
3、比较两组工作成绩发现
>
,
>
,由此可推断()
①、乙组
的代表性高于甲组②、甲组
的代表性高于乙组
③、甲、乙组的工作均衡性相同
4、通常所说的指数是指()
①、个体指数②、动态相对数③、复杂现象总体综合变动的相对数
5、抽样误差大小()
①、不可事先计算,但能控制②、能够控制,但不能消灭③、能够控制和消灭
6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为()
①、算术平均数②、中位数③、几何平均数
7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是()
①、简单随机抽样②、分层抽样③、等距抽样
8、在假设检验中,若
,则此检验是()
①、左侧检验②、右侧检验③、双侧检验
9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
在乘法模型中,季节指数是以其平均数等于什么为条件而构成的?
()
①、100%②、400%③、1200%
10、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为()
①、45②、40③、44
11、若直线回归方程中的回归系数
为负数,则()
①、
为0②、
为负数③、
为正数
12、当分布数列中各变量值的频率相等时()
①、该数列众数等于中位数②、该数列众数等于算术均值③、该数列无众数
13、某次考试学生的考试成绩
近似服从正态分布,
,则可认为有大约68.26%的学生考试成绩分布的范围是()
①、(70,80)②、(70,86)③、(62,94)
14、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为()
①、50%②、25%③、20%
1
2
3
4
5
6
7
②
②
①
③
②
③
③
8
9
10
11
12
13
14
①
①
③
②
③
②
②
1
2
3
4
5
6
7
①②
①②③
①③
①③
①②③
②③
①②③
三、多项选择题:
(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。
共7题,每题2分。
)
1、二手数据审核的主要内容是数据的()
①、适用性②、时效性③、准确性
2、下列命题正确的有()
①、样本容量与置信水平与正比②、样本容量与总体方差成反比
③、样本容量与边际误差成反比
3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有()
①、算术平均数②、移动平均数③、调和平均数
4、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明()
①、商品零售价格平均上涨了17.5%②、商品零售量平均上涨了17.5%
③、由于价格提高使零售额增长了17.5%
5、指出下列表述中哪些肯定是错误的()
①、
②、
③、
6、区间估计()
①、没有考虑抽样误差大小②、考虑了抽样误差大小③、能说明估计结论的可靠程度
7、回归分析中()
①、t检验是双侧检验②、F检验是检验回归方程的显著性
③、在一元线性回归分析中,t检验和F检验是等价的
四、判断题:
(判断命题的正误,对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。
共10题,每题1分。
)
1
2
3
4
5
6
7
8
9
10
×
×
×
×
√
×
√
√
×
×
(Y)1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据。
(Y)2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
(Y)3、箱线图主要展示分组的数值型数据的分布。
(N)4、异众比率主要用于衡量中位数对一组数据的代表程度。
(N)5、统计数据的误差通常有抽样误差和非抽样误差两类。
(N)6、若一组数据的均值是450,则所有的观测值都在450周围。
(Y)7、移动平均不仅能消除季节变动,还能消除不规则变动。
(N)8、右侧检验中,如果P值<α,则拒绝H0。
(Y)9、r=0说明两个变量之间不存在相关关系。
(Y)10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。
五、简要回答下列问题(共2题,每题6分。
)
2、根据下面的方差分析表回答有关的问题:
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
0.001053
2
0.000527
32.91667
1.34E-05
3.88529
组内
0.000192
12
0.000016
总计
0.001245
14
注:
试验因素A有三个水平。
⑴写出原假设及备择假设;
⑵写出SST,SSA,SSE,
,MSA,MSE,n以及P值;
⑶判断因素A是否显著。
答案⑴原假设
备择假设
不全等
⑵SST=0.001245SSA=0.001053SSE=0.000192
MSA=0.000527MSE=0.000016
P值=1.34E-05
⑶F值=32.91667>
拒绝原假设,因素A显著。
六、计算题:
(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)
1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Zα/2=2)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?
(设边际误差E=0.08)
1题解:
(1)n=50p=32/50=64%
E=
应抽取100户进行调查。
2、下面是某商店过去9周的营业额数据:
周序号
1
2
3
4
5
6
7
8
9
营业额
473
470
481
449
544
601
587
644
660
(1)采用指数平滑法(平滑系数α=0.5)预测第十周的营业额(F8=555.19);
(2)若经过计算,平滑系数α=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适?
2题解:
(2)平滑系数α=0.5时误差均方=3847.31<平滑系数
α=0.3时误差均方=5112.92
用平滑系数α=0.5预测更合适。
3、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
1
A
1422708.6
C
2.17E-09
残差
10
220158.07
B
总计
11
1642866.67
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
363.6891
62.45529
5.823191
0.000168
XVariable1
1.420211
0.071091
19.97749
2.17E-09
①求A、B、C的值;②销售量的变差中有多少是由于广告费用的变动引起的?
③销售量与广告费用之间的相关系数是多少?
④写出估计的回归方程并解释回归系数的实际意义。
⑤检验线性关系的显著性(=0.05)
3题解
(1)A=SSR/1=1422708.6B=SSE/(n-2)=220158.07/10=22015.807
C=MSR/MSE=1422708.6/22015.807=64.6221
(2)
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)
(4)估计的回归方程:
回归系数
表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)检验线性关系的显著性:
H0:
∵SignificanceF=2.17E-09<α=0.05
∴拒绝H0,,线性关系显著。
4、某企业三种产品的出口价及出口量资料如下:
出口价
出口量
基期p0
报告期p1
基期q0
报告期q1
甲
100
150
80
82
乙
80
140
800
1000
丙
120
120
60
65
(1)计算拉氏出口量指数;
(2)计算帕氏出口价指数
4题解:
统计学试卷及答案(三)
一、判断题
1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
()
2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。
()
3.统计数据误差分为抽样误差和非抽样误差。
()
4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据()
5.用来描述样本特征的概括性数字度量称为参数。
()
6.如果数据呈左偏分布,则众数、中位数和均值的关系为:
均值<中位数<众数。
()
7.通过散点图可以判断两个变量之间有无相关关系。
()
8.所有可能样本均值的数学期望等于总体均值。
()
9.影响时间序列的因素可分为:
长期趋势、季节变动、循环波动和不规则变动四种。
()
10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一种特殊相对数。
()
二、单项选择题1.D2.C3.B4.C5.B6.C7.A8.C9.B10.B11.B12.C13.C14.B15.B
1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中样本是()。
A100所中学B20个城市C全国的高中生D100所中学的高中生
2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。
这一数据属于()。
A分类数据B顺序数据C截面数据D时间序列数据
3.某连续变量数列,其首组为50以下。
又知其邻近组的组中值为75,则首组的组中值为()
A24B25C26D27
4.两组数据相比较()。
A标准差大的离散程度也就大B标准差大的离散程度就小
C离散系数大的离散程度也就大D离散系数大的离散程度就小
5.在下列指数中,属于质量指数的是()。
A产量指数B单位产品成本指数C生产工时指数D销售量指数
6.定基增长速度与环比增长速度的关系为()。
A定基增长速度等于相应的各个环比增长速度的算术和
B定基增长速度等于相应的各个环比增长速度的连乘积
C定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1
D定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%)
7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。
A1.8%B2.5%C20%D18%
8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。
A2倍B3倍C4倍D5倍
9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。
A低度相关关系B完全相关关系C高度相关关系D完全不相关
10.合理施肥量与农作物亩产量之间的关系是()。
A函数关系B相关关系C没有关系D正比例关系
11.在回归分析中,描述因变量
如何依赖自变量
和误差项
的方程称为()。
A回归方程B回归模型C估计的回归方程D理论回归方程
12.平均指标是用来反映一组数据分布的()的指标。
A相关程度B离散程度C集中程度D离差程度
13.在正态总体方差已知时,在小样本条件下,总体均值在1-
置信水平下的置信区间可以写为()。
A
B
C
D
14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将()。
A变宽B变窄C保持不变D无法确定
15.在同等条件下,重复抽样误差和不重复抽样误差相比()。
A两者相等B前者大于后者C前者小于后者D无法判断
三、多项选择题
1.按计量尺度不同,统计数据可分为三类即()
A时间序列数据B实验数据C分类数据
D顺序数据E数值型数据
2.统计调查方案的内容包括()。
A确定调查目的B确定调查对象和调查单位C设计调查项目和调查表
D调查所采用的方式和方法E调查时间及调查组织和实施的具体细则
3.反映分类数据的图示方法包括()。
A条形图B直方图C圆饼图D累积频数分布图E茎叶图
4.具有相关关系的有()。
A工号和工作效率B受教育程度与收入水平C子女身高和父母身高
D收入水平与消费量E人口与物价水平
5.下列属于时期数列的有()。
A某商店各月库存数B某商店各月的销售额C某企业历年产品产量
D某企业某年内各季度产值E某企业某年各月末人数
1.CDE2.ABCDE3.AC4.BCD5.BCD
五、计算分析题
1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:
10,8,12,15,6,13,5,11。
求总体均值95%的置信区间。
(已知
)。
(12分)
1.解:
已知n=8,总体服从正态分布,
未知,样本抽样分布服从t分布
置信下限=10-2.89=7.11
置信上限=10+2.89=12.89
总体均值
的95%的置信区间为[7.11,12.89]
2.已知某企业连续5年钢产量资料如下:
年份
1997
1998
1999
2000
2001
钢产量(千吨)
200
240
360
540
756
发展速度(%)
环比
-
定基
增长速度(%)
环比
定基
试根据上表资料填出表中数字。
(注意没有的数字划“—”,不准有空格)(10分)
3.某商场出售三种商品销售资料如下表所示:
(14分)
商品
名称
计量
单位
销售量
价格
(元)
销售额(元)
基期
q0
报告期
q1
基期
p0
报告期
p1
p0q0
p1q1
p0q1
甲
乙
丙
台
件
吨
100
250
400
120
300
600
80
18
40
82
20
50
合计
—
—
—
—
试计算:
(1)三种商品销售额总指数;
(2)三种商品的价格综合指数;(3)三种商品的销售量综合指数;(4)分析销售量和价格变动对销售额影响的绝对数和相对数。
(注:
计算结果保留2位小数)
4.某地区1991—1995年个人消费支出和收入资料如下:
(14分)
年份
1991
1992
1993
1994
1995
个人收入(万元)
64
70
77
82
92
消费支出(万元)
56
60
66
75
88
要求:
(1)计算个人收入与消费支出之间的相关系数,说明两个变量之间的关系强度;
(2)用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义。
(3)当个人收入为100万元时预测该地区的消费支出为多少?
(注:
计算结果保留4位小数)
答案:
统计学试卷(三)标准答案
一、判断题(在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分)
1.√2.√3.√4.×5.×6.√7.√8.√9.√10.√
五、计算分析题(本题共50分)
2.已知某企业连续五年钢产量资料如下:
年份
1997
1998
1999
2000
2001
钢产量(千吨)
200
240
360
540
756
发展速度(%)
环比
(—)
(120)
(150)
(150)
(140)
定基
(100)
(120)
(180)
(270)
(378)
增长速度(%)
环比
(—)
(20)
(50)
(50)
(40)
定基
(0)
(20)
(80)
(170)
(278)
3.某企业三种产品的销售资料如下表所示:
商品
名称
计量
单位
销售量
价格(元)
销售额(元)
2000年
q0
2002年
q1
2000年
p0
2002年
p1
p0q0
p1q1
p0q1
甲
乙
丙
台
件
吨
100
250
400
120
300
600
80
18
40
82
20
50
(8000)
(4500)
(16000)
(9840)
(6000)
(30000)
(9600)
(5400)
(24000)
合计
—
—
—
—
—
(28500)
(45840)
(39000)
解:
(1)三种产品销售额增长情况:
相对数:
商品销售额指数
绝对数:
(2)价格综合指数
(3)相销售量综合指数
(4)综合分析
160.84%=136.84%*117.54%
17340(元)=10500(元)+3840(元)
从相对数上看:
三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果。
从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果。
4.某地区1991-1995年个人消费支出和收入资料如下:
年份
个人收入(万元)x
消费支出(万元)y
1991
64
56
4096
3136
3584
1992
70
60
4900
3600
4200
1993
77
66
5929
4356
5082
1994
82
75
6724
5625
6150
1995
92
88
8464
7744
8096
合计
385
345
30113
24461
2712
(1)
,所以两个变量之间为高度相关。
(2)设估计的值直线回归方