统计学试题1.docx
《统计学试题1.docx》由会员分享,可在线阅读,更多相关《统计学试题1.docx(9页珍藏版)》请在冰豆网上搜索。
统计学试题1
复习题
1.简述中心极限定理。
从均值为(j>方差为3的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n》30,样本均值的抽样分布近似服从均值为卩方差为3/n的
正态分布。
2.一组数据的分布特征可以从哪几个方面进行测度?
答:
数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
3.甲企业近四年产品销售量分别增长了9%7%8%6%乙企业这四年产品的次品率也正好是9%7%8%6%这两个企业这四年的平均增长率和平均次品率的计算是否一样?
为什么?
答:
不一样。
因为计算的对象不同,所使用的方法不同。
平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:
四年的平均增长率=419%17%18%16%100%
平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权算术平均得到的,设四年的产品量分别为A、B、C、D,贝U
四年的平均次品率=(9%A+7%B+8%C+6%D)/(A+B+C+D)
4.如何理解权数的意义?
在什么情况下,应用简单算术平均数和加权算术平均数计算的结果是一致的?
答:
加权算术平均数中的权数,指的就是标志值出现的次数或各组次数的比重。
在计算平均时,由于出现次数多的标志值对平均数的形成影响大些,出现次数少的标
志值对平均数的形成影响小些,因此就把次数称为权数。
在分组数列的条件下,当各组标志值出现的次数或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同。
5.解释置信水平为95%的置信区间的含义。
答:
总体参数是固定的,未知的,置信区间是一个随机区间。
置信水平为95%
的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。
6.什么是显著性水平?
它对于假设检验决策的意义是什么?
答:
假设检验中犯第一类错误的概率被称为显著性水平。
显著性水平通常是人们
事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出拒绝原假设”的结论,其可靠性是确定的,但作出不拒绝原假设”的结论,其可靠性是难以控制的。
7.在总量指标的两因素分析中,指数体系如下:
Pi5Piqp°qi
p°q°PoqiP°q°
PiqiPoq。
(Piqip°q)(p°qp°qo)
以下计算出来的是一组与上述指数体系相对应的销售额、销售价格和销售量的数据。
请根据以下数据解释该指数体系的含义。
答:
这表明,报告期与基期相比,销售额增长了30%即2160万元,这是由于销售价格提高了8.33%,使销售额增加了600万元和销售量增长了20%使销售额增加了1560万元这两个因素共同作用的结果。
8.在近期的辩论中,一位政治家声称,由于美国的平均收入在过去的四年中增加了,因此情况正在好转。
他的政敌却说,由于在富人和穷人的平均收入之间存在着越来越大的差异,因此情况正在恶化。
同样数据,得出截然不同的结论,试用统计学的某些原理分析这场政治辩论。
答:
⑴利用平均数的原理,要有同质性作保证计算的平均数才能具有代表性,总体收入水平提高是好事,不同群体收入结构差异变大,又会导致社会问题。
所以分析时需要总平均数与组平均数结合;平均数与变异度指标结合才能说明问题。
⑵利用指数的因素分析法,因为反映平均收入的变动情况,分析时有两个因素,一是收入水平的变动分析,另一个是不同收入群体结构的变动分析。
要两者都均衡的增
加,才能较持续的增加
9•某厂质量管理部门的负责人希望估计某原材料的平均重量,抽取了一个由250包原材料组成的随机样本。
并测算出样本的平均值为65千克。
已知总体标准差=15千克。
试构造总体平均值卩的95%的置信区间。
(Zo.o251.96,Z0.051.645)
15
解:
总体均值的置信区间为
(X
(651.96^=)(63.14,66.86)
7250
10.某种零件的生产顺次经过四道工序,每道工序的次品率分别为10%、8%、5%
和4%,求四道工序的平均次品率。
解:
平均次品率=1-4(1-一10%)(1-一8%)(1-一5%)(1-一4%)=6.78%
11.某市场上四种蔬菜的销售资料如下表:
品种
销售量(公斤)
销售价格
q0p0
q0p1
q1p0
q1p1
(元/公斤)
基期
计算期
基期
计算期
q0
q1
P0
P1
白菜
550
560
1.6
1.8
880
990
896
1008
黄瓜
224
250
2
1.9
448
425.6
500
475
萝卜
308
320
1
0.9
308
277.2
320
288
西红柿
168
170
2.4
3
403.2
504
408
510
合计
1250
1300
—
—
2039.2
2196.8
2124
2281
(1)编制四种蔬菜的拉氏销售量指数;
(2)编制四种蔬菜的帕氏销售价格指数;
(3)编制四种蔬菜的销售额指数,并指出销售额指数与
(1)、
(2)两种指数的联系。
V
qe
2281
111.86%
q°P°
2039.2
V
111.86%
104.16%
107.39%LqPp
(4)从基期到报告期,四种蔬菜的销售总额增加了多少?
其中由于销售量变化和销售价格变化导致的销售总额变化的绝对数分别是多少?
从基期到报告期,四种蔬菜的销售总额增加了:
p1q1p0q022812039.2241.8
由于销售量变化导致的销售额变化的绝对数为:
p0qp0q021242039.284.8
由于销售价格变化导致的销售额变化的绝对数为:
p1q1p0q22812124157
12.某地区国内生产总值在1991—1993年平均每年递增12%,1994--1997年平均每年递增10%,1998--2000年平均每年递增8%。
试计算:
(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;
343
发展总速度(1仁%)°10%)(18%)259.12%
平均增长速度=10259.12%19.9892%
(2)若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002年可达多少?
2
500(16%)2561.8(亿元)
(3)若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为
105%,则2002年一季度的计划任务应为多少?
14570…
y
平均数
yj142.5
4j14(亿元),
2002年一季度的计划任务:
105%142.5149.625(亿元)
13.根据某市楼市2012年度统计,各房型第一季度和第二季度销售量和平均价格
数据如下:
楼型
销售量(万平方米)
平均价格(元/m2)
第一季度
第二季度
第一季度
第二季度
商品房住宅
562.34
607.45
6280
6353
经济适用房
144.40
157.71
3249
3303
存量房
115.30
124.72
2552
2521
二手房
70.48
71.62
3368
3154
商铺写字楼
22.26
20.38
13881
12589
第二季度与第一季度相比,求各房型价格的综合上涨幅度。
解:
房价上涨幅度
_6353?
607.453303?
157.712521?
124.723154?
71.6212589?
20.38
=6280?
607.453249?
157.712552?
124.723368?
71.6213881?
20.38
=0.14%
14.为研究中国改革开放以来国民总收入(x)与最终消费(y)的关系,收集到1978~2007年共30年的相应数据资料(单位:
亿元),经过Excel软件的线性回归分析,得到如下的回归结果(显著性水平a=0.05:
Coefficients
标准误差
tStat
P-value
Intercept
2761.610149
809.5944005
3.41110332
0.001985
X
0.537325604
0.008748706
61.4177216
2.08E-31
请根据以上信息回答分析下列问题:
(1)以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并解释回归
系数的经济意义。
答:
设线性回归方程为:
%=a+bXi,
由最小二乘法可得:
y=2761.6101+0.537:
Xi,回归系数0.5373表示国民总收入每增加一个单位,最终消费的增加额,即国民总收入的边际消费;回归系数2761.6101表示国民总收入为0时的最终消费。
(2)对自变量的回归系数进行显著性水平为5%的显著性检验,(请写清楚假设陈
述、判断依据、结论);t0.025(28)=2.0484;t°°5(28)=1.7011
答:
H0:
b=0;HJb?
0
由于P值=2.08*10-31,所以拒绝原假设,即国民总收入对最终消费有显著的影响。
(4)假定2008年中国的国民总收入为310000亿元,预测2008年最终消费的平均水平。
答:
预测2008年的最终消费为:
y?
=2761.610+0.5373(f=2761.61010.537③310000169332.5473
15.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行
了调查,用航班正点率作自变量,顾客投诉次数作因变量,经过Excel软件的线性回
归分析,得到如下的回归结果(显著性水平a=0.0):
方差分析
dfSSMSFSignificanceF
回归分析
1
8772.548
8772.548
24.59187
0.001108
残差
8
2853.816
356.727
总计
9
11626.4
Coefficients
标准误差
tStat
P-value
Intercept
430.1892
72.15483
5.962029
0.000337
x
-470.062
94.7894
-4.95902
0.001108
请根据以上信息回答分析下列问题:
(1)建立线性回归方程,并解释回归系数的意义
y>=430.1892-470x,
回归系数&=-470表示航班正点率每增加1%,顾客投诉次数平均下降4.7次
(2)计算回归估计的标准误差和可决系数;
=18.88722
SSR8772.584
==0.75454
SST11626.4
(3)对自变量的回归系数进行显著性水平为5%的显著性检验,(请写清楚假设陈述、判断依据、结论);t°.0男(8)=2.306;t0.05(8)=1.860
H0:
b=0,H1:
b?
0
-470.062
t==-4.95902<-2.306="25(8)
94.7894
所以,航班正点率对顾客投诉次数有显著的影响。
(4)如果航班正点率为80%估计顾客的投诉次数。
当航班正点率为80%
顾客的投诉次数平均为:
y0.8二430.1892-470*0.8=54.1892(次)
(5)求航班正点率为80%寸,顾客投诉次数95%勺预测区间
当航班正点率为80%寸,顾客投诉次数95%勺预测区间为:
1(X0.8-X)
I八-
n?
(Xi-x)
=54.1892贝2.30618.88722?
1+(0.8-0.7586)2
100.0397024
46.57
即:
(7.6,100.8)
(X=0.7586,?
(xi-X)2=0.0397024
16•给出某城市三个市场上有关同一种商品的销售资料如下表:
市场
销售价格(元/公斤)
销售量(公
斤)
基期
计算期
基期
计算期
A市场
2.50
3.00
740
P560
B市场
2.40
2.80
670
710
C市场
2.20
2.40
550
820
合计
1960
2090
⑴分别编制该商品总平均价格的可变构成指数、固定构成指数和结构变动
影响指数;
⑵建立指数体系,从相对数的角度进行总平均价格变动的因素分析;
466856364908
16解:
⑴X。
2.3816,X12.6967,X假定2.3483
196020902090
可变构成指数二基26967113.23%,
2.3816
固定构成指数-□假定蠶114.84%,
X假定
结构变动影响指数=
X假定
X0
2.3483
2.3816
98.60%
⑵2.34832.6967
2.6967
98.60%
114.84%113.23%
2.38162.3483
2.3816
分析:
由于结构变动使总平均价格下降1.4%和价格水平上升使总平均价格上涨
14.84%共同作用使总平均价格上涨13.23%