统计复习及答案.docx
《统计复习及答案.docx》由会员分享,可在线阅读,更多相关《统计复习及答案.docx(20页珍藏版)》请在冰豆网上搜索。
统计复习及答案
一.一家产品销售公司在30个地区设有销售分公司。
为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据.利用Excel得到下面的回归结果(
):
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
4008924。
7
8。
88341E—13
残差
—
—
总计
29
13458586.7
—
—
—
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
7589.1025
2445.0213
3。
1039
0。
00457
XVariable1
—117。
8861
31。
8974
—3.6958
0.00103
XVariable2
80。
6107
14。
7676
5。
4586
0。
00001
XVariable3
0。
5012
0。
1259
3。
9814
0。
00049
(1)将方差分析表中的所缺数值补齐。
(2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义.
(3)检验回归方程的线性关系是否显著?
(4)计算判定系数
,并解释它的实际意义。
计算估计标准误差
,并解释它的实际意义。
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
3
12026774。
1
4008924。
7
72。
80
8.88341E—13
残差
26
1431812。
6
55069。
7
-
—
总计
29
13458586.7
—
—
—
(2)多元线性回归方程为:
。
表示:
在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,销售量平均下降117。
8861个单位;
表示:
在销售价格和广告费用不变的情况下,年人均收入每增加一个单位,销售量平均增加80。
6107个单位;
表示:
在年销售价格和人均收入不变的情况下,广告费用每增加一个单位,销售量平均增加0.5012个单位.
(3)由于SignificanceF=8.88341E-13<
表明回归方程的线性关系显著。
(4)
,表明在销售量的总变差中,被估计的多元线性回归方程所解释的比例为89.36%,说明回归方程的拟合程度较高。
(5)
。
表明用销售价格、年人均收入和广告费用来预测销售量时,平均的预测误差为234.67.
一.一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(
)、行使时间(
)和行驶的里程(
)的有关数据进行回归,得到下面的有关结果(
):
方程的截距
42。
38
截距的标准差
回归平方和
回归系数
9.16
回归系数的标准差
残差平方和
回归系数
0。
46
回归系数的标准差
—
(1)写出每天的收入(
)与行使时间(
)和行驶的里程(
)的线性回归方程。
(2)解释各回归系数的实际意义.
(3)计算多重判定系数
并说明它的实际意义。
(4)计算估计标准误差
,并说明它的实际意义。
(5)若显著性水平α=0。
05,回归方程的线性关系是否显著?
(注:
)
(1)回归方程为:
。
(2)
表示:
在行驶里程不变的情况下,行驶时间每增加1小时,每天的收入平均增加9。
16元;
表示:
在行驶时间不变的情况下,行驶里程每增加1公里,每天的收入平均增加0.46元。
(3)
。
表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为85。
17%,说明回归方程的拟合程度较高.
(4)
.
表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17。
50元。
(5)提出假设:
:
,
:
至少有一个不等于0。
计算检验的统计量F:
于
,拒绝原假设
.这意味着每天收入与行驶时间和行驶里程之间的线性关系是显著的。
一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2002年的有关业务数据。
试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义
分行
编号
不良贷款(亿元)
各项贷款余额(亿元)
本年累计应收贷款(亿元)
贷款项目个数(个)
本年固定资产投资额(亿元)
1
0.9
67。
3
6。
8
5
51。
9
2
1.1
111.3
19.8
16
90.9
3
4.8
173.0
7.7
17
73。
7
4
3。
2
80.8
7.2
10
14。
5
5
7.8
199.7
16.5
19
63.2
6
2.7
16。
2
2.2
1
2.2
7
1.6
107。
4
10.7
17
20.2
8
12。
5
185。
4
27.1
18
43.8
9
1.0
96。
1
1.7
10
55.9
10
2.6
72。
8
9.1
14
64。
3
...。
..。
...。
。
。
..
...。
.。
.。
。
。
...。
.。
.。
..。
.。
..。
.。
....。
.
.。
.。
.。
...。
。
..。
.。
。
.。
。
。
........。
。
.。
.。
。
1.以不良贷款y为因变量,贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4为自变量建立四元线性回归模型,Excel的输出结果如下表,请填写方差分析表中的下划线部分:
回归统计
MultipleR
*****
RSquare
0。
79760399
标准误差
1。
77875228
观测值
*****
方差分析
df
SS
MS
F
SignificanceF
回归分析
******
*****
********
******
1。
03539E-06
残差
*****
*****
*******
总计
******
312.6504
Coefficients
标准误差
tStat
P-value
Intercept
—1.0216398
0。
78237236
—1。
305822925
0。
20643397
各项贷款余额(亿元)
******
0.01043372
3.83749534
0.00102846
本年累计应收贷款(亿元)
0.14803389
*******
1。
878737798
0.07493542
贷款项目个数(个)
0。
01452935
0.08303316
*******
0。
86285269
本年固定资产投资额(亿元)
-0.0291929
0。
01507297
-1。
936768921
0。
06703008
回归统计
MultipleR
0.89308678
RSquare
0。
79760399
AdjustedRSquare
0。
75712479
标准误差
1。
77875228
观测值
25
方差分析
df
SS
MS
F
SignificanceF
回归分析
4
249.371206
62。
34280156
19.7040442
1.03539E-06
残差
20
63。
2791938
3。
163959689
总计
24
312.6504
Coefficients
标准误差
tStat
P—value
Intercept
-1.0216398
0.78237236
—1.305822925
0.20643397
各项贷款余额(亿元)
0。
04003935
0.01043372
3。
83749534
0。
00102846
本年累计应收贷款(亿元)
0。
14803389
0.07879433
1.878737798
0。
07493542
贷款项目个数(个)
0.01452935
0。
08303316
0。
174982537
0。
86285269
本年固定资产投资额(亿元)
—0.0291929
0.01507297
-1.936768921
0.06703008
2、写出回归方程,并分析其回归系数的意义
3、设显著性水平
为0。
05,对回归方程的显著性进行检验
4、计算残差平方和决定系数
5、对回归系数
进行显著性检验。
某工厂近年的生产数据如下表所示:
序号
产量(千件)Q
技术改进支出T(万元)
单位产品成本AC(元/件)
总成本TC(万元)
1
3
2
72
21.6
2
5
3.2
70
35
3
7
5
69
48。
3
4
9
5
67
60.3
5
8
6
68
54。
4
6
9
7
66
59。
4
7
10
7.8
64
64
8
11
9。
5
64
70。
4
9
13
10.2
62
80.6
10
15
11
60
90
2.以单位产品成本AC为因变量,产量Q和技术改进支出T为自变量建立二元线性回归模型,Excel的输出结果如下表,请填写方差分析表中的下划线部分:
回归统计
MultipleR
0。
989028061
RSquare
0。
978176505
AdjustedRSquare
0.971941221
标准误差
0。
625760222
观测值
10
自由度
平方和
均方
F
p值
回归分析
_______
_______
_______
_______
0。
0000
残差
_______
_______
_______
总计
_______
128.6
系数
标准误差
t统计量
P—值
截距
79。
26543089
_______
126。
9434402
4。
96E—13
产量(千件)
-0.75456545
0.236593469
______
0.018259
技术改进支出(万元)
_______
0。
281584338
—1。
35469377
0.217609
3.根据回归结果计算自变量和因变量的相关系数.
4.设显著性水平
为0.05,对回归方程的显著性进行检验。
5.写出回归方程,并分析其回归系数的意义。
(15分)
某企业生产情况如下表
产品名称
计量单位
生产量
价格
报告期
基期
报告期
基期
甲
台
360
300
1500
1100
乙
件
200
200
1000
800
丙
只
160
140
250
250
要求:
遵循综合指数编制的一般原则,计算
(1)三种产品的产量总指数和价格总指数。
解:
根据已知资料计算得:
单位:
元
产品名称
甲
330000
396000
540000
乙
160000
160000
200000
丙
30800
40000
40000
合计
520800
596000
780000
(1)产量总指数:
(2分)
价格总指数:
(2分)
什么是回归分析中的随机误差项和残差?
它们之间的区别是什么?
答:
随机误差项Ut反映除自变量外其他各种微小因素对因变量的影响。
它是Yt与未知的总体回归线之间的纵向距离,是不可直接观测的。
(2.5分)。
残差et是Yt与按照回归方程计算的
的差额,它是Yt与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et的具体数值.利用残差可以对随机误差项的方差进行估计.(2.5分)
某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。
根据计算得到以下方差分析表,求A、B的值,并说明销售量的变差中有多少是由于广告费用的变动引起的?
变差来源
df
SS
MS
F
SignificanceF
回归
1
1422708.6
1422708.6
B
2.17E—09
残差
10
220158.07
A
总计
11
1642866。
67
2、A=SSE/(n—2)=220158。
07/10=22015.8072分
B=MSR/MSE=1422708.6/22015.807=64。
62212分
1分
表明销售量的变差中有88。
60%是由于广告费用的变动引起的。
1分
某家具公司生产三种产品的有关数据如下:
产品名称
总生产费用/万元
报告期产量比
基期增长(%)
基期
报告期
写字台
45.4
53。
6
14.0
椅子
30。
0
33.8
13.5
书柜
55.2
58。
5
8。
6
计算下列指数:
①拉氏加权产量指数;②帕氏单位成本总指数。
解:
1拉氏加权产量指数=
5分
②帕氏单位成本总指数=
根据下面的方差分析表回答有关的问题:
方差分析
差异源
SS
df
MS
F
P—value
Fcrit
组间
0。
001053
2
0。
000527
32.91667
1.34E-05
3。
88529
组内
0。
000192
12
0.000016
总计
0。
001245
14
注:
试验因素A有三个水平.
⑴写出原假设及备择假设;
⑵写出SST,SSA,SSE,
,MSA,MSE,n以及P值;
⑶判断因素A是否显著。
⑴原假设
1分
备择假设
不全等
⑵SST=0.001245SSA=0.001053SSE=0。
000192
MSA=0。
000527MSE=0.000016
P值=1.34E—054分
⑶F值=32.91667〉
拒绝原假设,因素A显著。
1分
某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
1
A
1422708。
6
C
2。
17E-09
残差
10
220158。
07
B
总计
11
1642866.67
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
363.6891
62。
45529
5。
823191
0.000168
XVariable1
1。
420211
0.071091
19。
97749
2.17E—09
①求A、B、C的值;②销售量的变差中有多少是由于广告费用的变动引起的?
③销售量与广告费用之间的相关系数是多少?
④写出估计的回归方程并解释回归系数的实际意义。
⑤检验线性关系的显著性(a=0。
05)
解
(1)A=SSR/1=1422708.6B=SSE/(n—2)=220158.07/10=22015。
807
C=MSR/MSE=1422708.6/22015。
807=64。
62212分
(2)
2分
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)
2分
(4)估计的回归方程:
1分
回归系数
表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
1分
(5)检验线性关系的显著性:
H0:
∵SignificanceF=2。
17E-09<α=0.05
∴拒绝H0,,线性关系显著。
2分
4、某企业三种产品的出口价及出口量资料如下:
出口价
出口量
基期p0
报告期p1
基期q0
报告期q1
甲
100
150
80
82
乙
80
140
800
1000
丙
120
120
60
65
(1)计算拉氏出口量指数;
(2)计算帕氏出口价指数
解:
4、随机抽查5家商场,得到广告支出(x)和销售额(y)资料如下:
广告支出(万元)x
1
2
4
4
6
销售额(万元)y
20
35
50
60
75
附:
=1830
=1769。
65
73
980
要求:
。
①计算估计的回归方程;
②检验线性关系的显著性(
=0.05)。
附F0。
05(1,5)=6。
61F0。
05(5,1)=230.2F0。
05(1,3)=10。
13F0.05(3,1)=215。
7
F0.025(1,5)=10。
01F0。
025(1,3)=17.44
现有某地区的啤酒销量数据如下,
年/季
啤酒销售量(Y)
年/季
啤酒销售量(Y)
2000/1
25
2004/1
29
2
32
2
42
3
37
3
55
4
26
4
38
2001/1
30
2005/1
31
2
38
2
43
3
42
3
54
4
30
4
41
2002/1
29
2
39
3
50
4
35
2003/1
30
2
39
3
51
4
37
为了计算季节指数,有如下步骤
年/季
啤酒销售量(Y)
C
比值y/c
2000/1
25
2
32
3
37
30.625
1.208163
4
26
32
0.8125
2001/1
30
33.375
0.898876
2
38
34.5
1.101449
3
42
34。
875
1。
204301
4
30
34.875
0。
860215
2002/1
29
36
0。
805556
2
39
37。
625
1.036545
3
50
38。
375
1。
302932
4
35
38.5
0.909091
2003/1
30
38.625
0.776699
2
39
39
1
3
51
39。
125
1.303514
4
37
39.375
0.939683
2004/1
29
40.25
0.720497
2
42
40。
875
1。
027523
3
55
41。
25
1.333333
4
38
41。
625
0.912913
2005/1
31
41.625
0.744745
2
43
41。
875
1.026866
3
54
4
41
1:
第C列第一个数据30.625的计算依据是什么?
写出30.625的计算过程
2:
试计算季节指数
3:
以2000年的数据计算分离了季节因素后的数据,并解释新得到的数据的意义