典型例题-G-方差分析-3
东部
北部
中部
南部
西部
15
12
10
14
13
17
10
14
9
12
14
13
13
7
9
11
17
15
10
14
14
12
8
10
7
9
五个地区每天发生交通事故的次数如表1所示。
由于是随机抽样,有一些地区的样本容量较多,(如南部和西部)而有些地区样本容量较少(如东部)。
试以α=0.01的显著性水平检验各地区平均每天交通事故的次数是否相等。
解:
计算原数据的和:
东部
北部
中部
南部
西部
15
12
10
14
13
17
10
14
9
12
14
13
13
7
9
11
17
15
10
14
14
12
8
10
7
9
合计
57
66
64
55
67
以及原数据的平方和:
东部
北部
中部
南部
西部
225
144
100
196
169
289
100
196
81
144
196
169
169
49
81
121
289
225
100
196
196
144
64
100
49
81
合计
831
898
834
539
771
单因素方差分析表
方差来源
SS
df
MS
F
组间
82.6371
4
200.6593
3.6762
组内
118.0167
21
5.6198
总差异
200.6538
25
假设检验:
H0:
μ1=μ2=μ3=μ4=μ5,五个地区平均每天交通事故的次数相等。
H1:
μ1,μ2,μ3,μ4,μ5不全相等,五个地区平均每天交通事故的次数不相等。
查表得:
F0.01(4,21)=4.37>F=3.6762
所以接受H0,即五个地区平均每天交通事故的次数相等。
典型例题-H-相关与回归分析-2
设有统计资料如下表所示。
某地居民消费和收入的相关表
单位:
百元
消费支出y
15
20
30
40
42
53
60
65
70
78
可支配收入x
18
25
45
60
62
75
88
92
99
98
用EXCEL的回归分析(置信度90%),得到如下结果:
试通过用公式计算,比较对照,理解所得结果。
解:
x-bar=66.2,y-bar=47.3
相关系数为
SSR+SSE=4033.517565+100.5824353=4134.1=SST
对于第一部分:
通过以上计算分析,可知:
MultipleR0.987760119是相关系数;
RSquare0.975670053是判定系数;
AdjustedRSquare0.972628809是根据以下公式来计算的:
标准误差3.545815055是根据以下公式来计算的:
观测值10是原始数据的个数,即n。
对于第二部分:
第一列df是自由度,第1行的1表示是一元线性回归;第二行是残差的自由度n-2=8,第三行是总的自由度1+8=9;
第二列SS是误差平方,第一行是SSR=4033.517565,第二行是SSE=100.5824353,第三行是SST=4134.1,这里有SSR+SSE=SST;
第三列MS是平均误差平方,第一行是MSR=4033.517565/1=4033.517565,第二行是MSE=100.5824353/8=12.57280441;
第四列F是F=MSR/MSE=4033.517565/12.57280441=320.6128779;
最后一列SignificanceF是用EXCEL函数FDIST(320.8128779,1,8)计算出来的。
9.67595E-08是科学计数法,表示9.67595×10-8
对于第三部分:
第一列Coefficients是回归系数,第一行是截距的回归系数,即β0^=-0.20887175,第二行是斜率的回归系数,即β1^=0.717656673;
第二列标准误差,第一行是截距的标准误差,是根据以下公式来计算的:
第二行是斜率的标准误差,是根据以下公式来计算的:
第三列tStat,即t统计量,由对应的回归系数除以标准误差:
-0.20887175/2.879726332=-0.072531806
0.717656673/0.040067369=17.91125004
第四列Pvalue,是用EXCEL函数TDIST(|tStat|,n-2,2)计算出来的,第一个参数是t统计量,第二个参数是自由度,第三个参数2表示双尾。
TDIST(|-0.072531806|,8,2)=TDIST(0.072531806,8,2)=0.943959317
TDIST(|17.91125004|,8,2)=TDIST(17.91125004,8,2)=9.67595E-08
9.67595E-08是科学计数法,表示9.67595×10-8
第五、六列的Lower95%,Upper95%是EXCEL默认的95%置信度下,截距和斜率的置信区间,是根据以下公式来计算的:
即:
即:
第七、八列的下限90%,上限90%是根据输入的90%置信度下,截距和斜率的置信区间,是根据以下公式来计算的:
即:
即:
典型例题-I-时间序列分析-1
某企业某种产品的有关资料如表1所示。
表1
年份
1994
1995
1996
1997
1998
1999
产量(件)
9500
逐期增长量(件)
—
500
510
累计增长量(件)
—
环比发展速度(%)
—
104.0
定基增长速度(%)
—
10.0
增长1%的绝对值(件)
—
95
109
要求:
(1)将表中空格数字填齐;
(2)计算1994年-1999年间该企业产量的年平均增长速度。
解:
(1)
年份
1994
1995
1996
1997
1998
1999
产量(件)
9500
10000
10400
10450
10900
11410
逐期增长量(件)
—
500
400
50
450
510
累计增长量(件)
—
500
900
950
1400
1910
环比发展速度(%)
—
105.3
104.0
100.5
104.3
104.7
定基增长速度(%)
—
5.3
9.5
10.0
14.7
20.1
增长1%的绝对值(件)
—
95
100
104
104.5
109
(2)
年平均增长速度=
典型例题-J-指数-1
给出某市场上四种蔬菜的销售资料如下表所示。
品种
销售量(公斤)
销售价格(元/公斤)
基期
计算期
基期
计算期
莲白
8500
8800
1.00
1.15
莲藕
7000
7200
1.80
1.70
茄子
6300
6200
1.50
1.75
芹菜
5400
5900
1.50
1.30
合计
27200
28100
-
-
要求:
(1)用拉氏公式编制四种蔬菜的价格总指数和销售量总指数;
(2)再用帕氏公式编制四种蔬菜的价格总指数和销售量总指数;
(3)比较两种公式编制出来的价格总指数和销售量总指数的差异。
解:
p0q0
p0q1
p1q0
p1q1
莲白
8500
8800
9775
10120
莲藕
12600
12960
11900
12240
茄子
9450
9300
11025
10850
芹菜
8100
8850
7020
7670
合计
38650
39910
39720
40880
(1)拉氏价格指数和销售量指数
(2)帕氏价格指数和销售量指数
(3)拉氏价格指数和销售量指数
即由于价格上涨2.77%,使销售额增加了1070元;又由于销售量增长3.26%,使销售额增加了1260元。
帕氏价格指数和销售量指数
即由于价格上涨2.43%,使销售额增加了970元;又由于销售量增长2.92%,使销售额增加了1160元。