假设检验及方差分析.docx
《假设检验及方差分析.docx》由会员分享,可在线阅读,更多相关《假设检验及方差分析.docx(17页珍藏版)》请在冰豆网上搜索。
假设检验及方差分析
实验四假设检验
实验目的:
通过此实验熟练掌握如何利用假设检验工具根据不同条件选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果
实验要求:
能够运用Excel对总体均值进行假设检验,学会针对实际背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解
假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。
在Excel中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括Z—检验工具、T—检验工具和F—检验工具。
使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。
实验四主要介绍假设检验工具的使用。
一、假设检验的一般过程
假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。
根据全国汽车经销商协会报道,旧车的平均销售价格是10192美元。
堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。
结果样本平均价格是9300美元,样本标准差是4500美元。
在0.05的显著性水平下,检验H0:
H1:
。
问:
假设检验的结论是什么?
这名经理接下来可能会采取什么行动?
本例由于样本容量比较大,其均值近似服从正态分布,总体方差未知,需要用样本标准差来代替,选择T统计量进行检验。
T统计量的计算公式如下:
单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100))”,回车确认,得出t统计量为-1.982。
单击另一空单元格,输入“=TINV(0.025,99)”,回车确认,得出t分布的右临界值为2.276。
因为
,所以不拒绝原假设,认为此旧车经销处旧汽车平均销售价格不小于10192美元。
那么接下来这名经理会采取什么相应行动?
(请读者思考)。
本例主要介绍了假设检验的一般过程,利用Excel的公式和函数求出相应的统计量值和临界值,最后作出结论。
二、假设检验工具的使用
接下来介绍如何使用Excel的假设检验工具。
使用这一工具应该注意二点:
第一,由于现实世界和生活中大量的数据服从正态分布,Excel的假设检验工具是按正态总体设计的(以下各例未特殊说明,认为其服从或近似服从正态分布);第二,Excel的假设检验工具主要用于检验两总体之间有无显著差异。
具体来讲,Z—检验工具是对方差或标准差已知的两总体均值进行差异性检验;T—检验工具是对方差和标准差未知的两总体均值进行差异性检验,其中包括等方差假设检验、异方差假设检验和成对双样本检验;F—检验工具是对总体的标准差进行检验。
(一)Z—检验工具的使用
国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。
假定:
要求50名商务旅行者组成的随机样本给迈阿密机场打分,另50名商务旅行者组成的随机样本给洛杉机机场打分,最高等级为10分。
两个样本数据如下:
迈阿密机场得分数据:
64687763381048
7875958438554
4484562599848
995978310896
洛杉机机场得分数据:
109678798107657
35687108478699
53189685461098
3279531035108
假定两总体的等级标准差已知(这里用样本标准差代替总体标准差),分别为2.16和2.37。
问:
在5%的显著性水平下,迈阿密机场和洛杉机机场的平均等级有无差异?
将数据分别输入到Excel表中(A2:
A51;B2:
B51),在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“Z—检验:
双样本平均差检验”,回车进入该工具对话框,如图4-1所示。
图4-1Z—检验工具对话框
◆在“变量1和变量2”的区域框中,分别输入“A1:
A51”和“B1:
B51”(数据区域)。
◆“假设平均差(P)框”中,输入“0”。
◆“变量1的方差和变量2的方差”框中,分别输入“4.68”和“5.63”(总体方差)。
◆单击“标志(L)”复选框(因为数据区域有列标题);“
(A)”框中要求输入显著性水,本例按默认设置0.05即可。
◆本例选择“输出区域”设置框,在其中输入“C1”。
完成以上操作后,回车确认,在指定的区域给出计算结果,见表4-1。
表4-1Z—检验计算结果
结果解释与分析:
1、“平均”为样本均值;“已知协方差”指总体方差;“观察值”为样本个数。
2、表中给出的Z统计量为:
3、将Z统计量与临界值相比,本例采用双尾比较
,所以只能不拒绝原假设,认为两机场等级评分没有差异。
当然,也可以将显著性水平与P值比较,如果P值大于显著性水平则不拒绝原假设。
(二)T—检验工具的使用
1、假定两总体的方差相同
大学人员安排委员会公布了大学毕业生首次任职薪水数据下表列出了会计专业和财政专业样本每年薪水数据:
(单位:
千美元)
会计财政
28.826.3
25.323.6
26.225.0
27.923.0
27.027.9
26.224.5
28.129.0
24.727.4
25.223.5
29.226.9
29.726.2
29.324.0
采用0.05的显著性水平,检验会计专业和财政专业毕业生首次任职平均年薪是否存在差异?
将数据分别输入到Excel表中(A2:
A13;B1:
B13),在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“t—检验:
双样本等方差假设”,回车进入该工具对话框,如图4-2所示。
图4-2“t—检验:
双样本等方差假设”对话框
将各子对话框进行相应设置后(具体可参照Z—检验),回车确认,在指定的区域给出计算结果,见表4-2。
表4-2“t—检验:
双样本等方差假设”结果
结果解释与分析:
(1)合并方差是两样本方差的加权平均数,其计算公式为:
(2)df为“自由度”。
本例t检验统计量的自由度为12+12-2=22。
(3)tStat是t检验统计量,其计算公式为:
(4)将t统计量与临界值比较,本例采用双尾检验,2.23>2.07(0.04<0.05),所以拒绝原假设,认为会计专业和财政专业毕业生首次任职的平均年薪存在显著差异。
2、假定两总体的方差不相同
现有两种新旧软件包,为了评价新软件包的优点,随机抽取了24个系统分析人员作为样本。
其中,12个分析人员用旧软件包来开发指定信息系统,另外12个人用新软件包来开发,得到其开发使用时间(数据如下表)。
在5%的显著性水平下,问:
新软件包是否可以缩短完成项目的平均时间。
旧软件包新软件包
299315
360200
276214
310263
340334
388344
277282
365307
281290
315288
378318
310301
这是一个两总体均值的假设检验问题,用
表示“使用旧软件包开发指定系统所需的平均时间”,
表示“使用新软件包开发指定系统所需的平均时间”。
则此问题转变为:
H0:
H1:
假设两总体的方差不相同,则应从“分析工具”列表中选择“t—检验:
双样本异方差假设”,回车进入该工具对话框,如图4-3所示。
图4-3“t—检验:
双样本异方差假设”对话框
将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-3所示。
结果解释与分析:
(1)自由度df计算公式为:
df=
表4-3“t—检验:
双样本异方差假设”结果
(2)t统计量的公式计算为:
t=
(3)将t统计量与临界值相比,本例为单尾检验2.16>1.72(0.02<0.05),所以拒绝原假设,认为新软件包开发指定系统的时间要少于旧软件包。
3、基于成对数据的t检验
在使用T—检验工具的介绍中,上面两个例子其样本都是独立样本。
然而在可能情况下采用相关样本,可以进一步提高效率。
当然其检验方式也有所不同。
每月读书俱乐部成员进行了一项调查以确信是否其成员用于看电视的时间比读书时间多(《辛辛那提问询报》,1991年11月21日)。
假定:
从这次调查对象中抽取了一个小样本,得到了每周收看电视小时数和每周读书小时数的数据,数据如下表。
应答者
看电视
读书
d
1
10
6
4
2
14
16
-2
3
16
8
8
4
18
10
8
5
15
10
5
6
14
8
6
7
10
14
-4
8
12
14
-2
9
4
7
-3
10
8
8
0
11
16
5
11
12
5
10
-5
13
8
3
5
14
19
10
9
15
11
6
5
*d列为应答者看电视与读书的时间差
问:
在0.05的显著性水平下,能否得出每月读书俱乐部成员每周用于收看电视比用于读书的时间平均来说要多的结论?
对于成对数据的检验,“分析工具”列表中也提供了相应检验工具,选择“t—检验:
成对二样本均值分析”,打开其对话框,如图4-4所示。
将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-4所示。
图4-4“t—检验:
成对二样本均值分析”对话框
结果解释与分析:
(1)此分析方法的原理实际上是对d列数据进行t检验,问题转化为:
H0:
H1:
(2)df自由度=15-1=14,tStat为检验统计量,其计算公式为:
t=
其中
分别为
的样本均值和样本方差。
(3)泊松相关系数应为“皮尔逊相关系数”,反映两组数据线性相关程度。
(4)将tStat统计量与临界值相比,本例为单尾检验2.23>1.76(0.02<0.05),所以拒绝原假设,认为每月读书俱乐部成员每周用于收看电视比用于读书的时间平均来说要多。
表4-4“t—检验:
成对二样本均值分析”结果
(三)F—检验工具
在上例中,假设两个总体,即旧软件包和新软件包开发指定系统所需时间的方差不同,接下来,在0.05的显著性水平下检验这一结论是否正确,需要用到F—检验工具。
从“分析工具”列表中选择“F—检验:
双样本方差”,回车进入该工具对话框,如图4-5所示。
图4-5“F—检验:
双样本方差”对话框
将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-5所示。
表4-5“F—检验:
双样本方差”结果
结果解释与分析:
1、“F—检验工具”的原假设和备择假设分别为:
H0:
H1:
2、因为两个样本容量相同,所以F检验的第一自由度和第二自由度相同,都为11。
3、F统计量的计算公式为:
F=
4、如果原假设H0:
,则F统计量的计算公式变为:
F=
,其值为表4-5中F统计量的倒数,当然临界值也要改变。
5、将F统计量与临界值相比,0.83>0.35,所以拒绝原假设,认为新软件包开发指定系统所需时间的方差不小于旧软件包。
实验五方差分析
实验目的:
熟练使用“方差分析”工具在假设检验的基础上,对影响均值的各个因素进行分析。
实验要求:
对房产分析的结果能够作出正确合理的解释,包括对“SUMMAY”部分,方差分析部分从而判断该因素各水平是否对观测变量有显著影响,并作出相应的决策。
实验四介绍了假设检验,其中用了较多的篇幅介绍了两个总体之间均值的显著性检验,实际中还会遇到多个总体均值的检验问题。
如果按实验四的方法两两进行检验,将十分麻烦,并且部分总体有差别能否表明有总的差别,仍有待解决。
方差分析(Analysisofvariance,简称ANOVA)能够解决多个均值是否相等的检验问题,其由于在分析时将所有的样本资料结合在一起,从而使检验的稳定性增强,并且可以节省大量的时间。
方差分析作为一种实用、有效的分析方法在实践中被广泛的应用。
本部分主要介绍如何使用Excel中的数据分析工具进行方差分析。
一、单因素方差分析
单因素方差分析是在事物变化的若干因素中,只就某一特定因素分析,其它因素尽可能不变。
对从事营销的人员进行一项调查,以研究他们的职业道德标准观念。
假定下表是从研究中所获得的数据(高分表示道德标准高),如表5-1所示。
在0.05的显著性水平下,检验三组人员的观念是否存在显著差异。
表5-1研究数据
将数据输入表单后,在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“方差分析:
单因素方差分析”,回车进入该工具对话框,如图5-1所示。
图5-1“方差分析:
单因素方差分析”对话框
◆在“输入区域(I)”框中,输入数据所在的区域,本例为A1:
C7。
◆“分组方式”按默认的列;因有列标题,所以选择“标志位于第一行(L)”的复选框。
◆
要求输入显著性水平,本例按默认设置即可。
◆输出选项本例选择“新工作表(P)”(因输出内容比较多)。
完成以上设置后,回车确认,结果见表5-2。
表5-2“方差分析:
单因素方差分析”输出结果
结果解释与分析:
1、SS表示平方和。
组间SS(用SSA表示),计算公式为:
;组内SS(用SSE表示),计算公式为:
2、df为自由度。
SSA的自由度为k-1,其中k为因素水平的个数,SSE的自由度为n-k。
3、MS为平均平方。
组间MS(用MSA表示),计算公式为:
;组内MS(用MSE表示),计算公式为:
。
4、F统计量为:
5、将F统计量的值与给定显著性水平的临界值相比,本例7>3.68,所以拒绝原假设,认为三种营销人员观念有差异。
也可以将给出的P检验值与显著性水平比较,结论相同。
二、无重复(无交互作用)双因素的方差分析
双因素方差分析的内容是在影响事物变化的各种因素中选定两个因素,就其不同水平进行交叉的全面检测,分析究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不起作用。
进行双因素分析时,其各因素的不同水平可以重复测试(有交互作用),也可以不重复测试(无交互作用)。
本部分介绍无重复(交互作用)双因素分析。
有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素A)和销售地区(因素B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见表5-3。
表5-3不同品牌的彩电在各地区的销售量数据
试分析品牌和销售地区对彩电的销售量是否有显著影响(显著性水平为0.05)?
从“分析工具”列表中选择“方差分析:
无重复双因素分析”,回车进入该工具对话框,如图5-2所示。
图5-2“方差分析:
无重复双因素分析”对话框
◆在“输入区域(I)”框中输入数据所在的区域,本例为A2:
F6,并选定“标志(L)”复选框。
◆
取默认值0.05。
◆在输出选项中,选择“新工作表”。
完成以上设置后,回车确认,结果见表5-4。
结果解释与分析:
1、行为因素A,列为因素B。
各因素和误差项的(离差)平方和计算公式分别为:
;
;
2、三个平方和的自由度(df)分别是:
因素A的离差平方和SSA的自由度为k-1
因素B的离差平方和SSB的自由度为r-1
随机误差平方和SSE的自由度为(k-1)×(r-1)
3、因素A、B以及误差项的均方(MS),计算公式分别为:
;
;
4、因素A和因素B的检验统计量(F统计量),计算公式分别为:
;
5、将各因素检验统计量与给定显著性水平下的临界值相比(或P值与显著性水平相比):
FA=18.11>3.49(0.00<0.05);FB=2.10<3.26(0.14>0.05)。
说明彩电的品牌对销售量有显著的影响作用,销售地区对彩电的销售量没有显著影响。
表5-4“方差分析:
无重复双因素分析”结果
三、可重复(有交互作用)双因素的方差分析
在有些情况下,需要对因素间的交互效应做检验,这时需要进行“可重复双因素方差分析”,即每个因素必须重复取样至少2次以上。
在0.05的显著性水平,检验不同燃料(因素A)、不同推进器(因素B)下的火箭射程是否有显著差异?
交互作用是否显著?
实验数据见表5-5。
表5-5实验数据
从“分析工具”列表中选择“方差分析:
可重复双因素分析”,回车进入该工具对话框,如图5-3所示。
◆在“输入区域(I)”要求输入数据所在的区域,本例为“A2:
D10”。
◆“每一样本的行数(R)”,即重复实验的次数,本例为“2”。
◆
取默认值0.05。
◆在输出选项中,选择“新工作表”。
完成以上设置后,回车确认,结果见表5-5,5-6。
图5-3“方差分析:
可重复双因素分析”对话框
表5-5基本统计数据
SUMMARY
B1
B2
B3
总计
A1
计数
2
2
2
6
求和
110.80
97.40
126.10
334.30
平均
55.40
48.70
63.05
55.72
方差
15.68
112.50
10.13
68.91
A2
计数
2
2
2
6
求和
91.90
104.60
100.00
296.50
平均
45.95
52.30
50.00
49.42
方差
19.84
6.48
5.12
14.56
A3
计数
2
2
2
6
求和
118.40
144.10
79.90
342.40
平均
59.20
72.05
39.95
57.07
方差
1.62
2.64
1.13
209.89
A4
计数
2
2
2
6
求和
147.30
109.20
90.10
346.60
平均
73.65
54.60
45.05
57.77
方差
9.24
25.92
26.65
181.97
表5-6基本统计数据(续表)
总计
计数
8
8
8
求和
468.40
455.30
396.10
平均
58.55
56.91
49.51
方差
120.09
113.42
90.39
表5-7方差分析表
差异源
SS
df
MS
F
P-value
Fcrit
样本
261.67
3
87.22
4.42
0.03
3.49
列
370.98
2
185.49
9.39
0.00
3.89
交互
1768.69
6
294.78
14.93
0.00
3.00
内部
236.95
12
19.75
总计
2638.30
23
结果解释与分析:
1、方差分析表将差异来源分为样本、列、交互、内部四项,其中:
“样本”是指按行排列的四种燃料;“列”是指按列排列的三种推进器;“交互”是指燃料和推进器的交互作用;“内部”是指随机误差。
2、因素A、因素B、交互作用以及误差项的(离差)平方和SS的计算公式分别为:
;
;
3、四个平方和的自由度(df)分别是:
因素A的离差平方和SSA的自由度为k-1
因素B的离差平方和SSB的自由度为r-1
交互作用的离差平方和SSAB的自由度为(k-1)×(r-1)
随机误差平方和SSE的自由度为rk×(t-1)
4、因素A、B、交互作用以及误差项的均方(MS),计算公式分别为:
;
;
;
5、因素A、B以及交互效应的检验统计量(F统计量),计算公式分别为:
;
;
6、将因素A、B以及交互效应的检验统计量与给定显著性水平下的临界值相比(或P值与显著性水平相比):
FA=4.42>3.49(0.03<0.05);FB=9.39>3.89(0.00<0.05);FAB=14.93>3.00(0.00<0.05)。
所以在0.05的显著水平下,拒绝原假设,认为不同燃料或不同推进器的射程有显著差异,即燃料和推进器对射程的影响是显著的。
并且交互作用的效应也是高度显著的,从基本统计数据表(表5-5)中可以看出,A4与B1或A3与B2的搭配使火箭射程较其它水平的搭配要远得多,在实际中我们就选择最优的搭配方式来实施。