3.61E-0&
K单雇临界
2.054004:
图5.10.2
可得,检验统计量为:
2
^r0S=8.2849
则有,
F=8.2849>甩(口—In—1)=F°.o25(24,21)=2.37
~2
因此,拒绝H。
,认为两种机器生产的袋茶重量的方差存在显著差异。
思考与练习(第六章)
思考题
1.什么是方差分析?
它所研究的是什么?
答:
方差分析(analysisofvarianee,ANOVA)是检验多个总体均值是否相等的统计方法。
本质上它研究的是分类型自变量对数值型因变量的影响。
3.方差分析中有哪些基本假设?
答:
(1)每个总体都应服从正态分布;
(2)各个总体的方差必须相同;(3)观测值
是独立的。
4.简述方差分析的基本思想。
答:
试验指标的变化可以用指标值的方差反映,导致试验指标值发生变化的原因有
两方面:
一是可控因素,二是不可控因素或未加控制因素。
方差分析就是将试验指标值
的方差分解成条件变差与随机误差,然后,将各因素形成的条件变差与随机误差进行
比较,评价由某种因素所引起的变异是否具有统计学意义。
6.简述方差分析的基本步骤。
答:
(1)提出假设;
(2)构造检验的统计量;(3)统计决策;(4)方差分析表。
7.解释水平项平方和、误差项平方和的含义。
答:
水平项误差平方和简记为SSA它是各组平均值与总平均值的误差平方和,反
映各总体的样本均值之间的差异程度,因此双称为组间平方各。
误差项平方和,简记为SSE它是每个水平或的各样本数据与其组平均值误差的平方和,反映了每个样本各观测
值的离散状况,因此双称为组内平方和或残差平方和。
11.解释试验、试验设计、试验单元的含义。
答:
试验:
收集样本数据的过程。
试验设计:
收集样本数据的计划。
试验单元:
接受“处理”的对象或实体。
12.简述完全随机化设计、随机化区组设计、因子设计的含义。
答:
含义:
完全随机化设计:
将k种“处理”随机地指派给试验单元的设计。
随机化区组设计:
先按一定规则将试验单元划分为若干同质组,称为“区组”,然后
再将各种处理随机地指派给各个区组。
因子设计:
考虑两个因素(可推广到多个因素)的搭配试验设计。
练习题
1.解:
提出假设:
H。
:
叫=二”3,出:
亠,讥,”3不完全相等
式中,叫为第i个样本的均值。
在ExceI中输入相关数据,如下图:
三个总休中抽収的样本数1S
样本1
样粧
祥本3I
158
153
169
14^8
142
158]
1&L
L56
1E0|
154
149
1&9
图6.1.1
利用单因素方差分析,可得
SUOaR?
詛
束和
平均
方差
ri
7^0
158
6L.5
悴本2
1
3
600
50T
150
leg
36.66667
121
方養分祈
es
df
ITS
F
F-VSJlJ-:
F£Tlt
filB.916S667
2
300.1583
4.657d
0.043877B.021517
更内
598
g
E6.<444^
总L
1216.91666/
li
图6.1.2
从分析方差表中可以看到,由于
F=4.6574cF0.01(2,9)=8.021517
所以不拒绝原假设,即不能认为3个总体的均值之间存在显著差异。
4.解:
对两个因素分别提出如下假设:
行因素(品种)为
已:
叫』2,叮厂打厂'不全相等
列因素(施肥方案)为
Ho:
丄1二”2二”3二^4已宀宀宀宀不全相等
在ExceI中输入相关数据,如下图:
5种种子和4种龍肥方案搭配试验的收获量
口口种
施肥方素
1
2
3
4
11
12
9.5
10-4
9.7J
r2
13.7
11.5
12.4
9・6
3
14,3
12.3
11,4
1L11
4
14+2
14
12.5
12
5
13
14
13.1
11.4
图6.4.1
利用无重复双因素分析,可得
方差井祈:
无垂農蕊囚素另析
SUIIUKY
求札1
壬均
1
丛F.
ior+
1-ZRhn-.rFrr
2
*
忆£
2.966666667
3
*
4玄L
12.275
2.OSZ&
4
*
52.7
13+17J
1.18^166£67
5
5L5
12.8^5
1.169166E67
1
6
S7-2
13*44
0.D13
2
5
61.3
LZ26
3.563
3
5
59.B
11,96
1.133
4
•5
53.b
10.
J.曲
芍差分折
SS
if
ns
F
F-valut?
cijt
19+067
4
4,76675
7.239716492
0.C033153.2E9167
列
1乩⑻F
3
a.0605
9.2045576?
8
0,01)1^49乩生9眈篩
7.901
L2
0.653416667
惡计
45.1435
19
图6.4.2
从分析方差表中可以看到,
由于,
Fr=7.239716492>F=3.2591667
所以拒绝原假设Ho,认为品种对收获量有显著影响。
由于,
Fr=9.20465763>F=3.490295
所以拒绝原假设H0,认为施肥方案对收获量有显著影响。
思考与练习(第七章)
思考题
1.相关分析与回归分析的区别和联系是什么?
答:
相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要
是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程
度。
回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。
但它们在研究目的和对变量的处理上有明显区别。
它们均是统计方法,不能揭示现象之间的本质关系。
3•什么是总体回归函数和样本回归函数?
它们之间的区别是什么?
答:
答:
以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:
EW门兀或并二天」+片。
总体回归函数是确定的和未知的,是回归分析所估计的对象。
样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系:
或•一总一疳匚S
回归分析的目的是用样本回归函数来估计总体回归函数。
它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本波动而变化;总体回归函数的参数-,
是确定的,而样本回归函数的系数
是随机变量;总体回归函数中的误差项
iu不可观察的,而样本回归函数中的残差项ie是可以观察的。
4•什么是机误差项和残差?
它们之间的区别是什么?
答:
随机误差项表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设。
残差项指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的。
它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式:
碍二片_(鋼禽)=(◎+/?
兀+吗I—(tz—0舌|=(£Z_G)——0応+比
5•为什么在对参数进行最小二乘估计之前,要对模型提出一些基本的假定?
答:
最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。
只有在一系列的经典假定下,最小二乘估计量才是
BLUE
11•为什么用可决系数能够度量回归方程对样本数据的拟合程度?
为什么对多元线性回归的多重可决系数要作修正?
答:
可决系数是测定变量间相关关系密切程度的统计分析指标,它也是反映自变量对
因变量的联合的影响程度。
可决系数越大,自变量对因变量的解释程度越高,自变量引起的
变动占总变动的百分比高。
观察点在回归直线附近越密集。
可决系数的取值范围在0到
1之间,它是一个非负统计量。
随着抽样的不同而不同,既是随样本而变动的统计量。
在样本容量一定下,随着模型中自变量个数的增加,可决系数R2会随之增加,模型
的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性。
12•对回归系数显著性作t检验的基本思想是什么?
在多元线性回归中,对参数作了t检验
以后为什么还要作方差分析和F检验?
答:
回归系数显著性检验是检验模型中每个自变量与因变量之间的线性关系是否显
著。
显著性检验是通过计算各回归系数的t检验值进行的。
回归系数的t检验值的计算
公式为:
=(j=1,2,…,k),式中是回归系数的标准差。
在多元回归模型中,某个变量回归系数的t检验没有通过,说明该变量与因变量之间不存在显著的线性相关关系,在回归分析时就可以将该变量删去,或者根据情况作适当的调整,而后用剩下的自变量再进行回归分析。
t检验仅是对单个系数的显著性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F检验就是对回归方程的整体统计显著性进行的检验方法。
17•试证明“在一元回归情形下F=t2,F检验与t检验是等价的”。
试证明在一元回归中t检
验与F检验是等价的。
练习题
2•解:
在ExceI中输入相关数据,如下图,
美国各航空公司的航班正点率和投诉率
航空公司名称
航班正点率〔%)
投诉率(次/1O万名乘客)
西南航空公司
81.81
0.21
大陆航空公司
76.6
0,58
西北航空公司
76.6J
85
美国航空公司
75.7:
0.68
联合航空公司
73.81
0.74
类删航空公司—
72.2J
①93
德尔塔航空公司
71.2I
0.72
美国西部航空公司
70.8
1.22
环球航空公司
68.5
1.25
图7.2.1
(1)如图
(3)
航脏正点率
图7.2.2
负相关关系
一町匚J'J
『归吨计
HulTlp1ef.
gE3^fiO74ZE
0.17钢953审
Adl_E3tedE2LlUklTE
0l7^7413321
Di1W0L7K4
方埒询Li
□1:
IS
FsnlllcarLce?
1
0.C.&菱
24flT36JQ.
XT
7
0.133036700
c.OEsees
Fit
8
CoeEUclents
标•雀w基
tSt*.t
f-vbJlelmetgatumETgmxF很紡一小-限甩氓
EritT-r亡如十
良017931930
1.0S225&e^
5-T1S&E1
①m2!
3-529G33債肌叙:
孔
二B29633B.50G431
-0-0704144
0-0141TS72
-4.a阳
7山的3;-0.03U9
图7.2.3
由Excel回归分析结果可得,y=6.017831995-0.0704144(
(4)估计的斜率系数为—0.0704144,表示航班的正点率每提高1%,百万名乘客的投诉
次数会下降:
0.0704144*1=0.0704144次。
(5)y=6.017831995-0.070414480=0.38
4.解:
要ExceI中输入相关数据,如下图,
嘩PI口】代忖*
iwwi"几》
:
庚"
年伤
1^79
3645.21?
22M・1
I9^3
S3欣机02
21fet^s*
LSB-O
吒CG2・S794E45.W
鶴箱7sotff.巳
1
1
■mr©豁E9310.33
3^42.g
3&-T4Ef.Z
1901
4R99・£0!
L
33&1・ES
19胛
TDJ42・4^
43919.O
L^CPZ
J53550.-fc31
ST1*b0
i珅丁
『口gQ・Q3r
a&
1^03
GE-2
4124・4
1咱B
8302^.前
9is@e.s
19S4
7£13„TE2
召曰3
i
ee^Te.1s>
□E5«=-3ta.m
19B3
^04□„*F3?
也曰£E
2aoo
5HMD.
i&itiE
1^0t7
1957^1口卑
1EO5CI・62
辱旦卫m□7@cM„6
3QQ1
2002
1Q3000tiL9■皿57
0鬧mO71^1.2
14M
3S^Ss>・冒空
3貝3奋,E
7744Cii.呂
L9EB
17□DO-52
111B4.2
2004
L5^3B£.7
BTC3Z„日
2jub
LS-iTS^Jl
jTte:
22a7
B・2
.9
20皿
sneoB
IJXg2
ia&a
它社・E:
羽
17205・M
图7.4.1
Excel回归分析,可得
£皿时0DTPE
ma
mtiplfK
Ol995陋刪
2沁re
OL931179504
AdjuEtoiESquare
0LHC852515
為髓
^37.300667
帆if
$S
11$
SiEni:
iC3(icef
1
29872652^93
29812652993
3Q3LO524刖
N3O662E-29
27
Z65B30411.T
冏*刃9MIKE
总计
23
30tSUBS90i
C:
-cfficzentE
tStat
P-VillLE
Lorer35S
In:
er342T.OG031S
SOL8&5B82T
Q・OOBT&153I
r6t2817fi3
呢77886c
0,545903^9
d0*******6
5LDB223393
2soesa-sj
O.^E6B21
:
:
'.f662Sa347
图7.4.2
(1)y=2427.0303130.54590327&
(2)由Excel回归分析结果可得,
标准误差:
3137.800667
1的t统计量为55.082234。
可决系数:
0.991179504
(3)提出假设:
H0:
:
-:
*,出:
:
=-■■*
H。
:
,二已:
亠*
由图7.4.2可得,
的t统计量为2.996756,
若取显著性水平为5%,查t分布表得
t°.025(29—2)=2.0518
显然,。
和B的t统计量都大于t°.025(29—2),表明应拒绝H。
y2007=2427.0303130.545903278236000=131260.2
利用预测系数的95%上下限计算可得到95%预测区间
124799.3793,137721.0287
案例分析
在ExceI中输入相关数据,如图1,
巾国轿车主立与相关園
至的数庭
轿车生产量
私人轼吝汽车拥
城销启民冢庭!
0
公踣里程
国內生产总愷
城镇居民人均可
年份
(万辆)
有量<万钢)
格尔系数g
(万公里〉
GDF(亿元)
支配收入(7E).
y
>3
町
x=
1990
3.5
聃.CT
54..24
102,33
198S7.E2
1510.2
二991
6.S7
30.3&
53+S
104.11
21781.5
1?
oo.e
1992
lb.17
41,78
53.14445
105.b7
2&3Z3.48
ZC26.6
19贮
22.29
53.85
50.3167
108.35
35333.92
257L4
:
9&4
26.97
75.£2
50i03928
11L.79
49197.66
349&,2
33.7
114.15
50.0906
115.7
6073(3.73
4283
1996
38,29
1^3.04
4S.76093
118,53
71176.59
4338.9
46.6
191.27
<6.59502
122.£4
73^73.Q3
5160.3
19&6
50.71
230.65
44.66099
127.35
64402.28
5425.1
1939
E7.1
304.09
42.06798
135.17
89677.05
5