?
L=?
L(X1,X2,…,Xn)与?
U=?
U(X1,X2,…,Xn),若对于任意?
有P(?
L
U)
1-a,则称随机区间[?
L,?
u]是?
的置信水平为1-a的置信区间,?
l与?
u分别称为置信下限和置信上限。
置信区间的大小表达了区间估计的精确性,置信水平表达了区间估计的可靠性,1-a是区间估计的可靠
程度,而a表达了区间估计的不可靠程度。
在进行区间估计时,必须同时考虑置信水平与置信区间两个方面。
对于置信区间的选取,一定要注意,决不能认为置信水平越大的置信区间就越好。
实际上,置信水平定的越大,则置信区间相应也一定越宽,当置信水平太大时,则置信区间会宽得没有实际意义了。
这两者要结合在一起考虑,才更为实际。
通常我们取置信水平为0.95,极个别情况下可取0.99或0.90,一般不取其他的置信水平。
1)单正态总体均值的置信区间
当,「叮」:
丄心;:
时,正态总体均值的置信区间有以下三种情况:
a)当总体方差已知时,正态总体均值I1.的1-a置信区间为:
b)
在MINITAB中,我们通过:
统计----->基本统计量----->单样本Z来实现的。
由于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。
b)当总体方差未知时,二用样本标准差S代替,此时正态总体均值I1的1-a置信区间为:
式中,I;〕;-1;表示自由度为n-1的t分布的分位数,也就是t分布的双侧a分位数。
13
例如a=0.05时,样本量n=16时,I…二二:
〕,其值略大于财
在MINITAB中,我们通过:
统计----->基本统计量----->单样本t来实现的。
某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:
1742
1827
1681
1742
1676
1680
1792
1735
1687
1852
1861
1778
1747
1678
1754
1799
1697
1664
1804
1707
假设运输费用是服从正态分布的,求运输费用均值的95%置信区间。
统计----->基本统计量----->单样本t----->样本所在列=运输费用----->选项----->置信水平=95>确定。
单样本T:
运输费用均值标
变量N均值标准差准误95%置信区间
运输费用201745.261.913.8(1716.2,1774.2)
c)前两种情况讨论的是当总体为正态分布时,•的区间估计,然而当总体不是正态分布时,如果样本量
n超过30,则可根据中心极限定理知道:
二仍近似服从正态分布,因而仍可用正态分布总提示的均
值•的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:
在MINITAB中,通常直接采用:
统计----->基本统计量----->图形化汇总中得到总体均值的置信区间结果。
只不过要注意的是:
总体非正态时,在小样本情况下此结果并不可信,只有当样本量超过30
后,由于中心极限定理的保证,此结果才是可信的。
2)单正态总体方差和标准差的置信区间
当时,正态总体方差的置信区间是:
(n-1)S5(n-l)S2
=5'Xaa(p-1)
(n-l)Ss
1,2(n-l)
当紆认O(■巧:
时,正态总体标准差的置信区间是:
某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:
1742
1827
1681
1742
1676
1680
1792
1735
1687
1852
1861
1778
1747
1678
1754
1799
1697
1664
1804
1707
假设运输费用是服从正态分布的,求运输费用方差和标准差的95%置信区间。
统计----->基本统计量----->单方差----->样本所在列=运输费用----->选项----->置信水平=
95>确定。
单方差检验和置信区间:
运输费用方法
卡方方法仅适用于正态分布。
Bonett方法适用于任何连续分布。
统计量
变量N
标准差方差
运输费用2061.93830
95%置信区间
标准差置信
方差置信区
变量方法
区间
间
运输费用卡方
(47.1,90.4)(2215,8170)
Bonett(49.0,86.6)(2401,7507)
求总体标准差置信区间另一种方法:
统计----->基本统计量----->图形化汇总----->变量:
运输费用----->
置信水平:
95----->确定
圏笳叱;匚总
9Sft何
A平方
F蓝
Q#
:
■7:
\
电星
1745.2
C1.9
3829.7
-0,9&£92-3
16610
宾一ISijM
1盘乙:
■=世監
17C,5
垃三口三亡骯
179*.3
LctJ.C
境臺蛊它国闾
Id
17742
16t?
.4r
mT
47.L
90.i
运输费用汇总
L7f»17ZO1H017-6017S01500
3)单总体比率的置信区间
当塔十二“歸时,也就是X取“非0则1”的0-1分布,我们常需要估计总体中感觉的那类比率的置信区
间,比如,一批产品中,不合格品率的大致范围;顾客满意度调查中,有抱怨顾客的比率范围等。
这里我们记总体比率为p,样本比率为p。
可以证明,当样本量足够大时(要求np>5及np(1-p)>5),
且p值适中(0.1
”*片!
骗:
..:
八J。
因此,由p
服从的正态分布构造总体比率p的置信区间为:
L列+你
一电视台为了调查新节目收视率,在节目放映时间内进行了电话调查。
在接受调查的2000名被调查
者中有1230名正在收看本节目。
求此节目收视率的95%置信区间。
统计----->基本统计量----->单比率----->汇总数据:
事件数=1230,实验数=2000----->选项----->置信水平:
95;勾选使用正态分布的检验和区间----->确定
由于np>5及np(1-p)>5,可用于正态分布近似二项分布,故可以勾选使用基于正态分布的检验和区间。
单比率检验和置信区间
样本XN样本p95%置信区间
1123020000.615000(0.593674,0.636326)
使用正态近似。
4)双总体均值差的置信区间
设有两个总体二”竝珂,从总体X中抽取的样本Xi,X2,…,Xn,样本均值为.,
样本方差为了,样本标准差为S;,;,从总体Y中抽取的样本丫1,丫2,…,Yn,样本均值为•,样本方
差为馬产岀,样本标准差为:
賞
对两总体均值差异■的区间估计常有以下三种情况:
a)两个总体均服从正态分布,且两个总体的方差-■■■都已知时,两总体均值差异一-•:
的1-
只要样本量足够大,无论两总体的方差是否相等,上式都成立。
b)两个总体均服从正态分布,且两个总体的方差•他异均未知时,两总体均值差异一-•:
的1-
111
nTn」
Qi—Y)—ta(n+m—2}Sp
1-TT
置信水平下的置信区间为:
-4--,0C-Y)+tt(n4m-2)Sp-+-nin4―-尸」n严
式中,
一家冶金公司需要减少其排放到废水中的生物氧需求量含量。
用于废水处理的活化泥供应商建议,用
纯氧取代空气吹入活化泥以改善生物氧需求量含量(此数值越小越好)。
从两种处理的废水中分别抽
取10个和9个样品,数据如下:
空气
184
194
158
218
186
218
165
172
191
179
氧气—
163
185
178
183
171
140
155
179
175
已知生物氧需求量含量服从正态分布,试确定:
该公司采用空气和采用纯氧减少生物氧需求量含量均值之差的95%置信区间。
(n—J十(m—
n+m-2
求两总体--一:
的置信区间:
统计----->基本统计量----->双样本t----->样本在不同列中:
第一=空气,
第二=氧气----->勾选假定等方差----->选项:
置信水平=95,备择=不等于----->确定。
双样本T检验和置信区间:
空气,氧气
空气与氧气的双样本T
均值标N均值标准差准误
空气10186.520.06.3
氧气9169.914.74.9
差值=mu(空气)-mu(氧气)
差值估计值:
16.61
差值的95%置信区间:
(-0.58,33.80)
差值=0(与工)的T检验:
T值=2.04P值=0.057自由度=17
两者都使用合并标准差=17.7356
c)当两个总体均服从正态分布,且两个总体的方差码吩啪均未知时,两总体均值差异•一--:
的
1-a置信水平下的置信区间为:
式中,自由度u的计算公式为:
假定A,B两名工人生产相同规格的轴棒,关键尺寸是轴棒的直径。
由于A使用的是老式车床,B使
用的是新式车床,二者精度可能有差异。
经检验,他们的直径数据确实来自两个方差不等的正态分布。
现他们各测定13根轴棒直径,数据如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
A
14.76
14.21
14.02
15.08
10.65
12.18
16.67
18.20
12.24
11.21
16.67
13.45
16.85
B
12.37
10.28
13.18
13.26
13.80
10.96
10.57
12.83
11.67
13.54
12.42
13.24
12.52
试确定A,B生产的轴棒直径差异的95%置信区间。
求两总体心7的置信区间:
统计----->基本统计量----->双样本t----->样本在不同列中:
第一=空气,
第二=氧气----->选项:
置信水平=95,备择=不等于----->确定。
双样本T检验和置信区间:
A工人,B工人A工人与B工人的双样本T
均值标
N均值标准差准误
A工人1314.322.350.65
B工人1312.361.150.32
差值=mu(A工人)-mu(B工人)
差值估计值:
1.965
差值的95%置信区间:
(0.435,3.496)
差值=0(与工)的T检验:
T值=2.71P值=0.015自由度=17
独立随机样本取自均值一_・•一未知,标准差未知的两个正态分布总体,若第一个总体样本标准差
S1=0.73,样本量n=25,,第二个总体样本标准差S2=0.89,样本量n=20,「--「。
求•一-:
的
95%置信区间。
统计----->基本统计量----->双样本t----->汇总数据:
第一(样本数量=25,均差=6.9,标准差=0.73),第
二(样本数量=20,均差=6.7,标准差=0.89)----->选项:
置信水平=95----->确定。
双样本T检验和置信区间
均值标样本N均值标准差准误
1256.9000.7300.15
2206.7000.8900.20
差值=mu⑴-mu
(2)
差值估计值:
0.200
差值的95%置信区间:
(-0.301,0.701)
差值=0(与工)的T检验:
T值=0.81P值=0.423自由度=36
5)双总体比率差的置信区间
设两个总体的比率分别为P1和p2,为了估计p1-p2,分别从两个总体中各随机抽取样本量为n1和n2的两
(Pi-Pa)-2
个随机样本,并计算两个样本的比率_T,可以证明p1-p2的置信水平为1-a的置信区间为:
为了解员工对工资的满意度,对250名男员工、200名女员工进行调查,数据如下:
区分
样本数
满意
男
250
110
女
200
104
合计
450
214
求男女员工对工资满意度差异的95%置信区间。
统计----->基本统计量----->双比率----->汇总数据:
第一(事件=110,实验=250),第二(事件=104,实验=200)----->选项:
置信水平=95----->勾选使用P的合并估计值进行检验----->确定。
双比率检验和置信区间样本XN样本p
11102500.440000
21042000.520000
差值=p⑴-p⑵
差值估计值:
-0.08
差值的95%置信区间:
(-0.172630,0.0126298)
差值=0(与丰0)的检验:
Z=-1.69P值=0.091
Fisher精确检验:
P值=0.106