MINITAB统计基础.docx

上传人:b****5 文档编号:12064664 上传时间:2023-04-16 格式:DOCX 页数:36 大小:868.96KB
下载 相关 举报
MINITAB统计基础.docx_第1页
第1页 / 共36页
MINITAB统计基础.docx_第2页
第2页 / 共36页
MINITAB统计基础.docx_第3页
第3页 / 共36页
MINITAB统计基础.docx_第4页
第4页 / 共36页
MINITAB统计基础.docx_第5页
第5页 / 共36页
点击查看更多>>
下载资源
资源描述

MINITAB统计基础.docx

《MINITAB统计基础.docx》由会员分享,可在线阅读,更多相关《MINITAB统计基础.docx(36页珍藏版)》请在冰豆网上搜索。

MINITAB统计基础.docx

MINITAB统计基础

MINITAB统计基础

1.正态总体的抽样分布

1)样本均值,,的分布——标准正态分布及T分布

样本标准差计算公式:

T分布的定义:

Studenttdistribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且

它们相互独立,那么随机量

所服从的分布称为个自由度的t分布。

其分布密度函数为:

当一:

时的极限分布即是标准正态分布,

当二-时就是Cauchy分布。

t分布只包含1个参数。

数学期望和方差分别为o,一匸a-】时期望不存在,〔--方差不存在)。

们常常用冗门表示U个自由度的t分布。

MINITAB对于更一般的t分布还增加了一个“非中心参数”,

当非中心参数为0时,就得到了我们现在所说的t分布。

在用MINITAB计算时,只要注意这一点就行了。

自由度:

可以简单理解为在研究问题中,可以自由独立取值的数据或变量的个数。

范例:

Z~N(0,1),求Z=1.98时的概率密度。

计算----->概率分布----->正态分布----->概率密度----->输入常数1.98----->确定

概率密度函数

正态分布,均值=0和标准差=1

xf(x)

1.980.0561831

■■-o

计算----->概率分布----->正态分布----->累积概率----->输入常数2.4----->确定

累积分布函数

正态分布,均值=0和标准差=1

xP(X<=x)

2.40.991802

Z~N(0,1),求使得P(Z<x)=0.95成立的x值,即Z的0.95分位数。

计算----->概率分布----->正态分布----->逆累积概率----->输入常数0.95----->确定

 

逆累积分布函数

正态分布,均值=0和标准差=1

P(X<=x)x

0.951.64485

自由度=12,求使得戸溟二二:

.'ko

>确定

计算----->概率分布----->t分布----->逆累积概率----->输入自由度12----->输入常数0.95

 

逆累积分布函数

学生t分布,12自由度

P(X<=x)x

0.951.7822

自由度=12,求使得j唯-o

计算----->概率分布----->t分布----->累积概率----->输入自由度12----->输入常数3----->确定

累积分布函数

学生t分布,12自由度

xP(X<=x)

30.994467

2)双样本均值差的分布

3)正态样本正态样本方差S2的分布卡房卡方分布

若X1,X2,••…;Xn是从正态总体9..中抽出的一组样本量为n的独立随机样本,记

_1V"

1=1

!

口已知时:

 

当未知时,用「.替i丄后可以得到

a2

-Xa(n-D

 

其概率密度函数在正半轴上呈正偏态分布。

卡方分布的定义:

把n个相互独立的标准正态随机变量的平方和称为自由度为n的卡方分布。

它的密

度表达式为:

参数—称为自由度。

卡方分布有向右的偏斜,特别在较小自由度情况下(-越小,分布越偏斜)。

我们常用芒顒0表达自由度

为仪的卡方分布。

卡方分布有很多用途,其中一项就是用来分析单个正态总体样本方差的状况;还可以用来进行分布的拟合优度检验,即检验资料是否符合某种特定分布;对于离散数据构成的列联表,也可以用来分析两个离散型因子间是否独立等。

卡方分布的性质

a)卡方分布的加法性:

设X和Y彼此独立,且都服从卡方分布,其自由度分别为n1,n2。

若令Z=X+Y

则Z服从自由度为n1+n2的卡方分布。

b)若,则純订-i,阳Q-

计算下列各卡方分布的相关数值:

自由度=10,求使得廉严必盘:

叮泻成立的x值。

计算----->概率分布----->卡方分布----->逆累积概率----->自由度=10----->常数=0.95----->确定

 

逆累积分布函数卡方分布,10自由度

P(X<=x)x

0.9518.307

计算----->概率分布

>卡方分布

>累积概率----->自由度=10----->常数=28----->确定

 

累积分布函数卡方分布,10自由度

xP(X<=x)

280.998195

4)两个独立的正态样本方差之比的分布——F分布

两个独立的正态样本方差之比的分布是F分布。

设有两个独立的正态总体「-寸(占.,“冷和匚(恶j”务),它们的方差相等。

又设Xi,X?

,…,Xn是来自二(!

..厂)

的一个样本丫1,丫2,…,Yn是来自」)的一个样本,这两样相互独立。

它们的样本方差之比是自由

度为n-1和m-1的F分布:

1宀

S2n-

F==F{n™ljm—1)

5岛弘帀

1=1

n-1称为分子自由度;m-1为分母自由度;F分布的概率密度函数在正半轴上呈正偏态分布。

实际上,F统计量就是由两个卡方随机变量相除所构成的,如果gf閔;,弋『密&蟲,且二者相互独

立,则称二者比值的分布为F分布,即

F=守zF际%〕

其密度函数是:

F分布的应用非常广泛,尤其是在判断两正态总体方差是否相等以及方差分析(ANOVA)等问题上面。

计算F0.95(8,,18)的数值。

计算——>概率分布——>F分布——>逆累积概率——>分子自由度=8——>分母自由度=18——>

常数=0.95----->确定

逆累积分布函数

F分布,8分子自由度和18分母自由度

P(X<=x)x

0.952.51016

2.参数的点估计

1)点估计的概念

用单个数值对于总体参数给出估计的方法称为点估计。

设?

是总体的一个未知参数,人,X2,…,Xn是从总体中抽取的样本量为n的一个随机样本,那么用来估

计未知参数?

的统计量■:

(X1,X2,••%)称为?

的估计量,或称为?

的点估计。

我们总是在参数上方画一个帽子“"表示该参数的估计量。

在工程中经常出现的点估计问题之最好结果

对于总体方差

对于总体均值

是:

对于比率P,匸,x是样本量为n的随机样本中我们感兴趣的那类出现的次数;

对于-1--2,「•.一厂(两个独立随机样本均值之差);对于P1-P2,估计为两个独立随机样本比率之差);

2)点估计的评选标准

3.参数的区间估计

设?

是总体的一个待估参数,从总体中获得样本量为n的样本是X1,X2,…,Xn,对给定的显著性水平a(0

?

L=?

L(X1,X2,…,Xn)与?

U=?

U(X1,X2,…,Xn),若对于任意?

有P(?

L

U)

1-a,则称随机区间[?

L,?

u]是?

的置信水平为1-a的置信区间,?

l与?

u分别称为置信下限和置信上限。

置信区间的大小表达了区间估计的精确性,置信水平表达了区间估计的可靠性,1-a是区间估计的可靠

程度,而a表达了区间估计的不可靠程度。

在进行区间估计时,必须同时考虑置信水平与置信区间两个方面。

对于置信区间的选取,一定要注意,决不能认为置信水平越大的置信区间就越好。

实际上,置信水平定的越大,则置信区间相应也一定越宽,当置信水平太大时,则置信区间会宽得没有实际意义了。

这两者要结合在一起考虑,才更为实际。

通常我们取置信水平为0.95,极个别情况下可取0.99或0.90,一般不取其他的置信水平。

1)单正态总体均值的置信区间

当,「叮」:

丄心;:

时,正态总体均值的置信区间有以下三种情况:

a)当总体方差已知时,正态总体均值I1.的1-a置信区间为:

b)

在MINITAB中,我们通过:

统计----->基本统计量----->单样本Z来实现的。

由于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。

b)当总体方差未知时,二用样本标准差S代替,此时正态总体均值I1的1-a置信区间为:

式中,I;〕;-1;表示自由度为n-1的t分布的分位数,也就是t分布的双侧a分位数。

13

例如a=0.05时,样本量n=16时,I…二二:

〕,其值略大于财

在MINITAB中,我们通过:

统计----->基本统计量----->单样本t来实现的。

某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:

1742

1827

1681

1742

1676

1680

1792

1735

1687

1852

1861

1778

1747

1678

1754

1799

1697

1664

1804

1707

假设运输费用是服从正态分布的,求运输费用均值的95%置信区间。

统计----->基本统计量----->单样本t----->样本所在列=运输费用----->选项----->置信水平=95>确定。

 

单样本T:

运输费用均值标

变量N均值标准差准误95%置信区间

运输费用201745.261.913.8(1716.2,1774.2)

c)前两种情况讨论的是当总体为正态分布时,•的区间估计,然而当总体不是正态分布时,如果样本量

n超过30,则可根据中心极限定理知道:

二仍近似服从正态分布,因而仍可用正态分布总提示的均

值•的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:

在MINITAB中,通常直接采用:

统计----->基本统计量----->图形化汇总中得到总体均值的置信区间结果。

只不过要注意的是:

总体非正态时,在小样本情况下此结果并不可信,只有当样本量超过30

后,由于中心极限定理的保证,此结果才是可信的。

2)单正态总体方差和标准差的置信区间

当时,正态总体方差的置信区间是:

(n-1)S5(n-l)S2

=5'Xaa(p-1)

 

(n-l)Ss

1,2(n-l)

当紆认O(■巧:

时,正态总体标准差的置信区间是:

某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:

1742

1827

1681

1742

1676

1680

1792

1735

1687

1852

1861

1778

1747

1678

1754

1799

1697

1664

1804

1707

假设运输费用是服从正态分布的,求运输费用方差和标准差的95%置信区间。

统计----->基本统计量----->单方差----->样本所在列=运输费用----->选项----->置信水平=

95>确定。

单方差检验和置信区间:

运输费用方法

卡方方法仅适用于正态分布。

Bonett方法适用于任何连续分布。

统计量

变量N

标准差方差

运输费用2061.93830

95%置信区间

标准差置信

方差置信区

变量方法

区间

运输费用卡方

(47.1,90.4)(2215,8170)

Bonett(49.0,86.6)(2401,7507)

求总体标准差置信区间另一种方法:

统计----->基本统计量----->图形化汇总----->变量:

运输费用----->

置信水平:

95----->确定

圏笳叱;匚总

9Sft何

A平方

F蓝

Q#

■7:

\

电星

1745.2

C1.9

3829.7

-0,9&£92-3

16610

宾一ISijM

1盘乙:

■=世監

17C,5

垃三口三亡骯

179*.3

LctJ.C

境臺蛊它国闾

Id

17742

16t?

.4r

mT

47.L

90.i

运输费用汇总

 

L7f»17ZO1H017-6017S01500

3)单总体比率的置信区间

当塔十二“歸时,也就是X取“非0则1”的0-1分布,我们常需要估计总体中感觉的那类比率的置信区

间,比如,一批产品中,不合格品率的大致范围;顾客满意度调查中,有抱怨顾客的比率范围等。

这里我们记总体比率为p,样本比率为p。

可以证明,当样本量足够大时(要求np>5及np(1-p)>5),

且p值适中(0.1

”*片!

骗:

..:

八J。

因此,由p

服从的正态分布构造总体比率p的置信区间为:

L列+你

一电视台为了调查新节目收视率,在节目放映时间内进行了电话调查。

在接受调查的2000名被调查

者中有1230名正在收看本节目。

求此节目收视率的95%置信区间。

统计----->基本统计量----->单比率----->汇总数据:

事件数=1230,实验数=2000----->选项----->置信水平:

95;勾选使用正态分布的检验和区间----->确定

由于np>5及np(1-p)>5,可用于正态分布近似二项分布,故可以勾选使用基于正态分布的检验和区间。

 

 

单比率检验和置信区间

样本XN样本p95%置信区间

1123020000.615000(0.593674,0.636326)

使用正态近似。

4)双总体均值差的置信区间

设有两个总体二”竝珂,从总体X中抽取的样本Xi,X2,…,Xn,样本均值为.,

样本方差为了,样本标准差为S;,;,从总体Y中抽取的样本丫1,丫2,…,Yn,样本均值为•,样本方

差为馬产岀,样本标准差为:

对两总体均值差异■的区间估计常有以下三种情况:

a)两个总体均服从正态分布,且两个总体的方差-■■■都已知时,两总体均值差异一-•:

的1-

只要样本量足够大,无论两总体的方差是否相等,上式都成立。

b)两个总体均服从正态分布,且两个总体的方差•他异均未知时,两总体均值差异一-•:

的1-

111

nTn」

Qi—Y)—ta(n+m—2}Sp

1-TT

置信水平下的置信区间为:

-4--,0C-Y)+tt(n4m-2)Sp-+-nin4―-尸」n严

式中,

一家冶金公司需要减少其排放到废水中的生物氧需求量含量。

用于废水处理的活化泥供应商建议,用

纯氧取代空气吹入活化泥以改善生物氧需求量含量(此数值越小越好)。

从两种处理的废水中分别抽

取10个和9个样品,数据如下:

空气

184

194

158

218

186

218

165

172

191

179

氧气—

163

185

178

183

171

140

155

179

175

已知生物氧需求量含量服从正态分布,试确定:

该公司采用空气和采用纯氧减少生物氧需求量含量均值之差的95%置信区间。

(n—J十(m—

n+m-2

求两总体--一:

的置信区间:

统计----->基本统计量----->双样本t----->样本在不同列中:

第一=空气,

第二=氧气----->勾选假定等方差----->选项:

置信水平=95,备择=不等于----->确定。

 

双样本T检验和置信区间:

空气,氧气

 

空气与氧气的双样本T

均值标N均值标准差准误

空气10186.520.06.3

氧气9169.914.74.9

差值=mu(空气)-mu(氧气)

差值估计值:

16.61

差值的95%置信区间:

(-0.58,33.80)

差值=0(与工)的T检验:

T值=2.04P值=0.057自由度=17

两者都使用合并标准差=17.7356

c)当两个总体均服从正态分布,且两个总体的方差码吩啪均未知时,两总体均值差异•一--:

1-a置信水平下的置信区间为:

式中,自由度u的计算公式为:

 

假定A,B两名工人生产相同规格的轴棒,关键尺寸是轴棒的直径。

由于A使用的是老式车床,B使

用的是新式车床,二者精度可能有差异。

经检验,他们的直径数据确实来自两个方差不等的正态分布。

现他们各测定13根轴棒直径,数据如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

A

14.76

14.21

14.02

15.08

10.65

12.18

16.67

18.20

12.24

11.21

16.67

13.45

16.85

B

12.37

10.28

13.18

13.26

13.80

10.96

10.57

12.83

11.67

13.54

12.42

13.24

12.52

试确定A,B生产的轴棒直径差异的95%置信区间。

求两总体心7的置信区间:

统计----->基本统计量----->双样本t----->样本在不同列中:

第一=空气,

第二=氧气----->选项:

置信水平=95,备择=不等于----->确定。

 

双样本T检验和置信区间:

A工人,B工人A工人与B工人的双样本T

均值标

N均值标准差准误

A工人1314.322.350.65

B工人1312.361.150.32

差值=mu(A工人)-mu(B工人)

差值估计值:

1.965

差值的95%置信区间:

(0.435,3.496)

差值=0(与工)的T检验:

T值=2.71P值=0.015自由度=17

独立随机样本取自均值一_・•一未知,标准差未知的两个正态分布总体,若第一个总体样本标准差

S1=0.73,样本量n=25,,第二个总体样本标准差S2=0.89,样本量n=20,「--「。

求•一-:

95%置信区间。

统计----->基本统计量----->双样本t----->汇总数据:

第一(样本数量=25,均差=6.9,标准差=0.73),第

二(样本数量=20,均差=6.7,标准差=0.89)----->选项:

置信水平=95----->确定。

 

双样本T检验和置信区间

均值标样本N均值标准差准误

1256.9000.7300.15

2206.7000.8900.20

差值=mu⑴-mu

(2)

差值估计值:

0.200

差值的95%置信区间:

(-0.301,0.701)

差值=0(与工)的T检验:

T值=0.81P值=0.423自由度=36

5)双总体比率差的置信区间

设两个总体的比率分别为P1和p2,为了估计p1-p2,分别从两个总体中各随机抽取样本量为n1和n2的两

(Pi-Pa)-2

个随机样本,并计算两个样本的比率_T,可以证明p1-p2的置信水平为1-a的置信区间为:

为了解员工对工资的满意度,对250名男员工、200名女员工进行调查,数据如下:

区分

样本数

满意

250

110

200

104

合计

450

214

求男女员工对工资满意度差异的95%置信区间。

统计----->基本统计量----->双比率----->汇总数据:

第一(事件=110,实验=250),第二(事件=104,实验=200)----->选项:

置信水平=95----->勾选使用P的合并估计值进行检验----->确定。

 

双比率检验和置信区间样本XN样本p

11102500.440000

21042000.520000

差值=p⑴-p⑵

差值估计值:

-0.08

差值的95%置信区间:

(-0.172630,0.0126298)

差值=0(与丰0)的检验:

Z=-1.69P值=0.091

Fisher精确检验:

P值=0.106

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 其它模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1