04区间估计与假设检验.docx

资源描述

04区间估计与假设检验.docx

《04区间估计与假设检验.docx》由会员分享，可在线阅读，更多相关《04区间估计与假设检验.docx（23页珍藏版）》请在冰豆网上搜索。

04区间估计与假设检验.docx

04区间估计与假设检验

第四章区间估计与假设检验

统计推断（StatisticalInference）是采用样本统计量（如：

），根据抽样分布特征，对相应的总体参数所做的估计。

《质量专业理论与实务》第一章参数估计和假设检验，其中，点估计已经在本书第三章“统计描述”部分进行了讲解，本章讲解区间估计和假设检验的内容。

第一节区间估计

一、区间估计的概念

点估计仅仅给出参数一个具体的估计值，但是没有给出估计的精度，而区间估计是用一个区间来对未知参数进行估计，区间估计体现了估计的精度。

设θ是总体的一个待估参数，其一切可能取值组成的参数空间为Θ，记从总体中获得样本量为n的样本为

，对给定的α（0<α<1），确定两个统计量

和

若对任意

有

，则称随机区间

是θ的置信水平为1-α的置信区间，简称

是θ的1-α的置信区间，θL与θU分别称为θ的1-α的置信下限和置信上限。

图4-1从N（50000，50002）总体中随机取出的100个容量为4的样本求得的置信区间

1-α的置信区间的含义是：

所构造的随机区间

覆盖未知参数的θ的概率为1-α。

由于这个随机区间随样本观察值的不同而不同，它有时覆盖了参数θ，有时没有覆盖θ，但是用这种方法做区间估计时，100次中大约有100（1-α）个区间能覆盖未知参数θ。

图4-1中每一条竖线表示由一个样本量为4的样本按照给定的

与

求得的一个区间。

重复抽取100个样本，就得到100个这样的区间，在（a）中，100个区间有51个包含了参数真值θ=50000，这对于50%的置信区间来说是一个合理的偏离；在（b）中，100个区间有90个包含参数真值θ=50000，这与90%的置信区间一致。

如果P（θ<θL）=P（θ>θU）=α/2，则称这种置信区间为等尾置信区间。

正态总体参数的置信区间及比例p的置信区间都是等尾置信区间。

二、正态总体的置信区间

设总体分布为N（μ,σ2），从中抽取的样本为

，样本均值为

，样本方差为S2，样本标准差为S。

1、总体均值μ的置信区间的求法：

μ的估计一般用样本均值

，从

的分布来构造置信区间。

①总体标准差σ已知时：

利用正态分布可得μ的1-α的置信区间为：

也可记为：

其中，

是标准正态分布的

分位数。

总体标准差已知时的计算方法比较简单，没有必要使用SPSS进行计算。

②总体标准差σ未知时：

当总体标准差σ未知时，σ用其估计值s代替，利用t分布可以得到μ的1-α的置信区间为：

也可记为：

其中，

表示自由度是n-1的t分布的

分位数。

〖例4-1〗某钟表厂对一批钟表轴进行了检验，数据如表4-1，在SPSS中数据输在变量为x的一列上，见附件“手表轴（区间估计4-1）”，要求计算平均值的区间估计。

（α=0.05）

表4-1手表轴检验结果表

4.68

4.89

4.49

4.83

6.08

4.73

5.34

5.46

5.29

4.07

5.51

3.99

5.57

4.76

4.99

5.21

5.08

4.87

4.80

4.41

5.04

5.69

6.03

6.34

4.86

4.56

4.05

5.34

4.52

5.57

5.19

4.86

5.49

3.86

4.28

4.52

4.63

5.52

4.95

5.02

5.23

5.18

5.05

5.51

5.53

5.05

5.81

4.59

5.10

5.87

5.23

4.65

4.80

4.82

4.97

5.35

4.13

5.72

4.96

5.11

6.10

5.18

4.50

4.83

5.05

5.43

4.58

4.07

4.26

5.76

4.70

5.20

4.79

4.78

5.51

4.34

5.16

5.24

5.06

5.14

5.72

4.49

4.42

6.03

5.22

5.24

4.71

4.36

4.95

5.35

4.25

4.78

4.79

5.38

4.12

5.10

3.57

3.52

5.34

4.82

4.97

4.74

3.76

5.41

5.07

4.06

4.56

5.51

4.02

6.28

4.74

4.56

5.34

4.94

5.12

5.31

4.98

5.08

5.00

6.04

6.00

5.21

4.86

3.01

5.30

5.74

5.30

5.04

4.01

4.52

5.23

4.98

5.67

6.30

4.78

5.12

5.25

5.04

5.51

5.16

5.08

4.87

6.02

5.33

5.36

5.05

5.45

5.90

5.46

4.79

4.97

4.05

5.74

4.89

3.46

5.28

4.93

5.02

5.09

5.84

5.17

4.55

5.44

5.01

5.40

5.35

4.46

4.57

5.71

5.13

5.03

4.74

3.79

5.07

5.06

6.24

5.85

5.53

4.90

3.68

5.90

3.09

5.64

5.31

5.62

3.96

5.11

4.84

5.20

4.85

5.30

4.29

3.52

4.23

5.00

4.27

4.97

5.10

在SPSS上的实现过程：

图4-1单击Analyze，选择Explore

[步骤1]在菜单栏上单击Analyze，在下拉菜单中选取DescriptiveStatistics，在这个菜单的子菜单中选择Explore。

[步骤2]在左侧的变量列表中选择变量，将变量x选入DependentList的变量列表中。

图4-2将变量x选入DependentList的变量列表中

[步骤3]在Display选择框中选择Statistics选择项，定义结果中只输出统计量。

[步骤4]单击OK按钮，完成。

Descriptives

Statistic

Std.Error

Mean

4.9940

.04269

95%ConfidenceIntervalforMean

LowerBound

4.9098

UpperBound

5.0782

5%TrimmedMean

5.0117

Median

5.0445

Variance

.365

Std.Deviation

.60379

Minimum

3.01

Maximum

6.34

Range

3.33

InterquartileRange

.6279

Skewness

-.506

.172

Kurtosis

.692

.342

图4-3Descriptives过程的结果

从图4-3的结果可以看出，关于变量x的基本的描述性统计量，前三行分别是总体均值的点估计值4.994、标准误0.04269、总体均值的95%置信区间的下限值4.9098和上限值5.0782。

2、总体方差σ2与标准差σ的置信区间的求法：

σ2的估计常用样本方差S2，因此从S2的分布来构造置信区间。

利用

分布可以得到σ2的1-α的置信区间为：

其中

和

分别是

分布的

分位数和

分位数。

将上式两边开方，可得到σ的1-α的置信区间为：

〖例4-1〗某钟表厂对80见机械零件的外径进行了检验，测得平均值是95.00mm，标准差为15.00mm，试估计总体方差。

（α=0.05）

在SPSS中求

的计算公式为“IDF·CHISQ[α/2（或1-α/2，n-1）]”。

公式的应用方法见第二章。

[步骤1]单击Transform，选择ComputeVariable，出现如图4-4所示的公式计算过程，在结果变量（TargetVariable）输入一个地址（计算结果将放在这个变量中），这里第一个结果变量地址为：

g，第二个结果变量地址为h。

[步骤2]将

转换到公式“IDF·CHISQ[0.025，79）]”；

将

转换到公式“IDF·CHISQ[0.975，79）]”；公式中的数字是填进去的。

然后单击OK，计算完成。

=56.31；

=105.47。

4-4图卡方的函数计算

于是有得出总体方差为：

总体标准差的区间估计是：

[12.98，17.77]

第二节假设检验

一、单个总体均值的T检验

假设检验的基本原理和过程在《质量专业理论与实务（中级）》中已经讲的很详细了，由于T检验在企业管理中应用最多，所以这里重点讲T检验。

通常情况下，总体标准差σ是未知的，所以在质量管理过程中，经常使用的假设检验一般也是T检验。

〖例4-2〗某化工厂生产的某种溶液的标准浓度为20.00mg/L。

现抽取一个样本量为11的样本，使用某种方法测量其浓度，数据如表4-2。

问：

用该方法测量所得结果是否与标准浓度有所不同？

表4-2某种溶液的浓度数据表

次数

浓度

20.99

20.41

20.10

20.00

20.91

22.41

20.00

23.00

22.00

19.89

21.11

⑴分析步骤如下：

检验假设，确定检验水平α。

H0：

测量结果所对应总体的浓度μ与标准浓度μ0相等，即μ=μ0；

H1：

测量结果所对应总体的浓度μ与标准浓度μ0不相等，即μ≠μ0（包括μ＜μ0，μ＞μ0）。

α=0.05。

检验统计量：

拒绝域：

⑵在SPSS上实现。

[步骤1]输入数据，如图4-5。

[步骤2]在菜单栏上选择Analyze命令。

[步骤3]在Analyze命令下拉菜单中选择One-Sample-T-Test…命令，如图4-6。

图4-5输入数据

图4-6选择One-Sample-T-Test…命令

图4-7单击按钮，将左边的变量x选入TestVariable（s）变量列表中

[步骤4]在左侧的变量中，选中变量x，单击按钮，其选入TestVariable（s）变量列表中，在TestValue框中输入需要比较的总体均值20，然后单击OK按钮，计算完成。

结果见图4-8和4-9。

One-SampleStatistics

Mean

Std.Deviation

Std.ErrorMean

20.9836

1.06750

.32186

图4-8单样本统计结果

从图4-9的检验结果可以看出，统计量t=3.056。

根据相伴概率p=0.012<α=0.05，因此，认为过程与标准值有明显差异，因此拒绝H0，接受H1，认为该测量方法（或生产过程）所得到的结果所对应的总体均值μ与标准浓度μ0间的差异有统计学意义。

One-SampleTest

TestValue=20

Sig.（2-tailed）

MeanDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

3.056

.012

.9836

.2665

1.7008

图4-9单个总体均值的T检验结果

根据统计推断，结合相应的专业知识，给出一个专业的结论：

采用例题中所使用的方法测量溶液的浓度效果欠佳，该测量方法有待进一步改进；如果对测量方法的有效性没有异议，则可能是生产过程发生了变化，溶液的浓度发生了偏移。

如图4-9所示，在结果中还给出了样本均值与总体均值差值的95%置信区间，为[0.2665,1.7008]，平均差值是0.9836。

图4-10One-SampleTTest：

Options选择窗口

该计算过程所用置信水平为SPSS默认值，即α=0.05。

在实际工作中，有时候根据技术要求或顾客的要求，用户可能需要对其进行修改，这时可以单击图4-7右下方的“Options…”按钮，出现如图4-10所示的One-SampleTTest选择窗口，用户可以根据要求将ConfidenceInterval后面的95改为需要的值（例如90或99），这时计算的结果将是样本均值与总体均值的新的（更改后的值）置信区间。

二、两独立样本的T检验

㈠统计学上的定义和计算公式

定义：

所谓独立样本是指两个样本之间彼此独立没有任何关联，两个独立样本各自接受相同的测量，研究者的主要目的是了解两个样本之间是否有显著差异存在。

这个检验的前提如下：

●两个样本是相互独立的，即从一个总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响，两组样本的样本量可以不同，样品的顺序可以任意调整。

●样本来自的两个总体应该服从正态分布。

例如，企业对同一个车间的同一种产品进行检验，分为车间组织的自检和质量部组织的专检，获得两组数据，这两组数据不可能完全相等。

现在的问题是，这两组数据是否有有显著的差异。

还有，质量改进前后的两组数据，两条生产条件基本相同的生产线的质量数据，两个供应同一种产品的供应商的质量业绩分析等等。

都存在两组数据是否有明显的差异的问题，这些问题往往可以使用两独立样本的T检验来完成。

两独立样本的T检验的原假设H0为两总体均值之间不存在显著差异。

在具体的计算中需要通过两步来完成：

第一，利用F检验判断两总体的方差是否相同；第二，根据第一步的结果，决定T统计量和自由度计算公式，进而对T检验的结论作出判断。

1、判断两个总体的方差是否相同

SPSS采用LeveneF方法检验两总体方差是否相同，首先计算两个样本的均值，计算每个样本和本组样本均值的差，并对差取绝对值，得到两组绝对值差值序列。

然后利用单因素方差分析方法，判断这两组绝对差值序列之间是否存在显著差异，即判断平均离差是否存在显著差异，从而间接判断两组方差是否存在显著差异。

在统计过程中，SPSS将自动计算F统计量，并根据F分布表给出统计量对应的相伴概率和显著性水平α进行比较，从而判断方差是否相同。

2、根据第一步的结果，决定T统计量和自由度计算公式

⑴两总体方差未知且相同的情况下，T统计量计算公式为：

其中：

这里T统计量服从n1+n2-1个自由度的T分布。

⑵两总体方差未知且不相同的情况下，T统计量计算公式为：

T统计仍然服从T分布，但自由度采用修正的自由度：

从两种情况下的T统计量计算公式可以看出，如果待检验的两样本均值差异较小，t值较小，则说明两个样本的均值不存在显著差异；相反，t值越大，说明两样本的均值存在显著差异。

在SPSS中，将会根据计算的t值和T分布表给出相应的相伴概率值。

如果相伴概率值小于或等于显著性水平α，则拒绝H0，认为两总体均值之间存在显著差异。

反之，相伴概率大于显著性水平α，则不拒绝H0，可以认为两总体均值之间不存在显著差异。

㈡在SPSS中的实现过程

研究问题，为提高产品的质量水平，某化工厂对某化工产品进行技术改进（化学处理），处理前后，其含脂率变化情况见表4-3。

[例14.4.2]某物质在化学处理前后的含脂率如下：

表4-3某物质在化学处理前后的含脂率统计表

处理前

0.19

0.18

0.21

0.30

0.56

0.42

0.08

0.12

0.30

0.27

处理后

0.15

0.13

0.00

0.07

0.24

0.19

0.04

0.08

0.24

0.20

0.12

考察处理前后的平均含脂率是否降低？

（显著性水平取0.05）

[步骤1]选择变量，录入数据，第一个变量为试验数据，第二个变量为处理前后的状态，设为处理前为0，处理后为1。

详见图4-11。

图4-11选择变量，录入数据

[步骤2]在“Analyze”菜单“CompareMeans”中选择“Independent-SamplesTTest”命令，如图4-12所示。

图4-12选择菜单

[步骤3]在弹出的如图4-13所示的Independent-SamplesTTest对话框中，从对话框左侧的变量中选择“实验数据”变量，并添加到TestVariable（s）中；选择“处理前后”变量，添加到GroupingVariable框中。

图4-13Independent-SamplesTTest对话框

[步骤4]单击DefineGroups按钮，弹出DefineGroups对话框，如图4-14所示。

在该对话框中指定标识变量的区别方法，选择Usespecifiedvalues选项，表示根据标识变量的取值进行区分。

在Group1中输入0，在Group2中输入1。

图4-14DefineGroups对话框

如果选择Cutpoint选项，则表示要选择一个分割点，高于该值的个案组成一个样本，低于该值的个案组成另一个样本，这适合于标识变量为连续变量的情况。

[步骤5]单击Continue按钮，返回Independent-SamplesTTest对话框，单击OK按钮，即完成分析。

[步骤6]结果分析

从图4-15可以看出：

两组试验结果的均值、标准差、均值误差。

由输出结果可以看出，处理前后两组数据的平均值分别为0.2630和0.1340，标准差分别为0.14322和0.08435，均值误差（标准误）分别为0.04529和0.02667。

GroupStatistics

处理前后

Mean

Std.Deviation

Std.ErrorMean

实验数据

.2630

.14322

.04529

.1340

.08435

.02667

图4-15两组试验结果的均值、标准差、均值误差

从图4-16可以看出：

①从“Levene'sTestforEqualityofVariances”可以看出F的相伴概率是0.245，大于显著性水平0.05，根据判断准则，不能拒绝方差相等的假设，可以认为试验的含脂量数据方差无显著变异。

②然后看方差相等时T检验的结果，也就是第一行“Equalvariancesassumed”的T检验结果，T统计量的相伴概率为0.025，小于显著性水平0.05，因此拒绝T检验的原假设，也就是说试验前后的数据是存在显著差异的，说明处理以后平均含脂率明显降低。

③在计算中SPSS自动给出样本方差相同和样本方差不同两种情况下的T检验值，使用时需要根据F值来判断属于哪一类情况，然后选择相应的t值。

IndependentSamplesTest

Levene'sTestforEqualityofVariances

t-testforEqualityofMeans

Sig.

Sig.（2-tailed）

MeanDifference

Std.ErrorDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

实验数据

Equalvariancesassumed

1.447

.245

2.454

.025

.1290

.05256

.01857

.23943

Equalvariancesnotassumed

2.454

14.573

.027

.1290

.05256

.01668

.24132

图4-16两组独立样本的t检验结果

另外，从两个样本的均值差的95%置信区间看，区间不跨0，这也说明两组数据平均值有显著差异。

再者，在分析结果中，SPSS还自动给出了两样本均值差值的估计标准差（Std.ErrorDifference）。

在方差相同的情况下，估计标准误差计算方法是：

在方差不相同的情况下，估计标准误差的计算方法是：

需要注意的是：

在计算中SPSS自动给出样本方差相同和样本方差不同两种情况下的T检验值。

用户需要根据F值来判断属于哪一类情况，然后选择相应的t值。

三、两配对样本的T检验

㈠统计学上的定义和计算公式

定义：

两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。

一般用于同一研究对象（或两配对对象）分别给予两种不同处理的效果比较，以及同一研究对象（或两配对对象）处理前后的效果比较。

前者推断两种效果有无差异，后者推断某种处理是否有效。

两配对样本T检验的前提要求如下：

●两样本应是配对的。

在应用领域中，主要的配对资料包括：

同一生产线、同一供应商、同种工艺、同种改进方法等。

首先两个样本的观察数目相同，其次两样本的观察值顺序不能随意改变。

●样本来自的两个总体应服从正态分布。

例如：

在进行质量改进时，针对一批产品改进前后各取得了配对的数据，检验改进前后是否发生了显著变化，如果改进效果发生了显著变化（向好的方向发展），则说明改进是有成效的，否则就没有成效。

两配对样本T检验的原假设H0为两总体均值之间不存在显著差异。

首先求出每对观察值的差值，得到差值序列；然后对差值求均值；最后检验差值序列的均值，即平均差是否与零有显著差异。

如果平均差和零有显著差异，则认为两总体均值间存在显著差异；否则，认为两总体均值间不存在显著差异。

在这里计算的公式和单样本T检验中的公式完全相同，公式如下：

式中，

为配对样本差值序列的平均差。

SPSS将自动计算t值，由于该统计量服从n-1个自由度的T分布，SPSS将根据T分布表给出t值对应的相伴概率值。

如果相伴概率值小于或等于用户设定的显著性水平α，则拒绝H0，认为两总体均值之间存在显著差异。

反之，相伴概率大于显著性水平α，则不拒绝H0，可以认为两总体均值之间不存在显著差异。

㈡在SPSS中的实现过程

研究问题：

两个实验室的配对数据。

[例14.5.1]某工厂的两个实验室每天同时从工厂的冷却水中取样，分别测量水中的含氯量各一次，下面是11天的记录。

表4-4两个实验室的配对数据

序号

实验室A

实验室B

1.15

1.00

1.86

1.90

1.76

0.90

1.82

1.80

1.14

1.20

1.65

1.70

1.92

1.95

1.01

1.02

1.12

1.23

0.90

0.97

1.40

1.52

展开阅读全文