Mean过程和T检验过程教程文件.docx

上传人:b****8 文档编号:9012581 上传时间:2023-02-02 格式:DOCX 页数:17 大小:130.34KB
下载 相关 举报
Mean过程和T检验过程教程文件.docx_第1页
第1页 / 共17页
Mean过程和T检验过程教程文件.docx_第2页
第2页 / 共17页
Mean过程和T检验过程教程文件.docx_第3页
第3页 / 共17页
Mean过程和T检验过程教程文件.docx_第4页
第4页 / 共17页
Mean过程和T检验过程教程文件.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

Mean过程和T检验过程教程文件.docx

《Mean过程和T检验过程教程文件.docx》由会员分享,可在线阅读,更多相关《Mean过程和T检验过程教程文件.docx(17页珍藏版)》请在冰豆网上搜索。

Mean过程和T检验过程教程文件.docx

Mean过程和T检验过程教程文件

 

Mean过程和T检验过程

一、Means过程

1.简单介绍

Means过程计算指定变量的综合描述计量,包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计。

当观测量按一个分类变量分组时,Means过程可以进行分组计算。

例如,要计算某地区高考的数学成绩,Sex变量把考生分为男生和女生两组,Means过程可以分别计算男女生的数学成绩。

Means过程还可以给出方差分析表和线性检验结果。

使用Means过程求若干组的描述统计量的目的在于比较,因此必须求均值。

这是与Descriptive过程不同之处。

2.完全窗口分析

Means过程的大部分功能可以完全由窗口实现,这给用户带来了很大的方便。

(1)Means主对话框

按Analyze→CompareMeans→Means的顺序单击,即可打开“Means”主对话框,如图1所示。

图1Means主对话框

(2)Dependent框

该框中的变量作为因变量,通常认为受自变量影响或决定,因此被用来预测或建模。

要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。

(3)Independent框

该框中的变量是自变量,又被称为预测变量或解释变量。

要运行Means过程,该框中必须至少有一个变量。

要从源变量框中选取变量进入该框,同样只需激活所要选取的变量,然后按向右的箭头即可。

选中变量进入该框后,可以看到上方的【Next】按钮有效,单击该按钮进入下一层,在下一层的自变量将再细分样本。

要回到上一层,单击【Previous】按钮即可。

(4)Options对话框

单击Options按钮,即可打开“Options”对话框,如图2所示。

图2Options对话框

①CellStatistics框

从左边框中选择要输出的统计量进入该框,该框中的统计量是输出时显示的统计量,其排列顺序即是输出时显示的顺序。

可供选择的统计量的意义如下:

Sum(总和)、Numberofcases(观测量数目)、Mean(均值)、Median(中位数)、Groupedmedian(分组中位数)、Standarderrorofthemean(均值标准误差)、Minimum(最小值)、Maximum(最大值)、Range(范围)、Standarddeviation(标准差)、Variance(方差)、Kurtosis(峰度)、Standarderrorofkurtosis(峰度的标准差)、Skewness(偏度)、StandarderrorofSkewness(偏度的标准差)、First(首值)、Last(尾值)、Percentageoftotalsum(占总和的百分比)、PercentageoftotalN(占观测量总数的百分比)、Geometricmean(几何均数)、Harmonicmean(调和均数)。

②StatisticsforFirstLayer

该栏中有两个复选框,决定对第一层自变量的有关分析。

●ANOVAtableandeta复选框

选中该复选项对第一层自变量给出方差分析表和eta统计量η和η2。

方差分析的零假设是,第一层自变量各水平上的因素量均值都相等。

η统计量表明因变量和自变量之间联系的强度。

η2是因变量中不同组中差异所解释的方差比,是组间平方和与总平方和之比。

●Testsforlinearity复选框

选中该复选框产生R和R2。

只有早控制变量有基本的数量级(例如自变量表示年龄或人种,不能是房子颜色或居住城市等),且自变量有三个水平以上。

其检验的假设是因变量均值是第一层自变量值的线性函数。

R和R2测度线性拟合的良好度。

R是观测值与预测值之间的相关系数。

 

3.例题分析

某医师测得如下血红蛋白值(g%),用Means过程对其做基本的描述性统计分析。

表1血红蛋白值

编号

性别

年龄

血红蛋白

编号

性别

年龄

血红蛋白

1

1

18

13.66

21

2

16

11.36

2

1

18

10.57

22

1

16

12.78

3

1

16

12.56

23

1

18

15.09

4

2

17

9.87

24

2

18

8.67

5

2

17

8.99

25

2

17

8.56

6

2

17

11.35

26

2

18

12.56

7

1

17

14.56

27

2

17

11.56

8

1

16

12.40

28

1

16

14.67

9

2

16

8.05

29

1

16

7.88

10

1

18

14.03

30

1

18

12.35

11

2

18

12.83

31

1

16

13.65

12

1

16

15.50

32

2

16

9.87

13

2

18

12.25

33

2

18

10.09

14

2

17

10.06

34

2

18

12.55

15

1

16

10.88

35

1

18

16.04

16

1

18

9.65

36

1

18

13.78

17

2

16

8.36

37

1

17

11.67

18

1

18

11.66

38

1

17

10.98

19

2

18

8.54

39

2

16

8.78

20

2

17

7.78

40

1

16

11.35

(1)操作步骤

①激活数据管理窗口,输入数据文件,定义变量名:

性别为sex,年龄为age,血红蛋白值hb。

按顺序输入数据(sex变量中,男为1,女为2)。

②按Analyze→CompareMeans→Means的顺序单击,即可打开“means”主对话框。

③在对话框左侧的变量中选hb,单击向右按钮使之进入DependentList框,选sex单击向右按钮使之进入IndependentList框。

④单击败【Options】按钮打开“Options”对话框,从中选择统计项目:

在CellDisplays项中,选中Mean、Standarddeviation、Variance、NumberofCases和Sum五个复选框。

⑤在StatisticsforFirstLayer项中,将为第一层的分组选择计算方差分析(ANOVAtableandeta)和线性检验(Testoflinearity)。

单击【Continue】按钮返回“Means”主对话框。

⑥选age单击向右按钮使之进入IndependentList框。

重复④和⑤步骤,返回“Means”主对话框。

⑦在主对话框中单击【OK】钮完成。

(2)输出结果及分析

表2是我们造已熟悉的观测量摘要表,说明了观测量总个数为40,其中有效值为40个,无效值有0。

表2观测量摘要表

CaseProcessingSummary

Cases

Included

Excluded

Total

N

Percent

N

Percent

N

Percent

血红蛋白值*性别*年龄

40

100.0%

0

.0%

40

100.0%

表3分为三部分,第一、第二部分先按性别分组(分男性和女性),再按年龄分组(16,17,18岁三组)计算观测值合计、均值、标准差、方差和个数;第三部分是之按年龄分组,最后一行表示40个观测值合计为457.79,均数为11.4448,标准差为2.2690,方差为5.1484,个数为40。

若在IndependentList中未分层次,即sex和age一起在Layer1of1中,则结果是分别计算男性与女性(不作年龄分组)。

16、17、18岁三组(不作性别分组)的观测值合计、均值、标准差、方差和个数,如表4、5所示。

表3分组描述统计量

Report

血红蛋白值

性别

年龄

Mean

N

Std.Deviation

Variance

Sum

16

12.4078

9

2.2455

5.042

111.67

17

12.4033

3

1.8993

3.607

37.21

18

12.9811

9

2.0933

4.382

116.83

Total

12.6529

21

2.0531

4.215

265.71

16

9.2840

5

1.3494

1.821

46.42

17

9.7386

7

1.4036

1.970

68.17

18

11.0700

7

1.9158

3.670

77.49

Total

10.1095

19

1.6989

2.886

192.08

Total

16

11.2921

14

2.4649

6.076

158.09

17

10.5380

10

1.9421

3.772

105.38

18

12.1450

16

2.1827

4.764

194.32

Total

11.4448

40

2.2690

5.148

457.79

表4按性别分组的描述统计量

Report

血红蛋白值

性别

Mean

N

Std.Deviation

Variance

Sum

12.6529

21

2.0531

4.215

265.71

10.1095

19

1.6989

2.886

192.08

Total

11.4448

40

2.2690

5.148

457.79

表5按年龄分组的描述统计量

Report

血红蛋白值

年龄

Mean

N

Std.Deviation

Variance

Sum

16

11.2921

14

2.4649

6.076

158.09

17

10.5380

10

1.9421

3.772

105.38

18

12.1450

16

2.1827

4.764

194.32

Total

11.4448

40

2.2690

5.148

457.79

表6是方差分析表,共有六列,第一列说明方差的来源,BetweenGroups是组间的,WithinGroups是组内的,Total是总的。

第二列为平方和,其大小说明了各方差来源作用的大小。

第三列为自由度。

第四列为均方,即平方除以自由度。

第五列F值只F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力。

第六列是F值统计量的显著值,由于这里显著性小于0.05(我们的检验水平),所以模型是显著的,性别对血红蛋白有显著影响。

由于性别分组只有两个水平,所以没有设计计算线性检验。

表6方差分析表

ANOVATable

SumofSquares

df

MeanSquare

F

Sig.

血红蛋白值*性别

BetweenGroups

(Combined)

64.526

1

64.526

17.995

.000

WithinGroups

136.261

38

3.586

Total

200.787

39

aWithfewerthanthreegroups,linearitymeasuresfor血红蛋白值*性别cannotbecomputed.

表7是eta统计量表,η统计量表明因变量和自变量之间联系的强度,0.567的值处于中等水平,η2是因变量中不同组间差异所解释的方差比,是组内平方和与总平方和之比,即由64.5256除以200.787得到。

表7eta统计量

MeasuresofAssociation

Eta

EtaSquared

血红蛋白值*性别

.567

.321

表8、表9是将年龄作为第一层自变量得到的方差分析表和eta统计量表。

表8中多了两行,Linearity是假设因变量均值是第一层自变量值的线性函数,DeviationfromLinearity是不能由线性模型解释的部分。

表9中是R和R2测度线性拟合的良好度,R是观测值与预测值之间的相关系数。

 

表8按年龄分组的方差分析表

ANOVATable

SumofSquares

df

MeanSquare

F

Sig.

血红蛋白值*年龄

Between

(Combined)

16.394

2

8.197

1.645

.207

Groups

Linearity

5.952

1

5.952

1.194

.282

DeviationfromLinearity

10.441

1

10.441

2.095

.156

WithinGroups

184.394

37

4.984

Total

200.787

39

表9按年龄分组的eta统计量表

MeasuresofAssociation

R

RSquared

Eta

EtaSquared

血红蛋白值*年龄

.172

.030

.286

.082

二、单一样本T检验

1.简单介绍

单一样本T检验(One-SampleTTest)是检验单个变量的均值是否与假设检验值(给定的常数)之间存在差异。

例如,研究某地区高考数学平均分数与去年分组(定值)的差异。

如果已知总体均数,进行样本均数与总体均数之间差异显著性检验也属于单一样本的T检验。

例如,研究某地区高考数学平均分数与全省高考数学平均分数的差异,这样的问题就是依靠进行样本均数与总体均数之间差异显著性检验,即进行单一样本的T检验来解决的问题。

单一样本T检验过程对每个检验变量给出的统计量包括观测量个数、均值、标准差和均值的标准差,它还给出了每个数据值与假设检验值之间的差的平均值以及进行该差值为0的T检验和该差值的置信区间,并且用户可以指定这个显著性水平。

2.完全窗口分析

(1)One-SampleTTest主对话框

按Analyze→CompareMeans→OneSampleTTest的顺序单击,就可以打开主对话框,如图3所示。

图3单一样本T检验主对话框

(2)TestVariable框

TestVariable框中的变量是要作检验的变量,要从源变量框中选取变量进入该框,只需选中所要选的变量,然后按向右的箭头即可。

(3)TestValeu参数框

在该框中输入一个定值作为假设检验值。

(4)Options对话框

在主对话框中单击【Options】键,即可打开“Options”对话框,如图4所示。

图4Options对话框

①ConfidenceInterval参数框

在该框中输入置信区间,必须在1~99之间,一般取为90、95、99等,过程将给出这个置信区间的上下限。

需要说明的是,计算置信区间的变量不是样本值,而是样本值和假设检验值(TestValue)的差。

②MissingValue框

在该框中选择缺失值的处置方式。

●Excludecasesanalysisbyanalysis选中该框,在检验变量中含有缺失值的观测将不被计算。

●Excludecaseslistwise选中该框,在任何一个变量中含有缺失值的观测都将不被计算。

3.例题分析

仍以上例来说明。

已知另一地区16~18岁少年血红蛋白平均值为11.657g%,检验这一地区16~18岁少年血红蛋白值是否与另一地区的平均值相等。

(1)操作步骤

①按Analyze→CompareMeans→OneSampleTTest的顺序单击,就可以打开主对话框。

②将变量hb选入TestVariable框。

③在TestValue框中输入11.657。

④单击【OK】完成。

(2)输出结果及分析

表10是血红蛋白值的一些统计量,包括观测量个数、均值、标准差和均值标准误差。

表10单个样本统计量

One-SampleStatistics

N

Mean

Std.Deviation

Std.ErrorMean

血红蛋白值

40

11.4448

2.2690

.3588

从表11中可以看出,t值为-0.592,自由度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是-0.9379~0.5134。

表11单个样本检验

One-SampleTest

TestValue=11.657

t

df

Sig.(2-tailed)

MeanDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

血红蛋白值

-.592

39

.558

-.2122

-.9379

.5134

三、独立样本T检验

1.简单介绍

独立样本T检验(IndependentSamplesTTest)用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。

如果两组样本彼此不独立,应该使用陪对T检验(PairedSamplesTTest)。

如果分组比止一个,应该使用One-WayANOVA过程进行单变量方差分析。

如果想比较的变量是分类变量,应该使用Crosstable功能。

独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应该使用一种非参数检验过程(Nonparametrictest)。

2.完全窗口分析

在完全窗口分析过程中将要遇到的各个对话框和选择项如下。

(1)主对话框

按Analyze→ComparedMeans→Independent-SamplesTTest的顺序单击,即可打开“Independent-SamplesTTest”主对话框,如图5所示。

图5独立样本T检验主对话框

(2)TestVariable框

TestVariable框中的变量是要作检验的变量,要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。

(3)GroupingVariable框

该框中的变量是分组变量,只能有一个,该变量将样本分为两组来检验。

分组变量必须是两值变量或具有某种分类特征的变量,前者如性别,后者如体重,例如以60kg为分界值分为两组。

(4)DefineGroups对话框

在主对话框中单击【DefineGroups】,打开DefineGroups对话框。

①UseSpecifiedValues

选中该栏,在Group1和Group2后的框中分别输入分组变量的取值调价,就把样本按该分组变量分成了两组。

例如,如果分组变量是性别,“1”代表“男”,“2”代表“女”,那么在Group1后的框中输入“1”,Group2后的框中输入“2”,就按性别把样本分成了两组。

②CutPoint

选中该框,并在参数框中输入分界点值,即把样本按该分界点分成了两组。

例如,如果分组变量是体重,选中该框并输入60kg,就把样本分成了两组。

(5)Options对话框

在主对话框中单击【Options】即可打开Options对话框。

该框中可以设置置信区间和对缺失值的处理方法(参见单一样本T检验中的Options对话框操作)。

3.例题分析

仍以上述为例来说明。

(1)操作步骤

①按Analyze→ComparedMeans→Independent-SamplesTTest的顺序单击,即可打开“Independent-SamplesTTest”主对话框。

②将变量hb选入TestVariable框中作为检验变量。

③将变量sex选入GroupingVariable框作为分组变量。

④单击【DefineGroups】,打开DefineGroups对话框。

在Group1后的框中输入“1”,Group2后的框中输入“2”,单击【Continue】返回。

⑤单击【OK】结束。

(2)结果输出及分析

输出结果见表12和表13。

表12是分组统计量表,列出的统计量包括观测量个数、均值、标准差和均值的标准误差。

表12分组统计量

GroupStatistics

性别

N

Mean

Std.Deviation

Std.ErrorMean

血红蛋白值

21

12.6529

2.0531

.4480

19

10.1095

1.6989

.3898

表13是独立样本T检验结果,Equalvariancesassumed行是假设方差相等进行的检验,当方差相等是非分明考察这一行的结果;Equalvariancesnotassumed行是假设方差不等进行的检验,当方差不等时考察这一行的结果。

在Livene’sTestforEqualityofVariance列中,显著值为0.544>0.15,可认为方差是相等的,所以应考察第一行的结果。

可以看到,显著值为0.000<0.05,所以认为均值是不等的。

表13独立样本T检验结果

IndependentSamplesTest

Levene'sTestforEqualityofVariances

t-testforEqualityofMeans

F

Sig.

t

df

Sig.(2-tailed)

MeanDifference

Std.ErrorDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

血红蛋白值

Equalvariancesassumed

.376

.544

4.242

38

.000

2.5434

.5996

1.3296

3.7571

Equalvariancesnotassumed

4.283

37.722

.000

2.5434

.5938

1.3409

3.7458

四、配对样本T检验

1.简单介绍

配对样本T检验(Paired-SampleTTest)用于检验两个相关的样本是否来自具有相同均值的总体。

比如考察同一组人在参加一年的长跑锻炼前后的心率是否有显著差异。

这里,每个人一年前的心率和一年后的心率是相关的,心率较快的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1