第9章t检验.docx

上传人:b****6 文档编号:3481044 上传时间:2022-11-23 格式:DOCX 页数:25 大小:1.23MB
下载 相关 举报
第9章t检验.docx_第1页
第1页 / 共25页
第9章t检验.docx_第2页
第2页 / 共25页
第9章t检验.docx_第3页
第3页 / 共25页
第9章t检验.docx_第4页
第4页 / 共25页
第9章t检验.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

第9章t检验.docx

《第9章t检验.docx》由会员分享,可在线阅读,更多相关《第9章t检验.docx(25页珍藏版)》请在冰豆网上搜索。

第9章t检验.docx

第9章t检验

第9章t检验

t检验(t—tests)又称Studentt检验(学生氏t检验),它用以检验单样本均数与总体均数间

的差异性,两独立样本均数的差异性(独立样本t检验,又称成组t检验,团体t检验)和两样

本配对样本t检验(自身对照)。

它以t分布为其理论基础,具体假设依各种问题的不同而异。

9.1单样本均数t检验

单样本均数t检验(one—Samplet-testforaMean)可以对单样本均数与已知总体均数(一

般为理论值、标准值或经过大量观察所得的稳定值等)进行比较,目的是推断样本所代表的未知总体均数与已知的总体均数有无差别(即样本均数与总体均数的比较)。

[例9—1]已知某水样中含CaC03的真值(均数)为20.7mg/L,现用某方法重复测定该水样11次,CaC03的含量(mg/L)如下:

20.99,20.41,20.10,20.00,20.91,22.60,20q99,20.41,20,00,23.00,22.00

问该方法测得的均数是否偏高?

(杨树勤。

中国医学百科全书/医学统计学。

上海:

上海科学

技术出版社,1985.10.3)

(1)进入SAS/Win(v8)系统,单击Solutions-Analysis-Analyst,显示分析家窗口。

建立

如图9—1所示的SAS数据集文件Sasuser.CaCO3。

A为变量CaCO3;,并保存为Sasuser.CaCO3。

(2)单击Statistics-Hypothesis(假设检验)-one—Samplet-testforaMean(单样本均数t检验),得到图9.2所示对话框。

图9.1数据文件(部分)图9—2one—Samplet-testforaMean:

Cac03(单样本均数t检验)对话框

在图9—2所示对话框中可进行如下设置。

Variable,待选变量为A(CaCO3)(单击A—Variable)。

Hypotheses,假设检验。

Null(零假设):

Mean(均数)=20.7,本例的真值。

A1ternate(备择假设):

Mean“=0(非零),本例选择此项;Mean>0(大

‘o(小于零)。

Tests,检验。

Plots,作图。

Titles,标题。

Variables,变量。

(3)单击Tests按钮,得到图9—3所示对话框的ConfidenceIntervals(可信区间)

)单击Tests按钮,得到图9—3所示对话框的ConfidenceIntervals(可信区间)

图9—3ConfidenceIntervals(可信区间)选项卡

在ConfidenceIntervals选项卡可进行如下设置。

None,不选择可信区间。

Interval,选择可信区间(本例选择此项)。

Lowerbound,选择可信区间的下限。

Upperbound,选择可信区间的上限。

ConfidenceLevel(可信水平)95.0%,用户可根据需要选择不同的可信水平。

(4)在图9.3中,单击PowerAnalysis(功效分析)标签,得到图9—4所示对话框

Analysis选项卡。

在此选项卡选择Performpoweranalysis(执行功效分析)复选框

图9—4Poweranalysis(功效分析)选项卡

(5)单击0K按钮,返回图9.2所示对话框,单击Plots按钮,得到图9—5所示对话框,在此对话框中可进行如下设置。

Typeofplots,图形的类型(本例全选)。

Box—&—whiskerplot,箱形与触须线图。

Barchart,条形图。

tdistributionplot,t分布图。

图9—5one—Samplet-testforaMean:

Plots(图形)对话框

(6)单击0K按钮,返回图9—2所示对话框。

单击Titles按钮,得到图9—6所示对话框。

在此对话框中可进行如下设置。

Global,全局标题。

one—Samplet-testforaMean,单样本均数t检验,本例选择此项。

Settings,设置标题。

Overrideglobaltitles,优先于全局标题。

图9—6Titles(标题)对话框

(7)单击OK按钮,返回图9—2所示对话框。

单击0K按钮,得到如下结果。

主要结果分析

P=0.3125,按α=0.05水准,不拒绝H0,因此,尚不认为该方法测得的均数偏高。

9.2两样本配对均数t检验

两样本配对均数t检验(Two-samplePairedt-testforMeans),即配对设计两样本均数比较,或称自身对照,或称相关样本t检验,它用于检验两相关样本或成对样本所得均数间是否有显著性差异,输出结果有均数(Mean),标准差(Std.Dev.),标准误差(Std.Error.),假如检验(HypothesisTests,无效假设,备择假设),t统计量与P值及箱形—触须线图(Box-&-whisker:

plot),条形图(Barchart),均数图(Meansplot),t分布图(tdistributionplot)等。

[例9-2]为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女年龄面成10对。

每对中随机抽取一人服新药,另一人服用安慰剂。

经过一定时间后,测得总胆固醇含量(mmol/L),结果示于表9-1药是否影响女性血清总胆固醇含量(倪宗瓒,卫生统计学。

第4版,北京:

人民卫生出版社,2001.35~37)(本例为配对设计的定量资料,可用配对t检验)

表9-1新药组与安慰剂组血清总胆固醇含量[mmol/L]

A

4.4

5.0

5.8

4.6

4.9

4.8

6.0

5.9

4.3

5.1

B

6.2

5.2

5.5

5.0

4.4

5.4

5.0

6.4

5.8

6.2

(1)进入SAS/Win(8)Solutions->Analysis->Analyst,进入分析家窗口。

将表9-1的数据依次键入图9-7所示数据表中,单击File->Save->Sasuser,在MemberName中设置文件名Paired1,在MemberTypeData中选择Tables(DATA),单击Save,将数据保存为Paired1文件。

(2)单击Statistics->Hypothesis->Tests->Two->SamplePairedt-testforMeans,得到图9-8所示对话框。

本例待检验分析的变量为A(新药组),B(安慰剂组)。

假设检验(Hypothesis)的无效假设(Null,或称零假设)为Mean(Groupl-Group2)=0。

在A1ternative(备择假设)选项区域可进行如下设置。

Mean(Group1-GrouP2)=0(非零,默认格式,本例选择此项)。

Mean(Groupl-Group2)>0(大于零)。

Mean(Groupl-Group2)<0(小于零)。

图9-7数据表

图9-8Two-SamplePairedt-testforMeans:

Pairedl(均数t检验)对话框

本例检验的第1组(Groupl)变量为A(单击A->Groupl),第2组(Group2)检验的变量

为B(单击B->Group2)。

设置后的效果如图9-9所示。

图9-9Two-SamplePairedt-testforMeans:

Pairedl(已选均数t检验)对话框

(3)单击Tests按钮,得到图9-10所示对话框的ConfidenceIntervals选项卡。

在ConfidenceIntervals(可信区间)选项卡中可进行如下设置。

None,不选可信区间(默认格式)。

Interval,可信区间(本例选择此项)。

Lowerbound,可信区间的下限。

Upperbound,可信区间的上限。

Confidencelevel,可信区间的水平。

可选择90%,95%,97.5%,99%。

默认本例选择此项。

(4)在图9-10所示对话框中,单击PowerAnalysis标签,得到图9-11所示对话框的PowerAnalysis(功效分析)选项卡。

图9-10ConfidenceIntervals(可信区间)选项卡

图9-11PowerAnalysis(功效分析)选项卡

在PowerAnalysis选项卡中可进行如下设置。

Performpoweranalysis,执行功效分析。

A1phas,

值(Values)。

用户可任意选择,例如0.001。

默认为0.05,本例选择此项。

Samplesizes,样本大小可选择Values(值),并可指明从(From)多少到(To)多少,步长(By)多少。

(5)单击OK按钮,返回图9-9所示对话框,单击Plots按钮,得到图9-12所示的对话框。

在图9-12所示对话框中可进行如下设置。

Typesofplots,作图的类型(本例全选)。

Box-&-whiskerplot,箱形与触须线图。

Barchart,条形图。

Meansp1ot,均数图。

tdistributionplot,t分布图。

Meansp1otoptions,均数图的选择项。

BarType,条形图类型。

Standarderrorofmean,均数的标准误差。

Standarddeviation,标准差。

Heightofbarsinstd.units,条形图标准单位的高度,可选1,2,3(倍),本例选择l。

Usepooledvariance,选用合并方差,本例选择。

Startverticalaxisat0,从零位置开始的起始垂直坐标轴,本例选择。

图9-12Two-SamplePairedt-testforMeans:

P1ots(作图)对话框

(6)单击OK按钮,返回图9-9所示对话框。

单击Titles按钮,得到图9-13所示对话框。

全局标题(G1obal)与设置标题(Settings)是隐含的。

图9-13Titles(标题)对话框

(7)分别单击Global,Settings标签,得到图9-14和图9-15所示选项卡。

图9-14G1oba;(全局性标题)选项卡

图9-15Settings(设置标题)选项卡

本例G1obal(全局性标题)(见图9-14)未选择,而Setting(设置标题)(见图9-15)只选择Includefilterdescription(包含过滤描述),其余不选择。

(8)单击OK按钮,返回图9-13所示对话框。

单击OK按钮,返回图9-9所示对话框。

单击OK按钮,完成计算与作图,得到经中文编辑整理后的结果。

结果分析‘

=0.05水准,由于P>0.15,新药组(A)与安慰剂组(B)的均数间没有显著性差异,尚不能认为该新药对女性血清总胆固醇含量有影响。

图形结果

本例操作在完成第(8)步以后,不仅完成了选择的统计检验计算,而且也完成了选择全部作图工作,但其结果隐藏于图9-16中,为了获得图形的真貌,还必须选择其中的相应指令。

在图9-16中,分别单击Boxplot,Barchart,Meansplot与tdistributionplot,得到相应图9-17、图9-18、图9-19和9-20所示图形结果。

还可以对这些图形作进一步的编辑。

图9-16配对分析

图9-17Box-&-whiskerplot(箱形与触须线图)

图9-18Barchart(条形图)

图9-19Meansplot(均数图)

图9-20tdistributionplot(t分布图)

[例9-3]将20名某病患者随机分为2组,分别将甲、乙两药治疗前和治疗1个月后的血沉(mm/h)列于表9-2。

问甲、乙两药治疗前后是否有疗效?

(倪宗瓒.卫生统计学.第4版,北京:

人民卫生出版社.2001.271)

表9-2甲、乙两药治疗前后的血沉[单位:

mml/h]

甲药

病人号

1

2

3

4

5

6

7

8

9

10

治疗前

治疗后

20

16

23

19

16

13

21

20

20

20

17

14

18

12

18

15

15

13

19

13

乙药

病人号

1

2

3

4

5

6

7

8

9

10

治疗前

治疗后

19

16

20

13

19

15

23

13

18

13

16

15

20

18

21

12

20

17

20

14

本例可用配对t检验,首先对甲药治疗前后的疗效进行推断。

(1)进人SAS/Win(v8)系统,单击So1utions->Analysis->Analyst,进入分析家窗口。

建立并保存如图9-21所示的SAS数据集文件Sasuser.treat,在SAS数据集文件Sasuser.treat个A为甲药治疗前的血沉(单位mm/h),B为甲药治疗后的血沉(单位mm/h);C为乙药治疗前的血沉(单位mm/L),D为乙药治疗后的血沉(单位mm/h)。

(2)单击So1utions->ASSIST->WorkPlace->Continue->DataAnalysis->Anova->T-tests->

PairedComparison,得到图9-22所示界面。

图9-21数据集文件treat

图9-22SAS/ASSIST:

PairedComparisonsT-test

(配对比较t检验)界面

(3)单击Table按钮,得到图9-23所示对话框。

本例SAS数据库(Libraries)选择SASUSER,数据表(Table)选择TREAT。

图9-23SAS/ASSIST:

Selecttable(选用数据表)对话框

(4)单击OK按钮,返回图9-22所示对话框。

单击Pairedcolumns按钮,得到图9-24所示对话框。

本例选择(Selected)的甲药治疗前的变量为A,甲药治疗后的变量为B。

图9-24Selectedtwocolumns(选用两个列变量)对话框

(5)单击OK按钮,得到图9-25所示界面。

本例选择的数据表(Table)为SASUSER.TREAT,配对列变量(Pairedcolumns)为AB。

图9-25SAS/ASSTST:

PairedComparisonsT-test(配对比较t检验)界面

(6)单击Run->Submit,得到如下结果。

结果分析

本例t=5.24,P<0.001,按

=0.05水准,拒绝

,接受

,可认为甲药也有疗效。

可以再用配对t检验,对乙药治疗前的疗效进行推断。

类似于以上操作,只需在图所示对话框中,选择列变量(乙药治疗前),(乙药治疗后),其他不变,即可得到以下结果。

本例t=5.30,P<0.001,按

=0.05水准,拒绝

,接受

,可认为乙药也有疗效。

换句话说,甲、乙两药都有疗效。

小结

SAS/Win(v8)中的配对t检验有SAS/Analyst(分析家)和SAS/ASSIST两个模块可以调用,例9-2是调用SA5/Analyst(分析家)模块,而例9-3是调用SAS/ASSIST模块,可见SAS/Analyst(分析家)模块有较详细的输出结果,并有图形,而SAS/ASSIST模块的输出结果较简捷。

值得一提的是,SAS/Win(v8)系统还可以用编程的方法获得配对t检验结果。

9.3两独立样本均数t检验

两独立样本均数t检验(Two-Samplet-testforMeans)用于比较两组样本均数(CompareTwoGroupMeans)差异显著性所需的Studentt统计量。

[例9-4]分别将测得的14例老年慢性支气管炎病人和11例健康人的尿中17酮类固醇排出量(mg/d1)示于表9-3。

试比较两组的均数有无差别?

(杨树勤.中国医学百科全医学统计学.上海:

上海科学技术出版社,1985.104)。

表9-3老年慢性支气管炎病人及健康人的尿中17酮类固醇排出量

病人

2.905.415.484.604.035.104.974.244.362.722.372.097.105.92

健康人

5.188.793.146.463.726.645.604.577.714.994.01

(1)进入SAS/Win(v8)系统,单击So1utions->Analysis->Analyst,进入分析家窗口。

建立SAS数据文件Sasuser.oldage(见图9-26),并保存。

其中,变量A为老年慢性支气管炎病人尿中17酮类固醇排出量,变量B为健康人的尿中17酮类固醇排出量。

(2)单击File->OpenBySASName->Sasuser->Oldage->0K,调人数据文件。

单击Statistics->HypothesisTests->Two-Samplest-testforMeans,得到图9-27所示对话框。

第一组变量(Groupl)选择A,第二组变量(Group2)选择B。

图9-26数据表文件

图9-27Two-Samplest-testforMeans:

Oldage(均数比较)对话框

(3)单击Tests按钮,得到图9-28所示对话框。

在ConfidenceIntervals(可信区间)选项卡中选择Interval选项。

图9-28ConfidenceIntervals(可信区间)选项卡

(4)单击PowerAnalysis标签,得到图9-29所示对话框的PowerAnalysis选项卡,具体设置见图9-29。

图9-29PowerAnalysis(功效分析)选项卡

(5)单击OK按钮,返回图9-27所示对话框,单击P1ots按钮,得到图9-30所示对话框。

图9-30Two-Samplest-testforMeans:

Plots(图形)对话框

(6)单击OK按钮,返回图9-27所示对话框。

单击OK按钮,得到如下结果。

图形结果如图9-31所示

主要结果分析

不论方差相等与否,P>0.05,按

=0.05水准,不拒绝

,尚不能认为老年慢性支气管炎病人与健康人的尿中17酮类固醇排出量不同。

其他分析方法

(1)如果表9-3的数据按图9-32所示格式建立,SAS数据文件为Oldagel。

其中,A为病人与健康人的尿中17酮类因醇排出量(mg/dl)。

B为分组变量:

1为病人组,2为健康人组。

也可以用此模块进行分析,这时,两样本均数比较(Two-Samplet-testforMeans)的假设如图9-33所示。

其他不变,也可以得到上述结果。

图9-31MeansPlot(均数图)

图9-32SAS数据文件Oldage1

图9-32Two-Samplet-testforMeansOldage1(均数比较)对话框。

(2)本例也可在程序编辑器(ProgramEditor)中编写如下程序:

optionsnodatenonumber;

datagtest;

inputgn@@;

doi=1ton;

inputx@@;

output;

end:

Cards;

114

2.905.415.484.604.035.104.974.244.362.722.372.097.105.92

211

5.188.793.146.463.726.645.604.577.714.994.01

;

procttestcochran;

c1assg;

varx;

run;

然后,单击Run->Submit,可以得到如下结果。

可见,这些输出结果与上述结果基本相同。

9.4u检验

当两样本含量较大时(即所谓大样本资料),除仍可用t检验(t--tests)外,还可以根据正近似原理,用u检验。

下面用一个程序对例9-5和例9-6进行分析。

[例9-5]测得30岁以上的冠心病患者142人的血清胆固醇,另以506名年龄相仿的

患者作对比(见表9-4)。

试分析冠心病患者的血清胆固醇是否较高?

(郭祖超.医用数理统

计方法.第3版,北京:

人民卫生出版社,1998.107)

表9-4冠心病患者的血清胆固醇(mg%)与非患者比较

例数(n)

均数(x)

标准差(s)

冠心病患者

非患者

142

506

223.6

180.6

45.8

34.2

[例9-6]某市于1957年和1973年抽查部分12岁男童的身高,初步计算结果如下:

1957年:

=120,

=139.9cm,

=7.5cm

1973年:

=153,

=143.7cm,

=6.3cm

试比较这两个年度12岁男童的身高均数有无差别?

(杨树勤.中国医学百科全书/医学统计

学.上海:

上海科学技术出版社,1985.105)

(1)进入SAS/Win(v8)系统,在主窗口的程序编辑器(ProgramEditor)中,将例9-5与例9-6的数据编写程序(见图9-34),或将已编辑好的并保存在d:

\sasdata中的源程序(含数据)utest1.sas调入程序编辑器,单击File->Open->d:

\sasdata\utest1.sas即可打开源程序。

图9-34源程序(含数据)utest1.sas

(2)单击Run->Submit,得到如下结果。

结果分析

(1)例9-5由于

=10.4035,P<0.01,在

=0.05水准上拒绝

,接受

l,故可认

为冠心病患者的平均胆固醇含量比非患者高。

(2)例9-6由于

=4.4532,P<0.0l,按

=0.05水准,拒绝

,接受

,故可认为该市两年度12岁男童身高均数不等,1973年男童的平均身高比1957年高。

9.5两独立样本(几何)均数t检验

本节将讨论比较两独立样本几何均数的方法,计算几何均数的变量多数是等比级数,而且不服从正态分布,因而不能直接对两个几何均数进行比较,一般取其对数(自然对数或常用对数)的变换值计算均数,当对数变换值服从正态分布或服从近似正态分布时,适于用t检验或u检验。

[例9-7]将钩端螺旋体病人的血清分别用标准株和水生株进行试验,结果示于表9-50试比较两组的平均效价。

(郭祖超.医用数理统计方法.第3版,北京:

人民卫生出版社。

1998.1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1