ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:27.04KB ,
资源ID:3151669      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3151669.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(学习系列19PROCMEANS均值以及均值的T检验.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

学习系列19PROCMEANS均值以及均值的T检验.docx

1、学习系列19PROCMEANS均值以及均值的T检验19. PROC MEANS 均值以及均值的 T检验(一)PROC MEANS 过程步由PROC UNIVARIATE过程步生成的大多数统计描述,用PROCMEANS过程步也可以实现。区别是,UNIVARIATE是做更深入的统 计分析;如果只是需要计算少数的统计量,PROC MEANS更适合(不 能做图形输出)。基本语法:PROC MEANS data =数据集 statistic-keywords;CLASS variable;VAR variable-list;说明:(1)CLASS指定分组变量,VAR指定要做统计分析的变量;(2)默认置信

2、水平是0.05 (即95%的置信限),若要设定在统计 量关键词位置加上,例如,ALPHA =0.1;(3)若不加统计量关键词,默认输出:均值、非缺省值个数、标准差、最小值、最大值。可选的统计量关键词包括:关键词说明关键词说明CLM双边置信限RANGE极差CSS校正平方和SKEWNESS偏度CV变异系数STDDEV标准差KURTOSIS峰度STDERR均值的标准误LCLM置信下限SUM求和MAX最大值SUMWGT求权重和MIN最小值UCLM置信下限MEAN均值USS未修正的平方和MODE众数N非缺省值个数NMISS缺省值个数PROBTT检验的概率TT值Q1 或 P25第1四分位数MEDIAN或P

3、50中位数Q3 或 P75第3四分位数P11%分位数P55%分位数P1010%分位数P9090%分位数P9595%分位数P9999%分位数例1儿童书作家考察市面上儿童书的页数作为出书的参考,搜集数据(C:MyRawDataPicbooks.dat)如下:读入数据,计算数据个数、均值、中位数,以及 90%的置信限。代码:data booklengths;infile c:MyRawDataPicbooks.dat ;input NumberOfPages ; run ;*Produce summary statistics;procmeans data = booklengths NMEANME

4、DIANCLMALPHA= 0.10 MAXDEC= 2;title Summary of Picture Book Lengths ;run ;说明:有90%的把握说“儿童书的页数范围是:26.44, 29.56” .(二)假设检验的P值法一、什么是假设检验?实际中,我们只能得到抽取的样本(部分)的统计结果,要进一步推断总体(全部)的特征,但是这种推断必然有可能犯错,犯错的 概率为多少时应该接受这种推断呢?为此,统计学家就开发了一些统计方法进行统计检定, 通过把所得到的统计检定值,与统计学家树立了一些随机变量的概率分布进行 对比,我们可以知道在百分之多少的机遇下会得到目前的结果。倘若经比较后

5、发现,涌现这结果的机率很少,即是说,是在时机 很少、很罕有的情况下才出现;那我们便可以有信念地说,这不是巧 合,该推断结果是具有统计学上的意义的。否则,就是推断结果不具 有统计学意义。二、 假设检验的基本思想一一小概率反证法思想小概率思想是指小概率事件(Pa , a =0.05或0.01)在一次试 验中基本上不会发生。反证法思想是先提出原假设( H。),再用适当 的统计方法确定假设成立的可能性(P值)大小,如可能性小(P|to| = to的双侧尾部的面积;IV.若P值V a (在右尾部分),则在显著水平a下拒绝Ho;若P值 a ,则在显著水平a下接受Ho;注意:a为临界值,看P值在不在阴影部分

6、(拒绝域),空白部 分为接受域。2.左侧检验I.原假设Ho: v A V o,备择假设Hi: v v ii o;n .根据样本数据计算出统计量t的观察值to (v o);m. P值=P(t a ,则在显著水平a下接受Ho;3.右侧检验I.原假设Ho: o,备择假设Hi: v V o;n .根据样本数据计算出统计量t的观察值to( o);m. P值=P(t to = to的右侧尾部的面积;IV.若P值v a (在右尾部分),则在显著水平a下拒绝Ho;若P值 a ,则在显著水平a下接受Ho;(3)T分布与T检验一、T分布若样本均数服从正态分布,经过U变换,可以变成标准正态分布 N(0, 12),也

7、成为U分布.实际工作中,由于总体标准差未知,用样本标准差代替,则不再 服从标准正态分布,而是服从 T分布:其中,S为样本方差,n为样本含量,v为白由度。T分布只有一个参数 白由度v. VT8时,T分布无限接近标 准正态分布。T分布的图形说明:单侧概率(单侧尾部面积)用表示;双侧概率(双侧尾部面积)用表示;例如,to.o5,io=1.812,贝U P(tV-1.812)=P(tA 1.812)=0.05to.o5/2,io=2.228,贝U P(tV -2.228)+P(tA 2.228)=0.05二、T检验T检验,是一种参数假设检验,用来检验“单样本均数与已知均 数、两独立样本均数、配对设计资

8、料的均数”是否存在差异,这种差异是否能推论至总体T检验适用于样本含量较小(比如 n60,大样本数据可以用 U 检验),适用条件:1数据服从正态分布(做正态性检验);2满足方差齐性(即两样本的总体方差相等,做 F检验);若满足,可以尝试对数据做变量变换:对数变换、平方根 变换、倒数变换、平方根反正弦变换等。正态性检验:(1) W检验,Shapiro-Wilk检验是基于次序统计量对它们期望 值的回归而构成的。所用检验统计量为 W,又称为W检验。在样本 量3 n 50时使用。(2) D检验,Kolmogorov-Smirnov检验的统计量为 D,所以也 称D检验,在样本量50 n 1000时使用。假

9、设检验H0:数据总体服从正态分布,Hi:数据总体不服从正 态分布。当P a时,不拒绝 也,认为样本所来白的总体服从正态分布。F检验要求两样本数据的总体均服从正态分布,统计量F为为较大的方 差与较小的方差的比值:假设检验H。:两总体方差相等;Hi:两总体方差不相等。取a=0.10 ( a较大以减少II类错误),当P 0C时,不拒绝H0,认为两总体方差相等。(四)均值的T检验T检验“单样本均数与已知均数、两独立样本均数、配对设计资 料的均数”是否存在差异。例如,检查学生成绩平均分是否在某个分值之上;比较同一老师 教的两个班的学生平均分是否存在差异;正常饲料组和维E缺乏组大 白鼠肝中维生素A含量的均

10、值是否存在差异。T检验在SAS中用PROC TTEST过程步实现。一、 单样本与指定均值基本语法:PROC TTEST data =数据集 H0 = mu0 options;VAR variable;说明:“H0=mu0”,对变量的均值与指定均值 mu0(默认是H0=0), 做T检验。原假设是头=v 0.二、 两独立样本的均值基本语法:PROC TTEST data =数据集 options;CLASS variable ;VAR variable ;说明:CLASS语句指定分组变量,进行组间均值的比较。三、 配对设计资料的均值基本语法:PROC TTEST options;PAIRED va

11、riablel * variable2 ;说明:配对均值T检验,是检验两个变量各数据的差的均值是否 等于0.四、 Options可选项(1) ALPHA =n指定显著水平0C ;(2) CI =type指定标准差的置信区间的类型,EQUAL (默认)为equal-tailed的置信区间,UMPU为基于一致最优无偏检验的置信区间,NONE不输出置信区间;(3) SIDES =type指定单侧、双侧检验,默认type=2为双侧检验,L为左侧检验,U右侧检验;五、 绘制T检验的图形在TTEST语句中使用参数PLOTS =(绘图类型)即可。基本语法:PROC TTEST data =数据集 PLOTS

12、 =(绘图类型); 可选的绘图类型:ALL或NONE绘制全部图形或不绘制任何图形;BOXPLOT盒形图;HISTOGRAM直方图(包括正态分布、核密度线);INTERVALPLOT 均值的置信区间的图形;QQPLOTQQ 图;SUMMARYPLOT 在一张图中绘制直方图和盒形图;AGREEMENTPLOTAGREEMENT 图;PROFILESPLOTPROFILESPLOT 图;注意:TTEST过程步都默认绘制 QQ图和SUMMARYPLOT图, 配对T检验还默认绘制 AGREEMENTPLOT图和PROFILESPLOT图 另外,指定绘制图形类型之后,那些默认图仍然会绘制,除非加上 (ON

13、LY):PROC TTEST data =数据集 PLOTS(ONLY)=(绘图类型);例 250 米女子白由泳的数据(C:MyRawDataOlympic50mSwim.dat), 变量包括姓名、决赛用时、半决赛用时:读入数据,用配对T检验考察决赛和半决赛用时有无明显差异。代码:data Swim;infile c:MyRawDataOlympic50mSwim.dat ;input Swimmer $ FinalTimeSemiFinalTime ;run ;procttest data = Swim;paired SemiFinalTime * FinalTime;title 50m Freestyle Semifinal vs. Final Results ;run ;运行结果:程序说明:(1) 总决赛用时与半决赛用时之差的均值为 0.0850,其95%置信区 间为0.239, 0.1461;标准差为 0.0731,其95%置信区间为0.0483, 0.1488;(2)白由度为7的t值=3.29, P值=0.0133小于显著性水平 也=0.05(P值在双尾部分“拒绝域”),故拒绝原假设H0.结论:两个均值不 相同,其结果有统计学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1