ImageVerifierCode 换一换
格式:DOCX , 页数:39 ,大小:396.79KB ,
资源ID:10964762      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10964762.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(均值的比较CompareMeans.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

均值的比较CompareMeans.docx

1、均值的比较CompareMeans第三讲:均值比较与回归分析教学目的:能应用SPSS软件进行:单个均值假设检验、均值比较分析、相关分析、回归分析等教学内容:1)均值的比较 2)相关分析3)回归分析教学重点:均值比较分析、回归分析教学难点:均值比较分析教学时间:1学时均值的比较Compare Means 调查研究中的个案(Cases)被称为样本。如果样本来自总体,那么,总体的特征可以采用集中趋势或离中趋势加以描述和统计,其结果可以准确地描述总体。一般地,数据总体的均值应为0,方差应为1,即服从标准正态分布。现实中,样本的均值与方差都不能满足该条件,但可加大样本规模使之分布接近总体的正态分布。在S

2、PSS中,将两个总体均值近比较称为Compare Means,可选择AnalyzeCompare Means来实现。Compare Means集中了几个用于计量资料均值间比较的过程。具体有: Means过程:对准备比较的各组计算描述指标,进行预分析,也可直接比较。 One-Samples T Test过程:进行样本均值与已知总体均值的比较。 Independent-Samples T Test过程:进行两样本均值差别的比较,即通常所说的两组资料的t检验。 Paired-Samples T Test过程:进行配对资料的显著性检验,即配对t检验。 One-Way ANOVA过程:进行两组及多组样本

3、均值的比较,即成组设计的方差分析,还可进行随后的两两比较。1.1Means过程和上一章所讲述的几个专门的描述过程相比,Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程。显然要方便得多。1.1.1界面说明选择AnalyzeCompare MeansMeans,进入Means对话框,见图1.1a。其各部分解释如下:图1.1a Means对话框Dependent List框:用于选入需要分析的变量。Independent List框:用于选入分组变量。Options:弹出Options对话框(见图1.1b),选择需要计算的描述统计

4、量和统计分析: Statistics框:可选的描述统计量。它们是:1. sum,number of cases 总和,记录数2. mean, geometric mean, harmonic mean 均值,几何均值,修正均值3. standard deviation,variance,standard error of the mean 标准差,均值的标准误, 方差4. median, grouped median 中位数,频数表资料中位数(比如30岁组有5人,40岁组有1人,则在计算grouped median时均按组中值35和45进行计算)。5. minimum,maximum,rang

5、e 最小值,最大值,全距6. kurtosis, standard error of kurtosis 峰度系数,峰度系数的标准误7. skewness, standard error of skewness 偏度系数,偏度系数的标准误8. percentage of total sum, percentage of total N 总和的百分比,样本例数的百分比 Cell Statistics框:选入的描述统计量。 Statistics for First layer复选框组1. Anova table and eta 对分组变量进行单因素方差分析,并计算用于度量变量相关程度的eta值。2.

6、 Test for linearity 检验线性相关性,实际上就是上面的单因素方差分析。图1.1b Means中的Options对话框1.1.2分析案例例1.1 利用111.sav文件中的数据分析,不同性别sex、月收入income、年龄age等q9(即被访问者最近一次参加促销活动的消费)的不同表现。上述问题采用Means来解决。如果分析消费与性别的关系,或者说研究男女消费的差异,则月收入和年龄就是两个控制变量。当然,也可分析消费与与收入的关系、消费与年龄的关系,相应地,另两个变量就成了控制变量了。这里只给出男女消费差异求解的简化操作:1 AnalyzeCompare MeansMeans 2

7、 Dependent list框:选入q93 Independent list框:依次选入sex、income、age(注意:sex一定要放在第一位)4 单击option:选中Anova table and eta复选框,单击Continue5 单击OK 1.1.3结果解释有了上一章的基础,Means过程的输出看起来就不太困难了。它的输出结果包括Case Processing Summary、Report、ANOVA Table、 Measures of Association等。缺失值报告。312个Cases均有效。 Case Processing Summary CasesIncluded

8、ExcludedTotalNPercentNPercentNPercent被访问者最近一次参加促销活动的消费 * 被访问者性别 * 被访问者年龄 * 被访问者月收入312100.0%0.0%312100.0%常用统计描述量报表。由于Report表太长,这里只给出了一部分,但人可以看出表的结构。表中的结果是按默认情况输出均值、样本量和标准差。因为选择了分组变量,所以三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。单因素方差分析表。在选择了Anova table and eta或Test for linearity复选框时出现。实际上就是在检验各组间均值有无差异

9、。表中结果显示:组间Between Groups的离差平方和为154.914,自由度为1(即只有一个因素Sex);而组内Within Groups的离差平方和为1415811.715,自由度为310;最后F值为0.033,F值的概率为0.8510.05,表明没有理由拒绝系统默认的原假设不同性别的消费相同,可认为男女参加促销活动的消费没有什么区别。ANOVA Table Sum of SquaresdfMean SquareFSig.被访问者最近一次参加促销活动的消费 * 被访问者性别 Between Groups(Combined)154.9141154.914.033.851Within G

10、roups1415811.7153104728.102 Total1411021.179311 相关性度量指标,给出Eta值以及Eta值的平方根。表中数据说明两者关系较弱。 Measures of Association EtaEta Squared被访问者最近一次参加促销活动的消费 * 被访问者性别.010.0001.2One-Samples T Test过程One-Samples T Test过程用于进行样本所在总体均值与已知总体均值的比较,可以自行定义已知总体均值为任意值,该对话框的界面非常简单。1.2.1界面说明选择AnalyzeCompare MeansOne-Samples T T

11、est,进入对话框,见图1.2a。其各部分解释如下:图1.2a One-Samples T Test对话框Test Variables框:用于选入需要分析的变量。Test Value框:在此处输入已知的总体均值,默认值为0。Options:弹出Options对话框(见图1.2b),用于定义相关的选项,有: Confidence Interval框 输入需要计算的均值差值可信区间范围,默认为95%。如果是和总体均值为0相比,则此处计算的就是样本所在总体均值的可信区间。 Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Exclude

12、s cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。图1.2b One-Samples T Test的Options对话框1.2.2分析案例比如要检验数据l11.sav中q9(消费)的总体均值是否等于200。采用One-Samples T Test的简要操作步骤如下:1 AnalyzeCompare MeansOne-Samples T Test 2 Test Variable(s)框:选入q93 Test Value框:填入2004 单击OK 1.2.3

13、 结果解释One-Samples T Test过程的输出也是比较简单的,由描述统计表和t检验表组成。上例的输出如下:One-Sample Statistics分析表。所分析变量的基本情况描述,有样本量、均值、标准差和标准误。 One-Sample Statistics NMeanStd. DeviationStd. Error Mean被访问者最近一次参加促销活动的消费312114.0318.1583.887单样本t检验表,第一行注明了用于比较的已知总体均值为200,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均值的差值(Mean Difference)、

14、差值的95%可信区间。由上表可知:t=-9.253,P=0.0000.05,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t = -0.212,df =239,P=0.7930.05,从而拒绝H0,认为这两个年龄组的消费没什么不同。从上面的统计结果看,两个样本均值相差无几,也可认为两个组的消费无显著差异。最后面还附有一些其他指标,如两组均值的可信区间等,以对差异情况有更直观的了解。1.4Paired-Samples T Test过程该过程用于进行配对设计的样本差值均

15、值与总体离差均值0比较的t检验,它和One-Samples T Test过程相重复的(等价于已知总体均值为0的情况),但Paired-Samples T Test过程使用的数据输入格式和前者不同,即通常所称的统计表格格式,因此仍然有存在的价值。1.4.1界面说明选择AnalyzeCompare MeansPaired-Samples T Test,即可进入对话框,见图1.4。整个界面上只有一个Paired Variable框需要介绍,它用于选入希望进行比较的一对或几对变量(注意这里的量词是对而不是个)。选入变量需要成对成对的选入,即按住Ctrl键,选中两个成对变量,再单击将其选入。如果只选中一

16、个变量,则按钮为灰色,不可用。图1.4 Paired-Samples T Test对话框1.4.2分析实例例1.2 某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别?大白鼠对号正常饲料组维生素E缺乏135502450220002400330001800439503200538003250137502700734502500830501750为了说明问题,此处假设输入数据时就按照上表格

17、式输入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为G2。操作如下:1. 同时选中G1、G2:选入Paired Variables框 2. 单击OK 1.4.3结果解释以例1.1为例,其输出结果如下:配对变量各自的统计描述,此处只有1对,故只有Pair 1。此处进行配对变量间的相关性分析。等价于AnalyzeCorrelateBivariate。配对t检验表,给出最终的检验结果,由上表可见P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。上表的标题内容翻译如下:对子间的差异差值均值标准差标准误均值的95%可信区间t值自由度P值(双侧

18、)下限上限第一对G1 - G2812.5000541.2535193.1298355.82071219.17934.2077.0041.5One-Way ANOVA过程One-Way ANOVA过程用于进行两组及多组样本均值的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较,在本章的内容中,它是最为复杂的一个,但是有了前面的基础,拿下他应该不成问题。1.5.1界面说明选择AnalyzeCompare MeansPaired-One-Way ANOVA,即可进入对话框,见图1.5a。其各部分的解释如下:图1.5a Paired-O

19、ne-Way ANOVA对话框Dependent List框:选入需要分析的变量,可选入多个结果变量(因变量)。Factor框:选入需要比较的分组因素,只能选入一个。Contrast:弹出Contrast对话框(见图1.5b),用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。 Polynomial复选框:定义是否在方差分析中进行趋势检验。 Degree下拉列表:和Polynomial复选框配合使用,可选则从线性趋势一直到最高五次方曲线来进行检验。 Coefficients框:定义精确两两比较的选项。这里按照分组变量升序给每组一个系数值,注意最终所

20、有系数值相加应为0。如果不为0仍可检验,只不过结果是错的。比如说在下面的例1.2中要对第一、三组进行单独比较,则在这里给三组分配系数为1、0、-1,就会在结果中给出相应的检验内容。Post Hoc:弹出Post Hoc Multiple Comparisons对话框(见图1.5c),用于选择进行各组间两两比较的方法,有: Equar Variances Assumed复选框组:一组当各组方差齐时可用的两两比较方法,共有14种。这里不一一列出了,其中最常用的为LSD、S-N-K、Tukey等。 Equar Variances Not Assumed复选框组:一组当各组方差不齐时可用的两两比较方法

21、,共有4种,其中以Dunnettss C法较常用。 Significance Level框:定义两两比较时的显著性水平,默认为0.05。图1.5b One-Way ANOVA中的Contrasts对话框图1.5c One-Way ANOVA中的Post Hoc Multiple Comparisons对话框Options:弹出Options对话框(见图1.5d),用于定义相关的选项,有: Statistics复选框组:选择一些附加的统计分析项目,有统计描述(Descriptive)和方差齐性检验(Homogeneity-of-variance)。 Means plot复选框:用各组均值做图,以

22、直观的了解它们的差异。 Missing Values单选框组:定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。图1.5c One-Way ANOVA中的Options对话框1.5.2分析实例例1.3 利用111.sav文件中q9(消费)、income(月收入)数据,研究四种收入群体的消费是否显著不同。设111.sav数据文件已打开,分组变量为income,因变量为

23、q9。此处先进行单因素方差分析,然后进行两两比较,这里选择Tukey法进行两两比较。操作如下:1 AnalyzeCompare MeansPaired-One-Way ANOVA2 Dependent List框:选入q93 Factor框:选入income 4 单击Post Hoc:选中Tukey复选框,单击Continue 5 单击OK 1.5.3结果解释上题的输出结果如下:一个典型的方差分析表。给出了单因素方差分析的结果,可见F=1.001,P=0.3900.05。因此可认为四组收入群体的最近一次参加促销活动的消费无显著差异。 ANOVA被访问者最近一次参加促销活动的消费 Sum of

24、SquaresdfMean SquareFSig.Between Groups14222.72534740.9081.001.390Within Groups1451798.9553084713.133 Total1411021.179311 上表的标题内容翻译如下:离均差平方和SS自由度均方MSF值P值组间变异14222.72534740.9081.001.390组内变异1451798.9553084713.133总变异1411021.179311用Tukey法进行两两比较的结果。简单的说,在表格的纵向上有各配对组的均值差异、标准差、P值及95%的置信区间,表格的横向上被分成了若干个亚组。表

25、中结果显示:不同亚组间的P值都大于0.05,表明各组间两两比较均无有显著差异,可认为不同收入群体的消费几乎趋同。Post Hoc Tests Multiple ComparisonsDependent Variable: 被访问者最近一次参加促销活动的消费 Tukey HSD (I) 被访问者月收入(J) 被访问者月收入Mean Difference (I-J)Std. ErrorSig.95% Confidence Interval Lower BoundUpper Bound1000元以下1000-1500元9.558.901.701-13.4532.51 1500-2000元-5.5511.418.913-35.1724.07 2000元以上21.0918.050.147-25.5417.721000-1500元1000元以下-9.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1