SPSS统计实验专题3概要.docx

上传人:b****5 文档编号:30620535 上传时间:2023-08-18 格式:DOCX 页数:33 大小:489.30KB
下载 相关 举报
SPSS统计实验专题3概要.docx_第1页
第1页 / 共33页
SPSS统计实验专题3概要.docx_第2页
第2页 / 共33页
SPSS统计实验专题3概要.docx_第3页
第3页 / 共33页
SPSS统计实验专题3概要.docx_第4页
第4页 / 共33页
SPSS统计实验专题3概要.docx_第5页
第5页 / 共33页
点击查看更多>>
下载资源
资源描述

SPSS统计实验专题3概要.docx

《SPSS统计实验专题3概要.docx》由会员分享,可在线阅读,更多相关《SPSS统计实验专题3概要.docx(33页珍藏版)》请在冰豆网上搜索。

SPSS统计实验专题3概要.docx

SPSS统计实验专题3概要

统计推断

实验1:

单个总体均值的区间估计

例1:

为研究在黄金时段中,即每晚8:

30-9:

00内,电视广告所占时间的多少。

美国广告协会抽样调查了20个最佳电视时段中广告所占的时间(单位:

分钟)。

请给出每晚8:

30开始的半小时内广告所占时间区间估计,给定的置信度为95%。

操作程序:

♦打开SPSS,建立数据文件:

“电视节目市场调查.sav”。

这里,研究变量为:

time,即每天看电视的时间。

♦选择区间估计选项,方法如下:

选择菜单【分析】—>【描述统计】—>【探索】”,打开图3.1Explore对话框。

♦从源变量清单中将“time”变量移入DependentList框中。

图3.1Explore对话框

♦单击上图右方的“统计量”按钮打开“探索:

统计量”对话框。

在设置均值的置信水平,如键入95%,完成后单击“继续”按钮回到主窗口。

图3.2探索统计量设置窗口

♦返回主窗口点击ok运行操作。

♦计算结果简单说明:

表3.1描述统计量

Descriptives

Statistic

Std.Error

time

Mean

6.5350

.13480

95%ConfidenceIntervalforMean

LowerBound

6.2529

UpperBound

6.8171

5%TrimmedMean

6.5167

Median

6.4500

Variance

.363

Std.Deviation

.60287

Minimum

5.60

Maximum

7.80

Range

2.20

InterquartileRange

.95

Skewness

.295

.512

Kurtosis

-.612

.992

♦如上表显示。

从上表“95%ConfidenceIntervalforMean”中可以得出,每晚8:

30开始的半小时内广告所占时间区间估计(置信度为95%)为:

(6.2529,6.8171),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。

点估计是:

6.5350。

2.两个总体均值之差的区间估计

例题:

TheWallStreetJournal(1994,7)声称在制造业中,参加工会的妇女比未参加工会的妇女的报酬要多2.5美元。

想通过统计方法,对这个观点是否正确给出检验。

假设抽取了7位女性工会会员与8位非工会会员女性报酬数据。

要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计,预设的置信度为95%。

♦打开SPSS,按如下图示格式输入原始数据,建立数据文件:

“工会会员工资差别.spss”。

这里,“会员”表示是否为工会会员的变量,y表示是工会会员,n表示非工会会员,“报酬”表示女性员工报酬变量,单位:

千美元。

♦计算两总体均值之差的区间估计,采用“独立样本T检验”方法。

选择菜单“【分析】→【比较均值】→独立样本T检验”,打开对话框。

♦变量选择

(1)从源变量清单中将“报酬”变量移入检验变量框中。

表示要求该变量的均值的区间估计。

(2)从源变量清单中将“group”变量移入分组变量框中。

表示总体的分类变量。

图3.3独立样本T检验对话框

♦定义分组单击定义组按钮,打开DefineGroups对话框。

在Group1中输入1,在Group2中输入2(1表示非工会会员,2表示工会会员)。

完成后单击“继续”按钮回到主窗口。

图3.4definegroups设置窗口

♦计算结果单击上图中“OK”按钮,输出结果如下图所示。

(1)GroupStatistics(分组统计量)表

分别给出不同总体下的样本容量、均值、标准差和平均标准误。

从该表中可以看出,参加工会的妇女平均报酬为19.925,不参加工会的妇女平均报酬为20.1429。

表3.2分组统计量

GroupStatistics

会员

N

Mean

Std.Deviation

Std.ErrorMean

报酬

1.00

8

19.9250

.46522

.16448

2.00

7

20.1429

.52236

.19743

(2)IndependentSampleTest(独立样本T检验)表

 Levene’sTestforEqualityofVariance,为方差检验,在Equalvariancesassumed(原假设:

方差相等)下,F=0.623,因为其P-值大于显著性水平,即:

Sig.=0.444>0.05,说明不能拒绝方差相等的原假设,接受两个总体方差是相等的假设。

因此参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差95%的区间估计为[0.76842,0.33271]。

 T-testforEqualityofMeans为检验总体均值是否相等的t检验,由于在本例中,其P-值大于显著性水平,即:

Sig.=0.408>0.05,因此不应该拒绝原假设,也就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异。

本次抽样推断结论不支持TheWallStreetJournal(1994,7)提出的“参加工会的妇女比未参加工会的妇女的报酬要多2.5美元”观点,即参加工会的妇女不比未参加工会的妇女的报酬多。

表3.3独立样本T检验结果

IndependentSamplesTest

Levene'sTestforEqualityofVariances

t-testforEqualityofMeans

F

Sig.

t

df

Sig.(2-tailed)

MeanDifference

Std.ErrorDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

报酬

Equalvariancesassumed

.623

.444

-.855

13

.408

-.21786

.25485

-.76842

.33271

Equalvariancesnotassumed

-.848

12.187

.413

-.21786

.25697

-.77679

.34108

3.单个总体均值的假设检验(单样本T检验)

例子:

某种品牌的沐浴肥皂制造程序的设计规格中要求每批平均生产120块肥皂,高于或低于该数量均被认为是不合理的,在由10批产品所组成的一个样本中,每批肥皂的产量数据见下表,在0.05的显著水平下,检验该样本结果能否说明制造过程运行良好?

♦判断检验类型该例属于“大样本、总体标准差σ未知。

假设形式为:

H0:

μ=μ0,H1:

μ≠μ0

♦软件实现程序打开已知数据文件,然后选择菜单“【分析】→【比较均值】→单样本T检验”,打开One-SampleTTest对话框。

从源变量清单中将“产品数量”向右移入“TestVariables”框中。

图3.5one-sampleTtest窗口

在“TestValue”框里输入一个指定值(即假设检验值,本例中假设为120),T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。

♦“One-SampleTTest”窗口中“OK”按钮,输出结果如下表所示。

(1)“One-SampleStatistics”(单个样本的统计量)表分别给出样本的容量、均值、标准差和平均标准误。

本例中,产品数量均值为118.9000。

表3.4单样本统计量

One-SampleStatistics

N

Mean

Std.Deviation

Std.ErrorMean

产品数量

10

118.9000

4.93176

1.55956

(2)“One-SampleTest”(单个样本的检验)表表中的t表示所计算的T检验统计量的数值,本例中为-0.705。

表中的“df”,表示自由度,本例中为9。

表中的“Sig”(双尾T检验),表示统计量的P-值,并与双尾T检验的显著性的大小进行比较:

Sig.=0.498>0.05,说明这批样本的平均产量与120无显著差异。

表中的“MeanDifference”,表示均值差,即样本均值与检验值120之差,本例中为-1.1000。

表中的“95%ConfidenceInternaloftheDifference”,样本均值与检验值偏差的95%置信区间为(-4.628,2.428),置信区间包括数值0,说明样本数量与120无显著差异,符合要求。

表3.5单样本T检验结果

One-SampleTest

TestValue=120

t

df

Sig.(2-tailed)

MeanDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

产品数量

-.705

9

.498

-1.10000

-4.6280

2.4280

4.两独立样本的假设检验(两独立样本T检验)

例题:

TheWallStreetJournal(1994,7)声称在制造业中,参加工会的妇女比未参加工会的妇女的报酬要多2.5美元。

想通过统计方法,对这个观点是否正确给出检验。

假设抽取了7位女性工会会员与8位非工会会员女性报酬数据。

要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计,预设的置信度为95%。

♦打开SPSS,按如下图示格式输入原始数据,建立数据文件:

“工会会员工资差别.sav”。

这里,“会员”表示是否为工会会员的变量,y表示是工会会员,n表示非工会会员,“报酬”表示女性员工报酬变量,单位:

千美元。

♦计算两总体均值之差的区间估计,采用“独立样本T检验”方法。

选择菜单“【分析】→【比较均值】→【独立样本T检验】”。

(1)从源变量清单中将“报酬”变量移入检验变量框中。

表示要求该变量的均值的检验。

(2)从源变量清单中将“会员”变量移入分组变量框中。

表示总体的分类变量。

图3.6sampleTtest窗口

♦定义分组单击GroupingVariable框下面的DefineGroups按钮,打开DefineGroups对话框。

在Group1中输入1,在Group2中输入2(1表示非工会会员,2表示工会会员)。

完成后单击“继续”按钮返回主窗口。

图3.7definegroups对话框

♦计算结果单击上图中“OK”按钮,输出结果如下图所示。

(1)GroupStatistics(分组统计量)表

分别给出不同总体下的样本容量、均值、标准差和平均标准误。

从该表中可以看出,参加工会的妇女平均报酬为19.925,不参加工会的妇女平均报酬为20.1429。

表3.6分组统计量

GroupStatistics

会员

N

Mean

Std.Deviation

Std.ErrorMean

报酬

1.00

8

19.9250

.46522

.16448

2.00

7

20.1429

.52236

.19743

(2)IndependentSampleTest(独立样本T检验)表

 Levene’sTestforEqualityofVariance,为方差检验,在Equalvariancesassumed(原假设:

方差相等)下,F=0.623,因为其P-值大于显著性水平,即:

Sig.=0.444>0.05,说明不能拒绝方差相等的原假设,接受两个总体方差是相等的假设。

T-testforEqualityofMeans为检验总体均值是否相等的t检验,由于在本例中,其P-值大于显著性水平,即:

Sig.=0.408>0.05,因此不应该拒绝原假设,也就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异。

本次抽样推断结论不支持TheWallStreetJournal(1994,7)提出的“参加工会的妇女比未参加工会的妇女的报酬要多2.5美元”观点,即参加工会的妇女不比未参加工会的妇女的报酬多。

表3.7独立样本T检验结果

IndependentSamplesTest

Levene'sTestforEqualityofVariances

t-testforEqualityofMeans

F

Sig.

t

df

Sig.(2-tailed)

MeanDifference

Std.ErrorDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

报酬

Equalvariancesassumed

.623

.444

-.855

13

.408

-.21786

.25485

-.76842

.33271

Equalvariancesnotassumed

-.848

12.187

.413

-.21786

.25697

-.77679

.34108

5.配对样本T检验

配对样本是对应独立样本而言的,配对样本是指一个样本在不同时间做了两次试验,或者具有两个类似的记录,从而比较其差异;独立样本检验是指不同样本平均数的比较,而配对样本检验往往是对相同样本二次平均数的检验。

配对样本T检验的前提条件为:

第一,两样本必须是配对的。

即两样本的观察值数目相同,两样本的观察值顺序不随意更改。

第二,样本来自的两个总体必须服从正态分布。

例如针对试验前学习成绩何智商相同的两组学生,分别进行不同教学方法的训练,进行一段时间试验教学后,比较参与试验的两组学生的学习成绩是否存在显著性差异。

假设某校为了检验进行新式培训前后学生的学习成绩是否有了显著提高,从全校学生中随机抽出30名进行测试,这些学生培训前后的考试成绩放置于数据文件“学生培训.sav”中。

在SPSS中对这30名学生的成绩进行配对样本t检验的操作步骤如下:

♦选择菜单【分析】→【比较均值】→【配对样本T检验】,打开对话框,如图3.8所示,将两个配对变量移入右边的PairVariables列表框中。

移动的方法是先选择其中的一个配对变量,再选择第二个配对变量,接着单击中间的箭头按钮。

图3.8Paired-SamplesTTest对话框

♦选项按钮的用于设置置信度选项,这里保持系统默认的95%

♦在主对话框中单击ok按钮,执行操作。

♦实例结果分析

表3.8和表3.9给出了培训前后学生考试成绩的均值、标准差、均值标准误差以及培训前后成绩的相关系数。

从表3.8来看,培训前后平均成绩并没有发生显著的提高。

表3.10给出了配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计。

当然也给出了最为重要的t统计量和p值。

结果显示p=0.246>0.05,所以,学校的所谓新式培训并未带来学生成绩的显著变化。

表3.8培训前后成绩的描述统计量

PairedSamplesStatistics

Mean

N

Std.Deviation

Std.ErrorMean

Pair1

培训前

67.00

30

14.734

2.690

培训后

68.60

30

12.947

2.364

表3.9培训前后成绩的相关系数

PairedSamplesCorrelations

N

Correlation

Sig.

Pair1

培训前&培训后

30

.865

.000

表3.10配对样本T检验结果

PairedSamplesTest

PairedDifferences

t

df

Sig.(2-tailed)

Mean

Std.Deviation

Std.ErrorMean

95%ConfidenceIntervaloftheDifference

Lower

Upper

Pair1

培训前-培训后

-1.600

7.398

1.351

-4.362

1.162

-1.185

29

.246

四、备择试验

1.某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为:

72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?

设α=0.05

2.分析某班级学生的高考数学成绩是否存在性别上的差异。

数据如表所示:

某班级学生的高考数学成绩

性别

数学成绩

男(n=18)

858975588680787684899995828760857580

女(n=12)

9296868378877065706570787256

3.SPSS自带的数据文件world95.sav中,保存了1995年世界上109个国家和地区的部分指标的数据,其中变量“lifeexpf”,“lifeexpm”分别为各国或地区女性和男性人口的平均寿命。

假设将这两个指标数据作为样本,试用配对样本T检验,女性人口的平均寿命是否确实比男性人口的平均寿命长,并给出差异的置信区间。

(设α=0.05)

试验4:

方差分析

一、试验目标与要求

1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理

2.掌握方差分析的过程。

3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。

二、试验原理

在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。

例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。

为此引入方差分析的方法。

方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。

若存在显著差异,则说明该因素对各总体的影响是显著的。

方差分析有3个基本的概念:

观测变量、因素和水平。

观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。

在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。

在方差分析中,因素常常是某一个或多个离散型的分类变量。

根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。

在SPSS中,有One-wayANOVA(单变量-单因素方差分析)、GLMUnivariate(单变量多因素方差分析);GLMMultivariate(多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。

本节仅练习最为常用的单因素单变量方差分析。

三、试验演示内容与步骤

单因素方差分析也称一维方差分析,对两组以上的均值加以比较。

检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。

并可以进行两两组间均值的比较,称作组间均值的多重比较。

主要采用One-wayANOVA过程。

采用One-wayANOVA过程要求:

因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。

若对被观测对象的试验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用RepeatedMeasure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。

假设某汽车经销商为了研究东部、西部和中部地区市场上汽车的销量是否存在显著差异,在每个地区随机抽取几个城市进行调查统计,调查数据放置于数据文件“汽车销量调查.sav”中。

在SPSS中试验该检验的步骤如下:

♦步骤1:

选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。

图4.1One-WayANOVA对话框

♦单击两两比较按钮,如图4.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。

方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。

假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。

各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。

图4.2两两比较对话框

假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。

这里选择最常用的LSD检验法;未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。

这里选择Tamhane’sT2检验法;Significancelevel输入框中用于输入多重比较检验的显示性水平,默认为5%。

♦单击选项按钮,弹出options子对话框,如图所示。

在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。

♦在主对话框中点击ok按钮,可以得到单因素分析的结果。

试验结果分析:

表4.1给出了不同地区汽车销量的基本描述统计量以及95%的置信区间。

图4.3选项子对话框

表4.1各个地区汽车销量描述统计量

Descriptives

销量

N

Mean

Std.Deviation

Std.Error

95%ConfidenceIntervalforMean

Minimum

Maximum

LowerBound

UpperBound

西

10

157.90

22.278

7.045

141.96

173.84

120

194

9

176.44

19.717

6.572

161.29

191.60

135

198

7

196.14

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1