SPSS使用入门.docx

资源描述

SPSS使用入门.docx

《SPSS使用入门.docx》由会员分享，可在线阅读，更多相关《SPSS使用入门.docx（24页珍藏版）》请在冰豆网上搜索。

SPSS使用入门.docx

SPSS使用入门

SPSS在语言测试研究中的应用

1数据的输入与保存

1.1SPSS界面

当打开SPSS后，展现在我们面前的是SPSS数据编辑界面（图2.1）。

将鼠标在上图中的各处停留，很快就会弹出相应部位的名称。

窗口顶部显示为“Untitled–SPSSDataEditor”，表明现在所看到的SPSS数据管理窗口还没有输入任何数据，而且还没有对该文件命名。

这是一个典型的Windows软件界面，有菜单栏、工具栏。

特别的，工具栏下方的是数据栏，数据栏下方则是数据管理窗口的主界面。

该界面和EXCEL极为相似，由若干行和列组成，每行对应了一条记录，每列则对应了一个变量。

第一行第一列的单元格DataView（数据视窗）边框颜色为亮色，表明该数据单元格为当前活动单元格。

若要输入或者编辑变量名称（变量语言可用中文或者英文），则点击VariableView（变量视窗）。

图2.1SPSS数据编辑界面

1.2定义变量

图2.2显示的是变量视窗编辑。

第一列是变量名称（Name），如id（调查对象的序号）从左到右依次为变量类型，系统默认的变量为数值型（Numeric），长度（Width）为8，有两位小数位（Decimals），标签，变量值（Values）。

变量值标签在右侧的Value框定义。

图2.2SPSS变量的定义

以group为例，单击Value框右半部的省略号，会弹出变量值标签对话框（图2.3）。

上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输入“1”和“20school”，此时下方的Add钮变黑，单击它，该变量值标签就会被加入下方的标签框内。

与此类似定义其他变量值，最后按OK按钮，变量值标签就设置完成。

此时你做任何分析，在结果中都有相应的标签出现。

图2.3SPSS变量值标签对话框

变量值后面的是缺失值定义，尚无缺失值（Missing）。

接下来的变量定义是显示对齐方式（Align）为右对齐，变量属性为数值变量（scale），也叫等距变量。

变量属性还包括分类变量，分为有序分类变量（Ordinal）和无序分类变量（Nominal）。

上图第一栏是第一个变量（id），通常用于定义外语测试研究中的参与对象，如考生和外语学习者。

第二栏是Group变量，用于对实验调查对象分类。

第三栏以下的变量为考试题目的变量名称，如n1（第1题），n2（第2题）等等。

1.3输入数据

接下来的任务是在数据视窗中依次输入数据（图2.4）。

图2.4中呈现的数据表示有30名考生，分成了五个小组，作答了8道多项选择题。

为了便于统计客观题的数据，通常用数字1表示正确作答，数字0表示错误作答。

图2.4SPSS的数据输入

1.4保存数据

选择菜单File==>Save，若该数据从来没有被保存过，会弹出Saveas对话框（图2.5）。

图2.5SPSS数据的保存

单击保存类型列表框，可以看到SPSS所支持的各种数据类型，有文本文件格式*.dat、EXCEL等等，这里我们仍然将其存为SPSS自己的数据格式（*.sav文件）。

在文件名框内键入itemanalysis并回车，可以看到数据管理窗口左上角由Untitled变为了图4的变量名itemanalysis。

2SPSS语言测试研究中的应用案例

2.1英语期末考试成绩的描述统计分析

内容：

制作成绩频数（分段：

0－60；60－70；70－80；80－90；90－100）分布表并作频数分布分析，计算平均值（mean），众数（mode），中数（median），标准差（Std.deviation），方差（variance），倾斜度（skewness），峰值（kurtosis），全距（range），总和（sum）

频数分布表是描述性统计最常用的方法之一，Frequencies过程就是专门为产生频数表而设计的。

它不仅可以产生详细的频数表，还可以按要求给出某百分位点的数值，以及常用的条、圆、图等统计图。

选择Analyze==>DescriptiveStatistics==>Descriptivestatistics==>Frequencies菜单，系统弹出描述对话框（图2.6）。

该对话框可分为左右两大部分，左侧为所有可用的侯选变量列表，右侧为选入变量列表。

我们只需要描述score，用鼠标选中score，单击中间的按钮，变量score的标签就会移入到右侧，注意这时OK按钮变黑，表明已经可以进行分析了。

图2.6Frequencies对话框的界面

需要分析的数据除了成绩的频数还有其他数据，所以下一步就点击Statistics，选择表示数据集中趋势（CentralTendency）的统计量Mean、Median、Mode、Sum，表示数据离散度（Dispersion）的Std.deviation、Variance、Range和表示数据分布（Distribution）的Skewness、Kurtosis。

点击Continue，回到刚才的视窗，点击Charts，选中Histograms了解数据的分布形状，依次选择Continue==>OK按钮，系统会弹出一个新的界面，生成所需的统计（图2.7）。

图2.7英语期末考试成绩的描述统计

图2.7窗口左上方的名称为SPSSViewer，即（结果）浏览窗口，整个的结构和资源管理器类似，左侧为导航栏，右侧为具体的输出结果。

结果表格给出了样本数、最小值、最大值、均数和标准差等这几个常用的统计量，以及我们所需的统计量。

从中可以看到，考生人数为80人，没有缺失的数据，所需描述统计的结果如表2.1。

人数

平均分

中数

众数

标准差

方差

倾斜度

峰值

全距

总和

85.48

86.50

5.827

33.949

-.993

.833

6838

表2.1英语期末考试成绩的描述统计

从表2.1可以看到，本次考试的平均分为85.48分，考试成绩最中间的分数（中数）是86.5，人数最多的分数（众数）是89，考生分数离平均分的标准距离（标准差）是5.827，分数构成的抛物线形态（倾斜度）为负偏态，斜度-.993，表示考生的英语成绩超过平均分85.48的人数比低于平均分的人数要多（图2.8）。

图2.8英语期末考试成绩的柱状分布图

表2.2是英语期末考试成绩的频数分布。

Frequency是每个分数出现的频数，Percent是该分数所占的百分比，CumulativePercent是该分数的累积百分比，指该考生分数在整个群体中的位置。

例如，某考生的分数为80，该分数的累积百分比为17.5%，那么该生的英语期末成绩只比17.5%的考生好。

根据各分数段包含的人数分及其所占的百分比，就可得出每个分数段的人数和比例。

Frequency

Percent

CumulativePercent

Valid

1.3

2.5

5.0

1.3

6.3

1.3

7.5

2.5

10.0

2.5

12.5

5.0

17.5

1.3

18.8

2.5

21.3

6.3

27.5

7.5

35.0

10.0

45.0

5.0

50.0

6.3

56.3

5.0

61.3

15.0

76.3

8.8

85.0

6.3

91.3

2.5

93.8

2.5

96.3

3.8

100.0

Total

100.0

表2.2英语期末考试成绩的频数分布

图2.9英语期末考试成绩的频数分布图

当然，考生成绩的频数分布图制作还可以采用另外一种方法。

选择菜单Transform==>Record==>IntoDifferentVariables，出现Recode对话框（图2.10）。

图2.10变量Recode对话框

将score选入InputVariable->OutputVariable框，此时OutputVariable框变黑，在其中键入新变量名group并单击Change，可见原来的score->?

变成了score->group。

单击“OldandNewValues”，系统弹出变量值定义对话框（图2.11）。

图2.11新旧变量的转换

按照题目的要求，选择Range:

Lowestthrough，在右侧框中键入60，然后在右上方的Value右侧框中键入对应的新变量值1，此时下方Add键变黑，单击它，Old->New框中就会加入Lowestthru60->1，按照类似的方法依次加入另外几条转换规则，最终Old->New框中共有Lowestthru60->1、160thru70->2、70thru80->3、80thru90->4、90thru100->5五条，现在单击Continue，再单击OK，系统就会按要求生成新变量group。

按照变量值标签对话框操作方法将1-5分别定义5个为分数段。

选择Analyze==>DescriptiveStatistics==>Descriptivestatistics==>Frequencies菜单，系统弹出描述频数的对话框如，将group变量移入到右侧，选点击Chart按钮，选择Barcharts（柱状图），ChartValues选Percentages（百分比），点击Continue按钮返回，点击OK按钮，系统生成所需的频数分布表（表2.3）和图（图2.12）。

这里的分数段统计包括了每段最高的分数，如60-70分数段包括分数为70的考生。

Frequency

Percent

Valid

60-70

2.5

70-80

15.0

80-90

67.5

90-100

15.0

Total

100.0

表2.3英语期末考试成绩的频数分布表

图2.12英语期末考试成绩的频数分布图

2.2英语试卷的项目分析

内容：

有30名考生，作答了8道多项选择题的英语试题，请计算每道题目的难度、区分度以及这套试题的信度

我们现在利用图2.4所提供的数据来分析。

选择Analyze==>Scale==>ReliabilityAnalysis菜单，系统弹出描述对话（图2.13）。

图2.13信度分析对话框

我们需要分析8道题目的难度、区分度以及这套试题的信度，用鼠标选中变量n1-n8，单击中间的按钮，这些变量的标签就会移入到右侧。

点击Statistics（统计），依次选中Item，Scaleifitemdeleted，选择Continue==>OK按钮，系统会弹出一个新的界面，生成所需的统计（图2.14）。

图2.14题目的难度、区分度和试题的信度系数

从图2.14可以看到n1的Mean为.9333，因为我们的计分方法是正确为1，错误为0，这个平均分就是第一道题目的难度，也叫易度指数（itemfacility），表示题目的容易程度。

一般认为，题目的难度介于0.3-0.7之间，难度在0.3以下的题目较难，这样的题目须修改；难度在0.7以上的题目较易，难度为0.5的题目最好。

不过，在课堂测验中，我们的测验目的是了解英语教学活动达到教学目标的程度，了解学生掌握学习目标的程度，若是学生掌握了题目所代表的全部知识和技能，则每道题目的难度为1。

这时，难度在0.7以上的题目表示学生对题目所代表的知识或技能掌握很好；难度在0.5以下的题目表示学生对题目所代表的知识或技能掌握很差，学生应该补习这种题目包含的知识或技能（Hudson&Lynch1984:

177）。

StdDev表示题目的标准差，8道题目中标准差最小的是第1题、第2题和第8题（StdDev=.2537），表示考生在这三道题目中的得分差异不大。

Cases指考生人数。

CorrectedItem-TotalCorrelation（题目-总分的校正相关系数）就是题目的区分度，表示题目能够区分优生和差生的程度。

8道题目中，区分度最好的题目是第3题，区分度为0.7193；区分度最差的题目是第2题，区分度为0.2614。

ReliabilityCoefficients指试题的信度系数。

系数越高，统计的误差越小。

一般认为，客观试题的信度系数在0.8以上，表示试题的误差较小，信度良好；0.9以上的信度系数为优秀；0.7-0.8的信度系数为中等；0.6-0.7的信度系数可以接受；试题信度在0.6以下则不可接受，试题须修改。

客观试题的信度与题目的难度和区分度有关，而区分度则和考生之间的差异性有关，考生的英语水平差异越大，题目的区分度越高，试题的信度就越高。

题目的数量越多，信度自然就越高。

本套试题的考生人数为30人，题目数为8，Alpha系数为0.7355。

区分度取舍的主要依据AlphaifItemDeleted（题目去掉后的信度系数），若一道题目去掉后，整套试题的信度在原来的基础上下降，说明此题对整套试题来讲很重要，区分度理想，反之说明该题目的区分度不理想，须修改或剔除。

从图2.14来看，每一道题目去掉后，试题的信度都会下降，这说明这些题目的区分度都理想。

2.3作文评阅的相关性和一致性分析

内容：

现有5名英语教师分别独立采用整体印象法评阅20名学生的作文，作文满分为10，数据为EXCEL文件（图2.15），分析不同评卷员之间的相关性和一致性。

图2.15EXCEL文件：