SPSS使用入门.docx-资源下载

SPSS使用入门.docx

1、SPSS使用入门SPSS在语言测试研究中的应用1 数据的输入与保存1.1 SPSS界面当打开SPSS后，展现在我们面前的是SPSS数据编辑界面（图2.1）。将鼠标在上图中的各处停留，很快就会弹出相应部位的名称。窗口顶部显示为“Untitled SPSS Data Editor”，表明现在所看到的SPSS数据管理窗口还没有输入任何数据，而且还没有对该文件命名。这是一个典型的Windows软件界面，有菜单栏、工具栏。特别的，工具栏下方的是数据栏，数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似，由若干行和列组成，每行对应了一条记录，每列则对应了一个变量。第一行第一列的单元格Data

2、View（数据视窗）边框颜色为亮色，表明该数据单元格为当前活动单元格。若要输入或者编辑变量名称（变量语言可用中文或者英文），则点击Variable View（变量视窗）。图2.1 SPSS数据编辑界面1.2 定义变量图2.2显示的是变量视窗编辑。第一列是变量名称（Name），如id（调查对象的序号）从左到右依次为变量类型，系统默认的变量为数值型（Numeric），长度（Width）为8，有两位小数位（Decimals），标签，变量值（Values）。变量值标签在右侧的Value框定义。图2.2 SPSS变量的定义以group为例，单击Value框右半部的省略号，会弹出变量值标签对话框（图2.3

3、）。上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输入“1”和“20 school”，此时下方的Add钮变黑，单击它，该变量值标签就会被加入下方的标签框内。与此类似定义其他变量值，最后按OK按钮，变量值标签就设置完成。此时你做任何分析，在结果中都有相应的标签出现。图2.3 SPSS变量值标签对话框变量值后面的是缺失值定义，尚无缺失值（Missing）。接下来的变量定义是显示对齐方式（Align）为右对齐，变量属性为数值变量（scale），也叫等距变量。变量属性还包括分类变量，分为有序分类变量（Ordinal）和无序分类变量（Nominal）。上图第一栏是第一个变量（id），通

4、常用于定义外语测试研究中的参与对象，如考生和外语学习者。第二栏是Group变量，用于对实验调查对象分类。第三栏以下的变量为考试题目的变量名称，如n1（第1题），n2（第2题）等等。1.3 输入数据接下来的任务是在数据视窗中依次输入数据（图2.4）。图2.4中呈现的数据表示有30名考生，分成了五个小组，作答了8道多项选择题。为了便于统计客观题的数据，通常用数字1表示正确作答，数字0表示错误作答。图2.4 SPSS的数据输入1.4 保存数据选择菜单File=Save，若该数据从来没有被保存过，会弹出Save as对话框（图2.5）。图2.5 SPSS数据的保存单击保存类型列表框，可以看到SPSS所

5、支持的各种数据类型，有文本文件格式*.dat、EXCEL等等，这里我们仍然将其存为SPSS自己的数据格式（*.sav文件）。在文件名框内键入item analysis并回车，可以看到数据管理窗口左上角由Untitled变为了图4的变量名item analysis。2 SPSS语言测试研究中的应用案例2.1 英语期末考试成绩的描述统计分析内容：制作成绩频数(分段：060；6070；7080； 8090；90100)分布表并作频数分布分析，计算平均值（mean），众数（mode），中数（median），标准差（Std. deviation），方差（variance），倾斜度（skewness），峰

6、值（kurtosis），全距（range），总和（sum）频数分布表是描述性统计最常用的方法之一，Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表，还可以按要求给出某百分位点的数值，以及常用的条、圆、图等统计图。选择Analyze=Descriptive Statistics=Descriptive statistics=Frequencies菜单，系统弹出描述对话框（图2.6）。该对话框可分为左右两大部分，左侧为所有可用的侯选变量列表，右侧为选入变量列表。我们只需要描述score，用鼠标选中score，单击中间的按钮，变量score的标签就会移入到右侧，注意

7、这时OK按钮变黑，表明已经可以进行分析了。图2.6 Frequencies对话框的界面需要分析的数据除了成绩的频数还有其他数据，所以下一步就点击Statistics，选择表示数据集中趋势（Central Tendency）的统计量Mean、Median、Mode、Sum，表示数据离散度（Dispersion）的Std.deviation、Variance、Range和表示数据分布（Distribution）的Skewness、Kurtosis。点击Continue，回到刚才的视窗，点击Charts，选中Histograms了解数据的分布形状，依次选择Continue=OK按钮，系统会弹出一个新

8、的界面，生成所需的统计（图2.7）。图2.7 英语期末考试成绩的描述统计图2.7窗口左上方的名称为SPSS Viewer，即（结果）浏览窗口，整个的结构和资源管理器类似，左侧为导航栏，右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差等这几个常用的统计量，以及我们所需的统计量。从中可以看到，考生人数为80人，没有缺失的数据，所需描述统计的结果如表2.1。人数平均分中数众数标准差方差倾斜度峰值全距总和8085.4886.50895.82733.949-.993.833276838表2.1 英语期末考试成绩的描述统计从表2.1可以看到，本次考试的平均分为85.48分，考试成绩

9、最中间的分数（中数）是86.5，人数最多的分数（众数）是89，考生分数离平均分的标准距离（标准差）是5.827，分数构成的抛物线形态（倾斜度）为负偏态，斜度-.993，表示考生的英语成绩超过平均分85.48的人数比低于平均分的人数要多（图2.8）。图2.8 英语期末考试成绩的柱状分布图表2.2是英语期末考试成绩的频数分布。Frequency是每个分数出现的频数，Percent是该分数所占的百分比，Cumulative Percent是该分数的累积百分比，指该考生分数在整个群体中的位置。例如，某考生的分数为80，该分数的累积百分比为17.5%，那么该生的英语期末成绩只比17.5%的考生好。根据各

10、分数段包含的人数分及其所占的百分比，就可得出每个分数段的人数和比例。FrequencyPercentCumulative PercentValid6811.31.3 7011.32.5 7222.55.0 7311.36.3 7411.37.5 7622.510.0 7722.512.5 8045.017.5 8111.318.8 8222.521.3 8356.327.5 8467.535.0 85810.045.0 8645.050.0 8756.356.3 8845.061.3 891215.076.3 9078.885.0 9156.391.3 9222.593.8 9322.596.

11、3 9533.8100.0 Total80100.0 表2.2 英语期末考试成绩的频数分布图2.9 英语期末考试成绩的频数分布图当然，考生成绩的频数分布图制作还可以采用另外一种方法。选择菜单Transform=Record=Into Different Variables，出现Recode对话框（图2.10）。图2.10 变量Recode对话框将score选入Input Variable-Output Variable框，此时Output Variable框变黑，在其中键入新变量名group并单击Change，可见原来的score-?变成了score-group。单击“Old and New

12、Values”，系统弹出变量值定义对话框（图2.11）。图2.11 新旧变量的转换按照题目的要求，选择Range: Lowest through，在右侧框中键入60，然后在右上方的Value右侧框中键入对应的新变量值1，此时下方Add键变黑，单击它，Old-New框中就会加入Lowest thru 60-1，按照类似的方法依次加入另外几条转换规则，最终Old-New框中共有Lowest thru 60-1、1 60 thru 70-2、70 thru 80-3、80 thru 90-4、90 thru 100-5五条，现在单击Continue，再单击OK，系统就会按要求生成新变量group。按

13、照变量值标签对话框操作方法将1-5分别定义5个为分数段。选择Analyze=Descriptive Statistics=Descriptive statistics=Frequencies菜单，系统弹出描述频数的对话框如，将group变量移入到右侧，选点击Chart按钮，选择Bar charts（柱状图），Chart Values选Percentages（百分比），点击Continue按钮返回，点击OK按钮，系统生成所需的频数分布表（表2.3）和图（图2.12）。这里的分数段统计包括了每段最高的分数，如60-70分数段包括分数为70的考生。FrequencyPercentValid60-70

14、22.5 70-801215.0 80-905467.5 90-1001215.0 Total80100.0表2.3 英语期末考试成绩的频数分布表图2.12 英语期末考试成绩的频数分布图2.2 英语试卷的项目分析内容：有30名考生，作答了8道多项选择题的英语试题，请计算每道题目的难度、区分度以及这套试题的信度我们现在利用图2.4所提供的数据来分析。选择Analyze=Scale=Reliability Analysis菜单，系统弹出描述对话（图2.13）。图2.13 信度分析对话框我们需要分析8道题目的难度、区分度以及这套试题的信度，用鼠标选中变量n1-n8，单击中间的按钮，这些变量的标签就会

15、移入到右侧。点击Statistics（统计），依次选中Item，Scale if item deleted，选择Continue=OK按钮，系统会弹出一个新的界面，生成所需的统计（图2.14）。图2.14 题目的难度、区分度和试题的信度系数从图2.14可以看到n1的Mean为.9333，因为我们的计分方法是正确为1，错误为0，这个平均分就是第一道题目的难度，也叫易度指数（item facility），表示题目的容易程度。一般认为，题目的难度介于0.3-0.7之间，难度在0.3以下的题目较难，这样的题目须修改；难度在0.7以上的题目较易，难度为0.5的题目最好。不过，在课堂测验中，我们的测验目的

16、是了解英语教学活动达到教学目标的程度，了解学生掌握学习目标的程度，若是学生掌握了题目所代表的全部知识和技能，则每道题目的难度为1。这时，难度在0.7以上的题目表示学生对题目所代表的知识或技能掌握很好；难度在0.5以下的题目表示学生对题目所代表的知识或技能掌握很差，学生应该补习这种题目包含的知识或技能（Hudson & Lynch 1984: 177）。Std Dev表示题目的标准差，8道题目中标准差最小的是第1题、第2题和第8题（Std Dev = .2537），表示考生在这三道题目中的得分差异不大。Cases指考生人数。Corrected Item-Total Correlation（题目-

17、总分的校正相关系数）就是题目的区分度，表示题目能够区分优生和差生的程度。8道题目中，区分度最好的题目是第3题，区分度为0.7193；区分度最差的题目是第2题，区分度为0.2614。Reliability Coefficients指试题的信度系数。系数越高，统计的误差越小。一般认为，客观试题的信度系数在0.8以上，表示试题的误差较小，信度良好；0.9以上的信度系数为优秀；0.7-0.8的信度系数为中等；0.6-0.7的信度系数可以接受；试题信度在0.6以下则不可接受，试题须修改。客观试题的信度与题目的难度和区分度有关，而区分度则和考生之间的差异性有关，考生的英语水平差异越大，题目的区分度越高，试

18、题的信度就越高。题目的数量越多，信度自然就越高。本套试题的考生人数为30人，题目数为8，Alpha系数为0.7355。区分度取舍的主要依据Alpha if Item Deleted（题目去掉后的信度系数），若一道题目去掉后，整套试题的信度在原来的基础上下降，说明此题对整套试题来讲很重要，区分度理想，反之说明该题目的区分度不理想，须修改或剔除。从图2.14来看，每一道题目去掉后，试题的信度都会下降，这说明这些题目的区分度都理想。2.3 作文评阅的相关性和一致性分析内容：现有5名英语教师分别独立采用整体印象法评阅20名学生的作文，作文满分为10，数据为EXCEL文件（图2.15），分析不同评卷员之

19、间的相关性和一致性。图2.15 EXCEL文件：相关分析数据在外语测试中经常要遇到分析两个或多个变量间关系的情况，有时是希望了解某个变量对另一个变量的影响强度，有时则是要了解变量间联系的密切程度，前者用回归分析来实现，后者则需要用相关分析实现。要使用SPSS来做相关分析，我们需要将EXCEL文件导入到SPSS。选择菜单File=Open=Data或直接单击快捷工具栏上的按钮，系统就会弹出Open File对话框，单击“文件类型”列表框，在里面能看到直接打开的数据文件格式。选中所需的EXCEL文件，如下图所示（图2.16），点击OK按钮，即可将其导入到SPSS中来，将文件保存。图2.16 非SP

20、SS格式文件导入对话框相关分析和其他推断统计分析一样，有参数检验和非参数检验两种。参数检验至少需要满足两个条件：样本量30以上，正态分布的数据。若样本小于30或者数据不是正态分布，最好采用非参数检验。数据正态分布检验方法如下：选择Analyze=Nonparametric Tests=1-sample K-S test，系统弹出描述对话框（图2.17）。图2.17 正态分布检验对话框Test Distribution选择，点击OK按钮，系统生成所需的统计结果（表2.4）。 RATER1RATER2RATER3RATER4RATER5N2020202020Normal Parameters(a,

21、b)Mean9.09008.73509.19008.77508.9750Std. Deviation.42785.48507.32102.50770.40377Most Extreme DifferencesAbsolute.099.271.177.171.190Positive.091.176.138.171.118Negative-.099-.271-.177-.149-.190Kolmogorov-Smirnov Z.4421.213.791.766.848Asymp. Sig. (2-tailed).990.105.558.600.469a Test distribution is N

22、ormal.b Calculated from data.表2.4 数据正态分布检验结果表2.4显示五位评分员的评分数据服从正态分布，可以采用参数检验。选择Analyze=Correlate=Bivariate，系统弹出描述对话框（图2.18）。图2.18 Bivariate Correlations对话框此过程用于进行两个/多个变量间的参数/非参数相关分析，如果是多个变量，则给出两两相关的分析结果。Correlation Coefficients复选框组用于选择需要计算的相关分析指标。 Pearson复选框选择进行积差相关分析，即最常用的参数相关分析；Kendalls tau-b复选框计算K

23、endalls等级相关系数；Spearman复选框计算Spearman相关系数，即最常用的非参数相关分析（秩相关）。Test of Significance单选框组用于确定是进行相关系数的单侧（One-tailed）或双侧（Two-tailed）检验，一般选双侧检验。Flag significant correlations用于确定是否在结果中用星号标记有统计学意义的相关系数，一般选中。此时p.05的系数值旁会标记一个星号，pNonparametric Tests=K Related Samples进入多列相关样本检验的对话框（图2.20）。图2.20 Tests for Several Re

24、lated Samples对话框检验类型有三种：Friedman检验，Kendalls W检验和Cochrans Q检验。Friedman检验等同于参数检验中单个样本的重复设计或者方差分析，该检验测试K个相关变量是否来自同一总体的零假设。Kendalls W检验可解释成协同系数，是Friedman检验的标准化形式，它测量评分者之间的一致性，该检验的变量是评分者评判的题目或者考生。Cochrans Q检验测试多个相关两分变量（如作答正确记为1，错误记为0的变量）是否有相同的平均分，该检检验的变量可以是同一个体或者相匹配的个体。将所测变量移入到右侧，选择Kendall协同系数检验法，按OK按钮，系

25、统生成所需统计结果（表2.6）。从表2.6看到，此次的评分人员有5个，Kendall协同系数为.523，卡方值为49.668，自由度为19，p.01。这表明评分员之间的一致性程度具有统计意义，但是一致性程度不高。为了提高评分员之间的一致性，我们需要做许多工作，如加强阅卷教师的培训，使其掌握评分标准；加强试卷的保密性；制定合乎规范、可操作性强的评分细则；增加试卷复评等等。N5Kendalls W(a).523Chi-Square49.668df19Asymp. Sig.000Kendalls Coefficient of Concordance表2.6 评分者之间的一致性结果：Kendall协同

26、系数2.4高考分数与作文分数的线性回归分析内容：现有20名考生的高考作文成绩和高考总分，试分析高考作文和高考总分的线性回归关系。图2.21是20名考生的高考成绩和作文成绩数据图2.21 20名考生的高考成绩和作文成绩回归分析和相关分析一样也是对变量依存关系的分析。一般来说，相关程度越高，回归分析的结果就越可靠，在做回归分析之前，先做相关分析以此作为判别回归分析结果的一个重要依据。相比而言，相关分析探讨变量之间的共变关系，即非因果关系，而回归分析则区分变量之间的因果关系。相关分析检验变量之间的关系的密切程度，而回归分析对具有相关关系的变量建立回归模型来描述变量之间的具体变动关系，通过控制或者给定自变量的数值来估计或者预测因变量的数值。在进行回归分析之前，我们最好制作散点图来表现高考作文和高考总分之间有无相关关系。散点图用点的密集程度和趋势表示两个变量之间的相关关系与变化趋势（张文彤、闫洁 2004：201）。图2.22 散点图预定义对话框在SPSS中有四种散点图（图2.22），即用于两个变量之间关系的简单散点图、多个变量之间两辆相关

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？