1、交叉列联表分析第 3 章 基本统计分析某高中,期末考试刚刚考过,两班的班主任飞天和神马在聊天。飞天说:“你们班期末 考试考得怎么样啊?”神马说:“哎,刚刚改出来,还没统计呢,你们班怎么样?”飞天说: 别提了,各科中只有数学考得好一点, 满分 150 分的卷子, 平均分是 95 分,而且高分不多, 大多集中在 97 分左右,其他各科两极分化很严重,好的好,差的差,恼人呐!”这两位班主任的对话中,很多内容实际上就涉及本章要介绍的内容描述性统计。 统计分析的目的是研究总体的特征,像神马他们班的考试成绩刚刚改出来,还没有做统计 分析,所以当别人问他们班考试情况时,他就无言以对。而飞天在谈话的过程中,就
2、说到 了常用的一些描述性的统计量。描述性统计分析是统计分析的基础,是对一组数据分布的 集中或离散情况以及分布状况的描述。3.1 常用描述统计量简介在统计分析中常用到的描述统计量主要包括以下类别。 集中量数:包括均值、众数、中数、几何均数、调和均数、加权平均数及总和。 差异量数:包括最小值、最大值、全距、方差、标准差等。 分布指标:包括偏度系数、峰度系数,它们是用于反映数据偏离正态分布程度的 指标。百分位值及标准分数:用于描述某一数值在一组数据中的相对位置。常用的指标 包括百分等级与百分位数, Z 分数等。下面将对 SPSS 中常用到的一些描述性统计指标进行简单介绍。 均值:指一组数据的算术平均
3、数,描述一组数据的平均水平。计算简单,反应灵 敏,适用于需进一步的计算其他统计量的情况。其为集中量数中波动最小的、最 可靠的指标。众数:是一组数据中出现次数最多的那个数值。可快速粗略的估计一组数据,且 不受极端值的影响。中数:又称中位数,中值。指当一组数据按顺序排列后,位于中间位置的数。也 可用于快速估计一组数据的代表值,并不受极端值的影响。全距:用一组数据的最大值减去最小值即为本组数据的全距。它是描述一组数据 离散情况最简单的统计量。方差:是每个数据与本组数据均值之差平方之后的平均数,是一组数据中各种变 异的总和。标准差:即为方差的平方根。方差和标准差是描述一组数据离散程度最常用最好 的指标
4、。值越大,表明数据的离散程度越大;值越小,表明数据的离散程度越小。偏度系数:用来评估一组数据的分布呈左右对称的程度。当偏度值为 0时,分布即为对称的;当偏度值大于 0时,分布呈正偏态;当偏度值小于 0时,分布呈负 偏态。峰度系数:是用来评估一组数据分布形状的高狭与低阔程度的指标。当峰度值接 近于0时,此分布形状的高狭程度与正态分布基本一致;当峰度值大于 0时,分布的峰度较高狭;当峰度值小于 0时,分布的峰度较低阔。百分位数:指在一组数据中在某一百分等级的观察值的分数。与百分等级是可以 相互转换的。四分位数是常用的一种百分位数。Z分数:是最为常用的一种标准分数。它表示原始分数在一组数据中所处的相
5、对位 置。它无实际单位,是以平均数为参照点,以标准差为单位的分数。转换为 Z分数之后,原本性质不同的分数即可进行比较或者计算。另外,描述统计中也常结合一些统计图表来表现数据的整体情况。其中包括条图、饼 图、直方图、箱式图等。卜Im镒禺卜回严爭*Ti卜*耳科目_展昭血J*丁吐费:.田 htatrg卜gr-FEi*EjQ-ti 田.“分析”菜单的下拉菜图3-1 “描述统计”菜单在SPSS中,专门进行数据的描述统计分析的几个模块集中于 单“描述统计”中,如图 3-1所示。这些模块分别如下。频率过程:除了一般描述统计的各种指标外,还可以 生成频数表及各种常用的描述统计图形。描述过程:此过程专门用于进行
6、各种描述统计。此过程的操作及功能很简单,使用方便。探索过程:该过程通过各种专门的统计指标和统计图 表,来对数据进行整理和检查等探索性分析。交叉表过程:主要进行分类变量或等级变量的统计描 述,以及各种各样的统计检验,包括我们常用到的卡 方检验。比率过程:是用于对两个连续性变量的比值进行描述的指标。在实际中也常有非 常重要的作用。3.2频数统计频数是指同一观测值在一组数据中出现的次数,在这一节中将介绍 SPSS软件中专门为生成频数分布表而设计的分析模块一一“频率”过程。3.2.1频数统计的主要功能“频率”过程可以产生频数分布表,以对数据按组进行归类整理。还可以生成各种描述性 统计指标,以及条形图、
7、饼图、直方图等常用的统计图。通过选择 SPSS中的“分析”丨“描述统计”丨“频率”命令,可以对各变量的数据分布特征有一个概括的整体认识。322 频数统计的操作过程在SPSS中频数统计的操作过程如下。(1 )建立并打开数据文件。(2 )打开“频率”主对话框:选择“分析”丨“描述统计”丨“频率”命令,打开如 图3-2所示的“频率”主对话框。(3)选择变量:左侧的列表框为源变量列表框,会呈现出所有变量名,可以根据需要 将欲分析的变量移入右侧的“变量”列表框中。(4)勾选复选框:左下角有一个“显示频率表格”复选框,如果勾选该复选框,在输 出的结果中将列出频数分布的表格。(5) 选择统计量:单击“统计量
8、”按钮,弹出如图 3-3所示的“频率:统计量”对话 框。此对话框提供了 4类描述统计量。4个选项组分别是“百分位值”、“离散”、“集 中趋势”和“分布”,还包括一个“值为组的中点”复选框。“百分位值”选项组,其中包括 3个复选框。“四分位数”复选框,选择后结果将输出变量的四分位数;“割点”复选框,可以选取任意割点,将数据分为几个等 组(默认值为10); “百分位数”复选框,选择此复选框后,可选取任意百分位 数通过“添加”按钮移入下方列表框,并可以通过“更改”按钮和“删除”按钮 对其进行相应操作。“离散”选项组,即差异量数选项组。包括“标准差”、“方差”、“范围”(即 为全距)、“最小值”、“最
9、大值”和“均值的标准误” 6个复选框。“集中趋势”选项组,包括“均值”、“中位数”、“众数”和“合计” 4个复选框。“值为组的中点”复选框,表示当一组数据分组后,且其值取各组的中点时,可选 择此选项,以正确的对原始的未分组数据的中数及百分位数进行估计。“分布”选项组,是描述数据分布形态的选项组。包括“偏度”复选框和“峰度” 复选框。单击“继续”按钮,完成设置,返回“频率”主对话框。(6)选择图表:单击“图表”按钮,弹出“频率:图表”对话框,如图 3-4所示。该对话框的功能是选择所要输出的统计图表。该对话框包括两个选项组。“图表类型”选项组:该选项组有 4个单选按钮。选择“无”单选按钮时,结果中
10、不会输出图形。此外,可以选中“条形图”、“饼图”、“直方图”单选按钮, 在结果中将输出相应类型的图表。其中选中“直方图”单选按钮后,会激活其下 方的“在直方图上显示正态曲线”复选框,勾选该复选框,则在输出的直方图中 会显示正态分布的曲线,用于帮助判断数据是否近似成正态分布,但这仅是一个 粗略而直观的判断。“图表值”选项组:该选项组有“频率”和“百分比”两个单选按钮选项。 选择“频 率”单选按钮时,所输出的图形以频数为单位生成;在选中“百分比”单选按钮 时,输出图形以百分比为单位生成。另外,“图表值”选项组仅在“图表类型” 选项组中选中“条形图”和“饼图”时才可以使用。该对话框设置完毕后,单击“
11、继续”按钮,返回“频率”主对话框。(7)选择输出格式:在主对话框中,单击“格式”按钮,弹出“频率:格式”对话框, 如图3-5所示。该对话框用于调整结果输出的格式,有两个选项组。“排序方式”选项组:用于调整输出的频数分布表的排列顺序。其中包括以下 4个单选按钮。按值的升序排序:对频数分布依据数值的大小进行升序排列。 按值的降序排序:对频数分布依据数值的大小进行降序排列。按计数的升序排序:对频数分布依据频数的大小进行升序排列。按计数的降序排序:对频数分布依据频数的大小进行降序排列。“多个变量”选项组:用于选择有多个变量时结果的输出方式。选中“比较变量” 单选按钮,则将各个变量的同一种报表放在一起输
12、出;选中“按变量组织输出” 单选按钮,则是按各变量而分别输出结果。“排除具有多个类别的表复选框:勾选该复选框,表明对于变量有太多类别时则 不输出频数分布表。在该复选框下面还带有一个“最大类别数文本框,用于界 定进行此功能的最大类别数,系统默认值为 10。选择完毕后,单击“继续”按钮,返回“频率”主对话框。(8)Bootstrap按钮:此功能提供了近年来比较流行的一种非参数统计方法。 Bootstrap法,也称为自助法,是一种通过估计统计量方差进而进行区间估计的统计方法。它在对小 样本数据进行统计分析时效果很好,提供了另一种寻找样本分布的办法。它的基本思想是 采用重抽样技术在原始样本中重复 N次
13、抽取给定数量的样本, 根据抽取的N个样本计算出N个给定的统计量,再计算这 N个统计量的样本方差。3.2.3 实例分析:大学新生的心理健康状况(1)【例3.1】某大学为了了解学生的心理健康状况,要对初入学的大一新生进行心理测 评,并建立心理档案。现要对某班学生的生活事件量表进行分析。请用 SPSS做出此测试结果的频数分布情况。解:本例中,主要通过“频率”过程对本班生活事件量表的总分进行描述,并得出全 班学生此量表总分各分数的频数情况及其百分比和累积百分比,可以从中了解到学生整体 得分的高低水平,也可以由此注意到需要给予较多关注的个体或群体。下面将介绍具体的 操作过程。1 .操作过程(1)建立并打
14、开数据文件:将该量表的数据结果输入 SPSS中,建立并打开数据文件,如图3-6所示。5关爭悄卓it直a#1113 0015 0021 0070011 00说oa74.09*21lOClO10.4012.004.0011 OQ4100311D HD11.0D14.MWOO9 09sa.do41IQODi10 QQ14 OQ6.UBD0IQD4 on5210 w10 H14.00ECOeoaB095400*&2W.OdS.COi no7 0941.00*7213.0D14.0D17.M13.001200BOD75.00a211flD13 on6 DO7 DO53 W915伽7 0016 004 0
15、0価43 00W212血11.00e.oo.0io ao5的46 CO1119flD4.M4.006.004 00& DO血1213 0DfiOD2 003 DO2 DO4 DD21 OO*131竹即17 0021 0012 00u QOSB啊U2hlco.01G00殳啊151TDD6血3.M1100弓DO3曲113 AD1D OD1 002 0CI5 DO3DD33 OO*172W.W2CWQ4闻阿23 m阳210 0014.0013.KI12.002时6600T91弓皿百皿3.002.00?D02M茁帕20212 011D0D11 0011 DOSOO2DDD 00图3-6 某班学生生活事
16、件量表数据(2 )变量的转换处理:选择“转换”丨“计算变量”命令,计算出量表的总分。在数 据视图中将出现一列新的关于总分的变量。(3)打开对话框:选择“分析”丨“描述统计”丨“频率”命令,打开“频率”主对 话框,如图3-7所示。(4) 选择变量:在左侧列表框中选中变量“总分”,单击向右箭头按钮 ,使之移入 右侧“变量”列表框中。(5) 勾选复选框:勾选“显示频率表 格”复选框,输出频数分布表。(6) 选择统计量:单击“统计量”按 钮,打开“频率:统计量”对话框,如图 3-8所示。在“百分位值”选项组中勾选 “四分位数”复选框;在“离散”选项组 中勾选“标准差”、“最小值”、“最大 值”、“均值
17、的标准误”复选框;在“集 中趋势”选项组中勾选“均值”、“中位 数”复选框;在“分布”选项组中勾选“偏 度”和“峰度”复选框。单击“继续”按钮,返回主对话框。(7) 选择图表:单击“图表”按钮,打开“频率:图表”对话框,如图 3-9所示。在 “图表类型”列表框中选中“直方图”单选按钮,并勾选“在直方图上显示正态曲线”复选框,单击“继续”按钮,返回主对话框。图3-7 “频率”主对话框L.科电*):科JD曲秣回(i站曲申点帖立中竝目一(8) 选择输出格式:单击“格式”按钮,出现如图 3-10所示的“频率:格式”对话框。 选择系统默认设置。单击“继续”按钮,返回主对话框。(9) 单击“确定”按钮,运
18、行 SPSS程序,输出 结果。2 结果分析排顧有釘类别的表 最犬抽.埶空10(1)统计量指标原始列表:如表 3-1所示为选择的描述性统计指标,从下面的数据可以看出,这个数据的 平均值是35.171,标准差是20.578,说明这个数据离散 程度较高。偏态程度为 0.742,峰度为-0.096,但都未达表3-1 各统计量指标原始列表N有 效35缺 失0均值35.1714均值的标准误3.47826中值30.0000标准差20.57767偏度.742偏度的标准误.398峰度-.096峰度的标准误.778极小值5.00极大值88.00百分位数2520.00005030.00007553.0000(2)频
19、数分布表:如表 3-2所示,表明了各种观测值出现的次数。用以上的一些描述 性统计量可以很快速地了解整体的状况,但同时也会丧失很多信息,通过频数表可以获得 更多关于原始数据的信息。从频数表中可以看出某分数的人数及某分数的人数占总人数的 百分比。表3-2 SPSS输出的频数分布表频 率百分比有效百分比累积百分比有效5.0012.92.92.910.0025.75.78.612.0012.92.911.414.0012.92.914.316.0012.92.917.117.0012.92.920.019.0012.92.922.920.0012.92.925.721.0025.75.731.422.
20、0012.92.934.323.0025.75.740.024.0012.92.942.926.0012.92.945.728.0012.92.948.630.0025.75.754.332.0012.92.957.133.0012.92.960.041.0012.92.962.9续表频 率百分比有效百分比累积百分比有效43.0012.92.965.746.0012.92.968.649.0012.92.971.450.0012.92.974.353.0012.92.977.154.0038.68.685.756.0012.92.988.658.0012.92.991.474.0012.92.
21、994.375.0012.92.997.188.0012.92.9100.0合计35100.0100.0(3)直方图:如图3-11所示为本组数据的直方图,从图中可以很清晰的看出,大多数 人的分数都集中在1060之间,数据近似呈正态分布。图3-11生活事件量表总分直方图3.3描述统计描述统计主要是指对实验或调查研究得来的数据,进行归纳、整理及整体的概括和描述。本节中将向大家介绍SPSS中专门用于对各种描述统计量进行计算的命令一一 “分析”丨“描述统计”丨“描述”命令。3.3.1描述统计的主要功能“描述”过程主要用于对数据的集中趋势(如平均数)、离散趋势(如标准差、方差、 全距、最大值、最小值、平
22、均数标准误)及分布情况(如峰度及偏度)等进行描述或计算。 此过程功能很多与“频率”过程的功能相似,读者可在数据分析时根据需要进行选择。3.3.2描述统计的操作过程在SPSS中描述性统计的操作过程如下:(1)建立并打开数据文件。(2)选择“分析”丨“描述统计”丨“描述”命令,打开“描述性”对话框,如图 3-12所示。(3 )选择变量:首先,选择所要进行描述统计的变量。左侧的列表框中所有变量,可 以将欲分析的变量移入右侧的“变量”列表框中。(4)勾选复选框:在左下角有一个“将标准化得分另存为变量”复选框。默认情况不选择此选项。如果勾选该复选框,则 SPSS会对“变量”列表框中选择的变量计算其 Z分
23、数,并将此结果自动建立成一个新变量,在数据编辑窗口中显示出。若需要对某组数据其 标准Z分数进行统计分析,则可以选择“描述”过程中的这一操作。(5)选择描述统计量:右上角“选项”按钮的主要功能就是选定想要输出的描述统计量。单击此按钮,弹出对话框如图 3-13所示。该对话框分为4个选项组。最上方的两个选项为集中量数的“均值”复选框,以及“合计”复选框,选中此复选框即可计算变量的总和。研究者可根据需要进行选择。“离散”选项组:包括“标准差”、 “方差”、“范围”、“最小值”、“最大值”、“均值的标准误”复选框。“分布”选项组:包括“峰度”和“偏度”复选框。“显示顺序”选项组:是 SPSS提供的一项关
24、于输出顺序的选项,默认为“变量列 表”单选按钮,即按因变量的出现顺序呈现,也可选用字母顺序、按均值的升序 排序、按均值的降序排序这 3种方式对结果进行呈现。(6)在完成这些选择之后,单击“继续”按钮,则可以回到“描述性”主对话框。3.3.3实例分析:大学新生的心理健康状况(2)【例3.2】根据案例3.1中大学新生的心理健康状况测评结果, 请判断本班学生在该量表上的得分情况如何?解:本题主要通过“描述”过程,来对本班学生的生活事件量表得分情况进行集中趋势、离散趋势及分布情况进行描述,了解分数的整体情况。1 .操作过程(1 )打开数据文件。(2 )变量的转换处理:选择“转换”丨“计算变量”命令,计
25、算出量表的总分及量表的6个因子上的各自总分。(3)打开对话框:选择“分析”丨“描述统计”丨“描述”命令,打开“描述性”主 对话。(4) 选择变量:选中左侧变量框中的变量“总分”,单击对话框中间的 按钮,即可将此所选变量选入右侧的“变量”列表框中,如图 3-14所示。(5)勾选复选框:勾选“将标准化得分另存为变量”复选框,即会在数据编辑窗口输出一列以“ Z总分”为变量名的新变量,其为“总分”这一变量的 Z分数值。(6)选择描述性统计量:单击“选项”按钮,出现“选项”对话框,勾选“均值”、“合计”、“标准差”、“最小值”、“最大值”、“均值的标准误”、“峰度”和“偏度” 复选框,如图3-15所示。
26、然后单击“继续”按钮,返回“描述性”主对话框。(7)单击“确定”按钮,运行 SPSS程序。图3-14 “描述性”主对话框V Mil呦 V自计V标建蔓E V曲小怡* y豳 7 Isaacs#图3-15 “描述:选项”对话框2 结果分析(1 )输出标准化得分新变量:可以看到, SPSS的数据编辑窗口中输出总分的 Z分数变量,如图3-16所示。Jg好字月庄力11ism1S.W21.007M11 OS12.W7W匚21WWlow12 QO1100J5 OQ111M14J0.M11-DW顶闘01 WB3*41DO14 DOA 09B DO如DOMHO21DW1D.W14 OQSHB.m5J00?15B&
27、29 0018 00SMinT.QO41.00卑超7714 QQ17 QQ13 QQ1209E闻715QD1M5SS211 w12.W12.0DTW6.DC63.QD寧1T.M16 aoeoci4越S.M4J 001021ZWU.KQ1DWM 00H5Z.J1119m4.D0iW5.003W-251311213 00E DOgdD3QQ2(04 M劄CD1311T.W?1.0Q12 M3.00羽QQ11码g铀帥自帥Q泊忖4加Mm1515M3M533M-3HB5111310.0010DSW3.00.QD-105E21T2100*E DO2 don4 A3 0023 on-9149怕21DW6.0014 0012 W2 00MOO1211915i5.003.00TW2M23.0Q &914420IQ Q0ii an11 oa2 pc50 0D理曲1图3-16对总分计算Z分数所得结果(2)描述统计指标:在结果输出窗口中会输出描述性统计量的表格, 如表3-3所示(由于表格较长,本书中分两
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1