1、应用SPSS软件进行列联表分析资料应 用 SPSS 软 件 进 行列联表分析应用SPSS软件进行列联表分析在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。例如在一项全球教育水平的研究中,调查了 400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。定义四个变量:gender(性别)、educat (学历)、minority (种族)、count (人数),其中前三个为分类变量,并且 gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等
2、,3表示学历高;minority变量值为0、1, 标签值定义为:0表示非少数种族,1表示为少数种族。下面做gen der.educat minority的三维列联表分析及其独立性检验。数据文件如图 1所示。ye Edit 辿ew Derta Transforfti Analyse Graphs Utlltie Add-cns Window Help昌国穷8h再鄭 H 5曲圜flj靄20:genereducaminorityrsvar-1 1 105021 2010031304401012850 204760 30171 113531212491 3151(0 1130110 2110120 3
3、10.口I5B :17澜Datta View Variable View图1第一步:用Count”变量作为权重进行加权分析处理。从菜单上依次选 Data-weight Cases命令,打开对话框,如图2所示。点选 Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。第二步:从菜单上依次点选 An alyze-Deseriptive Statistics-Crosstabs命 令,打开 列联分析对话框(Crosstabs)如图3所示虫們时卄 辽1附* Uitrs AR主ijnriiQujiry Cortidrn f?dc m卓*
4、l耳 SimpIc-sSLtMhQ:3 M*o:i-d Veto nalao.第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移 入行变量Row(s)框内,并将受教育年限编码后得到的学历变量 educat移入列变量Column(s)框内(若此时单击OK按钮,则会输出一个2*3的二维列联表)。 这里要输出一个三维列联表,将变量种族 minority作为分层变量移入Layer框中,并且可以勾选左下方的 Display clustered bar charts项,以输出聚集的条形 图,如图8图9所示。图4第四步:选择统计量,单击 Cosstabs对话框下侧的Stat
5、istics按钮,打开其对话框,如图5所示。图5在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。这里由于不是定距及定比尺度测量的数据,因此可以不选择简单相关系数Correlatio ns项。接下来根据数据的类型而选择相应的列联相关的测量值:在定类数据 Nominal 栏下,勾选列联系数 Contingency coefficient和 Phi and CramersV选项(这里Phi系数可以不选,因它只用于 2*2的列联表,但SPSS把它与 Cramer的V统计量放在一个选项上,也就只好一并选上了),以及 Lamabda和不确定系数Uncertainty
6、coefficient。也可选择定序数据Ordinal栏下得GammaSomers的 d、Kendall 的 b和 c。至于 Nominal by Interval 栏下的 Eta选项就不必选了,因为这里不是定距及定比尺度测量的数据。单击 Con ti nue按钮回到Crosstabs主 对话框。第五步:单击Crosstabs对话框下侧的Cells按钮,打开其对话框,如图6所示。在Cell Display对话框内,勾选 Counts(计数)栏下的Observed观测频数)与Expected(期望频数)两个选项;并勾选Percentage百分栏下得Row(行百分比)、Column(列百分比)和T
7、otal(总百分比)三个选项。由此,可以输出列联表(如表1)。单击Continue按钮回到Crosstabs主对话框。图6第六步:单击Crosstabs对话框下侧的Format按钮,打开Table Format对话框,如图7所示。它只是一个输出格式的定义,行序(Row Order)按照Ascending(升序)还是Descending降序)排列,系统隐含设置是按照 Ascending(升序)排列(事实上,一般不必打开此对话框,只用系统隐含设置即可)。单击Continue按钮回到Crosstabs主对话框。图7第七步:在Crosstabs对话框中,单击0K按钮执行输出结果如表14所示。表1性别、
8、学历、种族交叉表性别 * 学历 种Crosstabulation字历一Total学厉低学庁中学历高菲少数种按tiSUfemaleCou nt128471176Expected Count84.7&9 921.4176 0% within 性別72.7%267%.6%100.0% wittiin 学历71 3%32.0%2.2%47.6% of Total34.C9b127%.3%47 6%maleCou nt50100轲仙Expected Count93.377123.6194.0% within 性剧25.E%51.5%227%100.0% within 学历29.1%se.o%97.8%5
9、2.4% of Total13.527.0%11 0%52.4%TotalCount17614745370Expected Count176.0147 045.0370.0% wrthtn48.1397%12.2%WO.O%wittiin 学历100.0%100.0%1 00 0%100.0% of Total43.1%39 7%1 2.2%100.0%少数种龊關ft nnaleCou nt3010a40Expected Count25.G1311.940.0% Wfttlin 性别75 0%25.0%.0%100.0% within 学历29.4%.0%3S.5%of Total2S.S9
10、6%.0%36J5maleCount35囚564Expected Count40.020 93,1&4.0% wtthin 性别54.7%37 5%7.B%100.0% withir 学历ss.eb70.C%1 00.0%S1.6% of Total33J%2.1%4.6%51.5TotalCountbu3451C4Expected Count65.034 05.01U4.0% within62.5%327%4.8%100.0% within 学坯IQO.Cfc100 0%1 00 0%100.0% of Total62 5%327%4.0%100.0%表2卡方检验表Chi-Squaro Te
11、stsvluedtAsymp. Sig. (2-sided)菲少薮种族 Pearson Chi-Square92.724a2000keii hood Ratio10B.G302.000Lin&ar-toy0.05因此在0.05的显著水平下,没有理由拒绝两个变量独立的原假设,表示性别与学历这两个变量之间相互独 立,没有显著的相关关联。在表3的方向性测度(DirectionalMeasures中,有两类系数:不确定系数(UncertaintyCoefficient)和Somers。每种系数均有三种形式:对称的(Symmetric)、以性别为因变量的及以学历为因变量的。事实上,我们关心的 是两种形式
12、一一对称的(Symmetric)和以学历为因变量的。在这里非少数种族 的对称不确定系数为0.173,而少数种族的对称不确定系数为 0.050;并且以学 历为因变量的非少数种族的对称不确定系数为 0.148,而少数种族的列联相关程度高于少数种族的。在对称性测度(Symmetric Measures中,Crammer的V值列联表系数、Kendall的系数值以及值(Gamma),非少数种族的上述各项值均高于少数种 族的,显示出预测力以非少数种族更强。事实上,在少数种族的 Crammer的V值列联表系数的近似的p值为0.052,在0.05的显著水平下不显著。在列联表分析中,列联表的分布除了观察值的分布外,还要构造条件百分比表。这个百分比就是由于对比的基数不同,从而分为行百分比、列百分比和 总百分比。所以,列联表由于维数的增加而使得它所包含的信息要比“单个变量”的频数(包括频率)分布表包含的信息多得多,由此我们可以分析出来的内容也更加丰富有价值。参考文献:数据分析与SPSS应用高祥宝 董寒青编著,清华大学出版社
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1