百分比差异检验步骤Word文档格式.docx
《百分比差异检验步骤Word文档格式.docx》由会员分享,可在线阅读,更多相关《百分比差异检验步骤Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
GRPPCTGRP=gender/
WITHIN=RegCat//*default=NOWITHIN*/
/.
GETFILE和SAVEOUTFILE命令用于打开数据文件并另存为新的数据文件,Include命令
调用宏,GRPPC是宏名,宏中的选项含义如下:
GRP指定要计算百分比的类别变量。
WITHIN:
指定拆分变量(breakdownvariable),类别变量百分比的计算将在拆分变量的每个类别中分别进行。
INFILE:
指定需要分析的数据文件。
表1是根据框1计算得到的结果,结果中给出了四类地区(拆分变量)不同性别的百分
比和标准误,比如第一类地区男生百分比为54.164%,标准误为.9518,女生百分比为
45.836%,标准误为.9518。
表1百分比标准误计算结果
SEongrouppercentagesofgenderwithinregcatcategories
RegCat
Gender
stat
SE
男
54.164
.9518
1
女
45.836
53.894
.5829
2
46.106
55.736
.6433
3
44.264
56.922
.5983
4
43.078
2.百分比差异检验
2.1配合度检验
2.1.1两分类
配合度检验用于分析一组数据的实际分布与理论分布是否一致,适用于单个的分类变
量。
检验公式如下:
Z-p^-P0,其中?
为百分比估计值,pg为理论值,SEp为标准误。
SEp
例如,假如男女性别所占比例的理论值都为50%,检验实际比例是否与理论值相同。
(性
别为2分类)
(1)SPSS语句
GETFILE='
\fy\soci.sav'
SAVEOUTFILE='
\TEMP\soci.sav'
NREP=100/
INFILE='
\TEMP\soci.sav7.
EXEC.
(2)SPSS分析结果见下表
性别
var
53.335
0.16
0.4054
46.665
(3)计算过程
1)计算两两之间差异
比如男性与理论值50%的差异为53.335-50=3.335;
2)
Z分布,比如男生:
计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从
3)确定Z临界值
计算结果与临界值1.96进行比较,由于8.227>
1.96,因此,认为男生的人数比例与理论上的50%有显著差异(a=0.05)。
2.1.2多分类
(网
假设在总人群中网络成瘾的比例为4%,检验调查得到的结果与理论值是否有差异。
络成瘾为3分类)
(1)SPSS分析语句
IneludeFILE='
\fy\soci.sav'
RECODE
SINASUM
(8thruHighest=3)(5thru8=2)(Lowestthru5=1)INTOsinasumC.
EXECUTE.
SELECTIFNOTMISSING(sinasumC).
GRPPCTGRP=sinasumC/
\TEMP\soci.sav'
(2)SPSS十算结果
正常
87.474
0.21
0.4547
网络成瘾倾向
10.654
0.18
0.4265
网络成瘾
1.871
0.02
0.1251
1)计算两两之间差异
比如网络成瘾与理论值4%的差异为1.871-4=2129;
2)计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从Z分布,比如网络成瘾:
17.02;
Z=-2.219/0.1251=-17.02,即Z?
Po1.87142.129
SEp0.12510.1251
3)多重比较的校正
由于网络成瘾有K(3)个类别,共需要进行比较n=K-1即3-1=2次。
网络成瘾与理论值
4%的差异比较是多次比较中的一次比较,因而需要对显著性a水平做矫正。
即在总体a=0.05
的水平下,每一次比较的显著性水平调整为a/n。
4)计算Z临界值
查表求a=0.05/2的Z临界值,也可以在excel中输入二H站曲法哄:
.-士-寸},得到Z临界值。
对于本例:
可以如下图的excel中输入土―,得到Z临界值
=2.241403。
因为卜17.02|>
2.241403,所以网络成瘾比例与理论上的4%有显著差异(总体a
=0.05,每一次比较的显著性水平为0.05/2)。
引幵始捲入更茴祇胃公式罐审阅观暨
〈掛剪切
〒11亍[ATV)
=三
BTU▼出彳ATI曼彳
—-—
—
对另
D3
^=NOOSINV(1-1/2^=0.05/2)2>
A
B
CDE
11翠14031
2.2独立性检验
独立性检验用于分析含有多项分类的两个或两个以上的变量之间是否有关联或是否独立的问题。
2.2.1两分类
例如,比较不同地区的男性比例是否相等。
(性别为2分类)
(1)SPSS分析语句
SELECTIFNOTMISSING(RegCat).
\TEMP\soci.sav'
GRPPCTwithin=RegCat/
GRP=Gender/
NREP=100/
\TEMP\soci.sav'
(2)SPSS计算结果
地区
一类地区
51.487
1.33
1.1546
48.513
二类地区
52.659
0.79
0.8915
47.341
53.339
0.35
0.5910
三类地区
46.661
54.014
0.41
0.6407
四类地区
45.986
比如一类地区的男性与二类地区的男性比例差异为51.478-52.659=-1.172;
2)计算差异联合标准误
比如一类地区的男性与二类地区的男性比例差异标准误为:
SEpip2:
SE;
iSEp2.1.33—0.791.456;
3)计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从Z分布,比如一类地区和二
类地区的男生:
Z=-1.172/1.456=-0.805;
4)多重比较的校正
一类地区有k(4)个分类,对于性别的某个分类,四类地区共需要两两比较n=k*(k-1)/2
即4*3/2=6次。
因为性别为两个分类,女性的比较结果与男性是相同的,因此只要选择其中的一类就可以了。
一类地区的男性与二类地区的男性比例差异检验是多次比较中的一次比较,需要对显著
性a水平做矫正。
即在总体a=0.05的水平下,每一次比较的显著性水平调整为a/n。
5)计算Z临界值
查表求a=0.05/6的Z临界值,也可以在excel中输入--匚“上)■,得到Z临界
值。
可以如下图的excel中输入一沁•二江尽眺匚一二-、,得到Z临界值=2.6383。
26
因为|-0.805|<
2.6383,所以一类地区和二类地区男性的比例没有显著差异(总体a=0.05,
二吕豐制粘貼+梧式局
每一次比较的显著性水平为0.036)。
来林11tAA
BEnTU*
・M・M==.^=-
对幵方式
公式
D2-▼C関=ffOEmSIHV(l-1/2^0.05/&
F^>
~—
E
|2.G38257I
[
2.2.2多分类
例如,比较不同地区的网络成瘾的差异。
(网络成瘾为3分类)
GRPPCTwithin=RegCat/
GRP=sinasumC/
NR