百分比差异检验步骤.docx
《百分比差异检验步骤.docx》由会员分享,可在线阅读,更多相关《百分比差异检验步骤.docx(11页珍藏版)》请在冰豆网上搜索。
![百分比差异检验步骤.docx](https://file1.bdocx.com/fileroot1/2022-11/17/f53324ee-cfc8-4fe7-854e-d3c0fa626ad0/f53324ee-cfc8-4fe7-854e-d3c0fa626ad01.gif)
百分比差异检验步骤
百分比差异检验步骤
1•百分比标准误的计算
对于一些分类变量,例如性别,感兴趣的通常是每个类别的百分比。
百分比标准误的计
算过程与平均数标准误的计算过程相似,主要步骤如下:
1)计算重复样本百分比
计算每个重复样本的百分比,求100个重复样本的百分比均值一。
2)计算抽样方差
在100个重复样本上,分别计算每个百分比估计值与百分比均值差异的平方
和,再除以25,可以得到百分比抽样方差的估计值,对应的公式为:
.二咯昭演适
3)计算抽样标准误
抽样标准误是抽样方差的平方根,在计算过程中使用的公式如下:
下面以计算四类地区中不同性别的百分比及其标准误为例,通过框1提供的程序(文件
名为percentages.sps)实现。
框1计算四类地区中不同性别的百分比及其标准误SPSS命令
soci.SAV'.
SELECTIFNOTMISSING(Gender).
soci.sav'.
Includefile='C:
\fy\macro\mcr_se_grppct.sps'.
GRPPCTGRP=gender/
WITHIN=RegCat//*default=NOWITHIN*/
soci.SAV'/.
GETFILE和SAVEOUTFILE命令用于打开数据文件并另存为新的数据文件,Include命令
调用宏,GRPPC是宏名,宏中的选项含义如下:
GRP指定要计算百分比的类别变量。
WITHIN:
指定拆分变量(breakdownvariable),类别变量百分比的计算将在拆分变量的每个类别中分别进行。
INFILE:
指定需要分析的数据文件。
表1是根据框1计算得到的结果,结果中给出了四类地区(拆分变量)不同性别的百分
比和标准误,比如第一类地区男生百分比为54.164%,标准误为.9518,女生百分比为
45.836%,标准误为.9518。
表1百分比标准误计算结果
SEongrouppercentagesofgenderwithinregcatcategories
RegCat
Gender
stat
SE
男
54.164
.9518
1
女
45.836
.9518
男
53.894
.5829
2
女
46.106
.5829
男
55.736
.6433
3
女
44.264
.6433
男
56.922
.5983
4
女
43.078
.5983
2.百分比差异检验
2.1配合度检验
2.1.1两分类
配合度检验用于分析一组数据的实际分布与理论分布是否一致,适用于单个的分类变
量。
检验公式如下:
Z-p^-P0,其中?
为百分比估计值,pg为理论值,SEp为标准误。
SEp
例如,假如男女性别所占比例的理论值都为50%,检验实际比例是否与理论值相同。
(性
别为2分类)
(1)SPSS语句
GETFILE='C:
\fy\soci.sav'.
SELECTIFNOTMISSING(Gender).
SAVEOUTFILE='C:
\TEMP\soci.sav'.
Includefile='C:
\fy\macro\mcr_se_grppct.sps'.
GRPPCTGRP=gender/
NREP=100/
INFILE='C:
\TEMP\soci.sav7.
EXEC.
(2)SPSS分析结果见下表
性别
stat
var
SE
男
53.335
0.16
0.4054
女
46.665
0.16
0.4054
(3)计算过程
1)计算两两之间差异
比如男性与理论值50%的差异为53.335-50=3.335;
2)
Z分布,比如男生:
计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从
3)确定Z临界值
计算结果与临界值1.96进行比较,由于8.227>1.96,因此,认为男生的人数比例与理论上的50%有显著差异(a=0.05)。
2.1.2多分类
(网
假设在总人群中网络成瘾的比例为4%,检验调查得到的结果与理论值是否有差异。
络成瘾为3分类)
(1)SPSS分析语句
IneludeFILE='C:
\fy\macro\mcr_se_grppct.sps'.
GETFILE='C:
\fy\soci.sav'.
RECODE
SINASUM
(8thruHighest=3)(5thru8=2)(Lowestthru5=1)INTOsinasumC.
EXECUTE.
SELECTIFNOTMISSING(sinasumC).
SAVEOUTFILE='C:
\TEMP\soci.sav'.
GRPPCTGRP=sinasumC/
NREP=100/
INFILE='C:
\TEMP\soci.sav'/.
EXEC.
(2)SPSS十算结果
正常
87.474
0.21
0.4547
网络成瘾倾向
10.654
0.18
0.4265
网络成瘾
1.871
0.02
0.1251
(3)计算过程
1)计算两两之间差异
比如网络成瘾与理论值4%的差异为1.871-4=2129;
2)计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从Z分布,比如网络成瘾:
17.02;
Z=-2.219/0.1251=-17.02,即Z?
Po1.87142.129
SEp0.12510.1251
3)多重比较的校正
由于网络成瘾有K(3)个类别,共需要进行比较n=K-1即3-1=2次。
网络成瘾与理论值
4%的差异比较是多次比较中的一次比较,因而需要对显著性a水平做矫正。
即在总体a=0.05
的水平下,每一次比较的显著性水平调整为a/n。
4)计算Z临界值
查表求a=0.05/2的Z临界值,也可以在excel中输入二H站曲法哄:
.-士-寸},得到Z临界值。
对于本例:
可以如下图的excel中输入土―,得到Z临界值
=2.241403。
因为卜17.02|>2.241403,所以网络成瘾比例与理论上的4%有显著差异(总体a
=0.05,每一次比较的显著性水平为0.05/2)。
引幵始捲入更茴祇胃公式罐审阅观暨
〈掛剪切
〒11亍[ATV)
=三
BTU▼出彳ATI曼彳
—-—
—
对另
D3
^=NOOSINV(1-1/2^=0.05/2)2>
A
B
CDE
1
2
3
11翠14031
4
2.2独立性检验
独立性检验用于分析含有多项分类的两个或两个以上的变量之间是否有关联或是否独立的问题。
2.2.1两分类
例如,比较不同地区的男性比例是否相等。
(性别为2分类)
(1)SPSS分析语句
IneludeFILE='C:
\fy\macro\mcr_se_grppct.sps'.
GETFILE='C:
\fy\soci.sav'.
SELECTIFNOTMISSING(Gender).
SELECTIFNOTMISSING(RegCat).
SAVEOUTFILE='C:
\TEMP\soci.sav'.
GRPPCTwithin=RegCat/
GRP=Gender/
NREP=100/
INFILE='C:
\TEMP\soci.sav'/.
EXEC.
(2)SPSS计算结果
地区
性别
stat
var
SE
一类地区
男
51.487
1.33
1.1546
女
48.513
1.33
1.1546
二类地区
男
52.659
0.79
0.8915
女
47.341
0.79
0.8915
男
53.339
0.35
0.5910
三类地区
女
46.661
0.35
0.5910
男
54.014
0.41
0.6407
四类地区
女
45.986
0.41
0.6407
(3)计算过程
1)计算两两之间差异
比如一类地区的男性与二类地区的男性比例差异为51.478-52.659=-1.172;
2)计算差异联合标准误
比如一类地区的男性与二类地区的男性比例差异标准误为:
SEpip2:
SE;iSEp2.1.33—0.791.456;
3)计算近似Z值
用均值差异估计值去除估计标准误,得到的统计量近似服从Z分布,比如一类地区和二
类地区的男生:
Z=-1.172/1.456=-0.805;
4)多重比较的校正
一类地区有k(4)个分类,对于性别的某个分类,四类地区共需要两两比较n=k*(k-1)/2
即4*3/2=6次。
因为性别为两个分类,女性的比较结果与男性是相同的,因此只要选择其中的一类就可以了。
一类地区的男性与二类地区的男性比例差异检验是多次比较中的一次比较,需要对显著
性a水平做矫正。
即在总体a=0.05的水平下,每一次比较的显著性水平调整为a/n。
5)计算Z临界值
查表求a=0.05/6的Z临界值,也可以在excel中输入--匚“上)■,得到Z临界
值。
对于本例:
可以如下图的excel中输入一沁•二江尽眺匚一二-、,得到Z临界值=2.6383。
26
因为|-0.805|<2.6383,所以一类地区和二类地区男性的比例没有显著差异(总体a=0.05,
二吕豐制粘貼+梧式局
每一次比较的显著性水平为0.036)。
来林11tAA
BEnTU*
・M・M==.^=-
对幵方式
公式
D2-▼C関=ffOEmSIHV(l-1/2^0.05/&F^>
A
B
~—
E
1
2
1
|2.G38257I
[
1
3
4
2.2.2多分类
例如,比较不同地区的网络成瘾的差异。
(网络成瘾为3分类)
(1)SPSS分析语句
IneludeFILE='C:
\fy\macro\mcr_se_grppct.sps'.
GETFILE='C:
\fy\soci.sav'.
RECODE
SINASUM
(8thruHighest=3)(5thru8=2)(Lowestthru5=1)INTOsinasumC.
EXECUTE.
SELECTIFNOTMISSING(sinasumC).
SELECTIFNOTMISSING(RegCat).
SAVEOUTFILE='C:
\TEMP\soci.sav'.
GRPPCTwithin=RegCat/
GRP=sinasumC/
NR