spss考试100分必备Word文档格式.docx
《spss考试100分必备Word文档格式.docx》由会员分享,可在线阅读,更多相关《spss考试100分必备Word文档格式.docx(32页珍藏版)》请在冰豆网上搜索。
2和3的组合:
以教育程度、性别为自变量,月收入为因变量做出下表:
(步骤进行到题干出现第二个对话框以后点定义,2和3的组合1和3的组合类似,不过在类别轴下的定义聚类里多输入了性别这个自变量)
有两个自变量
篇幅有限,还有设置图形属性,设置数据标签没讲,有问题的可以问我。
9、设置新变量
转换—重新编码为不同变量—输入自己设置的变量—新值旧值—赋值—继续—更改—确定
10、相关系数(期中前的知识重点)
a、定类变量表现为类别,不能区分顺序b、定序数据是表现为类别可以进行排序。
c定距数据是表现为数值,可以进行加、减运算以精确计算数据。
选择相关系数公式:
按组合和对称关系的组合
测量方法
变量层次要求
取值范围
是否对称测量
有无PRE意义(消减误差比例)
Lambda
定类-定类
定类-定序
[01]
对称和不对称
有
Tau-y
不对称
Gamma
定序-定序
[-11]
对称
Dy
相关比率
定类-定距
定序-定距
E2有
皮尔森系数
定距-定距
r2有
1、选择皮尔森系数:
第一种方法、分析—相关—双变量(点击左下角pearson)—确定第二种方法、:
分析—描述统计—交叉表(统计量)—相关性
相关性
身高
体重
Pearson相关性
1
.714**
显著性(双侧)
.000
N
161
**.在.01水平(双侧)上显著相关。
这种题老师会问有没有PRE意义(或消减误差比例):
回答它的平方有消减误差
比例,如这道题:
消减误差比例的数或消减误差是多少答:
0.714的平方,(见上面的总结)
2相关比例系数(Eta)
方向度量
值
按间隔标定
η
受访者性别因变量
.354
上月收入因变量
.118
老师可能会问选择那个数据是正确的。
我们知道:
只能以性别为自变量(固有属性一般做自变量),即以月收入为因变量。
所以这道题的数据正确的是0.118.老师会问哪个数据具有PRE有消减误差比例的意义或消减误差多少。
回答,0.118的平方,(见上面的总结)。
Lamdba系数:
渐进标准误差a
近似值Tb
近似值Sig.
按标量标定
对称的
.026
.009
2.768
.006
教育程度因变量
.c
.053
.019
Goodman和Kruskaltau
.005
.001
.000d
.010
.003
Lambda系数比较难懂的是选择哪个正确的数据。
(如用到lambda这个公式,先考虑到对称关系,这道题两变量分别是性别与教育程度,我们知道它首先是不对称的,那么0.26这个数据是不正确的;
再考虑哪个变量是因变量,我们知道性别肯定是自变量(固有属性),那么我们选择的正确数据数据是0.00。
老师可能会问,哪个数据具有PRE(消减误差比例)意义,回答:
0.00(就本题而言),进而他可能会问,消减误差比例多少:
答:
0.00(见总结)
相关系数这一节:
要正确掌握相关系数公式适用的条件,要清楚哪个数据是我们最终求得结果(正确的数据),该数据是否具有PRE意义(及消减误差比例),能消减误差比例是多少。
(见总结表)
11、选择个案
数据—选择个案—如果条件满足—如果(后面自己进行条件的设置)
(在这道题中,设置的条件为性别<
2,最后我们进行相关命令时,只有性别为1的执行了命令,这样性别为2的排除在外)
1分教育程度比较不同性别被访者月收入的差异,并简要说出结论。
(数据:
CGSS2003.sav)(分析——比较均值——均值)
报告
上月收入
受访者性别
教育程度
均值
标准差
男
小学及以下
701.84
422
2967.484
初中
747.19
848
1889.910
高中及以上
1057.62
1565
1328.385
总计
911.81
2835
1837.361
女
272.38
651
401.041
408.26
994
643.728
826.67
1414
1080.749
572.75
3059
875.365
441.28
1073
1897.336
564.29
1842
1376.716
947.99
2979
1222.395
735.83
5894
1431.724
(对)(错)
这种题目,大家可能会弄成第二个答案,这种题目一般后面有一个表,大家做好了对照一下。
如果错了。
重新做一次,改变自变量列表的输入顺序。
(注意:
输入一个自变量进入自变量列表后,一定要点下一张再输入第二个自变量)
2.检验总体中平均身高是否等于170cm,并说明结论。
(单个样本t检验.sav)
(分析——比较均值——单样本T检验)
单个样本检验
检验值=170
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
-1.234
19
.232
-2.05000
-5.5274
1.4274
Sig叫做相伴概率。
结论:
两种情况:
如果sig大于0.05,总体均值和检验值之间不存在显著差异(相等),接受结论反之,小于0.05,总体均值和检验值之间存在显著差异(不相等)不接受结论零假设H0表述:
总体均值和检验值之间不存在显著差异(相等)
3检验两样本两所大学数学平均值是否相等。
(独立样本t检验.sav)(分析——比较均值——独立样本T检验)
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
标准误差值
数学成绩
假设方差相等
.571
.461
-.822
16
.423
-7.88889
9.59375
-28.22674
12.44896
假设方差不相等
14.363
.424
-28.41674
12.63897
定义组比较重要,自变量的取值输入到里面去(如:
这个数据学校取值为1、2则分别在使用指定值里输入1、2)零假设:
H0:
两总体的均值之间不存在显著差异。
分析:
先看sig.(在这是0.461),1.如果是大于0.05说明方差相等成立,再看sig.(双侧)对应假设方差相等的数据与0.05的大小关系,如果大于0.05,结论:
两总体均值之间没有显著差异(相等),如果小于0.05,结论:
两总体均值之间存在显著差异(不相等)。
2如果sig.小于0.05,则看sig(双侧)与假设方差不相等对应的数据(该例题是0.424),看与0.05的大小关系,结论与上面相同。
在这,先看到数据0.461,再看0.423,得出结论。
4比较同学补课前后平均成绩是否有显著差异。
(分析——均值——配对样本T检验)(配对样本t检验.sav)
成对样本检验
成对差分
均值的标准误
对1
数学前-数学后
-12.33333
21.55977
5.08169
-23.05475
-1.61191
-2.427
17
.027
对2
化学1-化学2
-7.55556
13.81484
3.25619
-14.42551
-.68560
-2.320
.033
分析结论:
看sig.(双侧),如果大于0.05,结论:
两总体均值之间不存在显著差异(相等),如果小于0.05,两总体均值之间存在显著差异(不相等)
两配对样本T检验:
H0(零假设):
两总体均值之间不存在显著差异
5对水稻品种和产量作单因素方差分析,并简要说出结论。
cotton_1.sav)(分析——均值——单因素ANOVA)(cotton_1.sav)
ANOVA
产量
平方和
均方
显著性
组间
125.718
3
41.906
13.583
组内
49.364
3.085
总数
175.082
结论分析:
看显著性:
如果小于0.05,至少有一个品种的平均产量(这是这道题的变量,具体问题具体作答)与其他品种存在显著差异(不相等);
如果大于0.05,所有品种的平均产量无显著差异(相等)。
这道题的零假设:
回答:
A1=A2=A3=A4,总体的均值之间不存在显著差异。
(看具体题目,如果有3个样本,A1=A2=A3)
6以自变量品种和产量作单因素方差分析,做出如下结果并简要说出结论。
(分析——均值——单因素ANOVA——选项——方差同质性检验)(cotton_1.sav)
方差齐性检验
Levene统计量
df1
df2
.561
.648
老师可能会问方差齐性检验表格的数据:
如果显著性大于0.05,(这个例题的显著性数据为0.648)说明方差相齐,反之,方差不齐,表ANOVA的分析和题5相同方差同质性检验的零假设H0:
总体的方差相等
7以自变量水稻品种和因变量产量作单因素方差分析,做出如下结果并简要说出结论。
多重比较
LSD
(I)品种
(J)品种
均值差(I-J)
标准误
95%置信区间
1.00
2.00
-.36000
1.11090
.750
-2.7150
1.9950
3.00
.72000
.526
-1.6350
3.0750
4.00
5.84000*
3.4850
8.1950
.36000
-1.9950
2.7150
1.08000
.345
-1.2750
3.4350
6.20000*
3.8450
8.5550
-.72000
-3.0750
1.6350
-1.08000
-3.4350
1.2750
5.12000*
2.7650
7.4750
-5.84000*
-8.1950
-3.4850
-6.20000*
-8.5550
-3.8450
-5.12000*
-7.4750
-2.7650
*.均值差的显著性水平为0.05。
这道题是第5、6题的“进化版”。
它能清楚地比较哪几个样本存在的显著差异。
(在这道题:
他可以看出1、2、3无显著差异,4与1、2、3存在显著差异)
(第一步)(第二步)(第一步后,点选项)
(第三步,第二步后点两两比较)(这是在第二步方差同质性检验得出方差相齐时的情况才能进行这一步:
选公式的时候,看题目,题目有选择公式提示(我标记的题目表格紫色部分,LSD))
(如果对spss比较熟悉的话,可以省略第二步)
(品种1与2、3的平均产量没有显著差异,与品种4存在显著差异)(看红色部分,如果大于0.05,两者无显著差异(相等),小于0.05,存在显著差异(不相等))
均值相等性的键壮性检验
统计量a
Welch
13.646
8.842
Brown-Forsythe
14.982
a.渐近F分布。
如果第二步方差同质性检验显著性小于0.05,即方差不齐时,(见题5),第三步如下,最终得出结果如右表
(第三步:
接第二步)
8做出如下的教育程度、性别和年龄为自变量,月收入为因变量的多因素方差分析结果,并简要说出结论。
(分析——一般线性模型——单变量)(CGSS2003(练习).sav)
主体间效应的检验
因变量:
月收入
源
III型平方和
校正模型
8.803E8
43
20473197.310
10.886
截距
42633466.703
22.669
gender
5630490.111
2.994
.084
edu
34665549.451
10
3466554.945
1.843
.048
gender*edu
34023031.603
3402303.160
1.809
.054
gender*edu*age
51113261.591
22
2323330.072
1.235
.205
误差
9.892E9
5260
1880696.191
1.437E10
5304
校正的总计
1.077E10
5303
a.R方=.082(调整R方=.074)
(第一步)(这里要注意的是:
定类(第二步:
根据题目要求设置模型:
点
和定序变量自变量输入到固定因模型——设定,如果是表格红色
子,定距自变量输入到协变量,部分类型的模型设定,用ctrl键选中,
如:
年龄)再输进去
第三步:
得出上面的表格
看青色部分,即sig下面的数据:
如果大于0.05,结论:
如果值大于0.05,自变量(如果有多个自变量,则说X与Y自变量各个水平的交互作用)对于因变量没有显著影响,反之,小于0.05,有显著影响
9以体重为因变量,以班级、性别、身高作为自变量,做出如下回归分析表,并简要说出结论。
(分析——回归——线性)(身高体重统计.xls)
模型汇总
模型
R
R方
调整R方
标准估计的误差
.738a
.545
.537
6.428
a.预测变量:
(常量),班级,性别,身高。
系数a
非标准化系数
标准系数
B
标准误差
试用版
(常量)
-35.247
19.073
-1.848
.066
.607
.102
.495
5.966
性别
-5.844
1.677
-.289
-3.484
班级
.056
1.013
.055
.956
a.因变量:
体重
R方:
“确定系数、决定系数”,如果老师问含义回答:
方程的解释力,方程拟合度(越大越好,最少要超过0,1)
当自变量为定距变量时:
在这标记的是表格红色数据0.607,解释:
当班级和性别不变的情况下,身高每增加1cm,体重增加0.607kg(通用解释:
当自变量X1、X2、X3、X4......不变的情况下,自变量X(定距变量)每增加1个单位,因变量平均变化多少)
当自变量为定类变量时:
在这标记的是紫色数据-5.844,解释:
当班级和身高不变的情况下,女生比男生少-5.844kg。
(定类变量解释时:
取值大的比取值小的少(多)......,在这,男取值1,女取值2)
10请对教育程度、受访者性别为自变量,月收入为因变量的回归分析,如下表(CGSS2003.sav)(分析——回归——线性)
922.933
73.192
12.610
102.904
54.108
1.902
.057
高中
467.127
50.347
.163
9.278
-299.775
36.879
-.105
-8.129
上月收入
回归分析如果自变量含有定序变量,首先得对它进行虚拟变量设置。
虚拟变量设置方法:
如果该自变量有n个取值,用重新编码不同变量设置n-1次。
如这个自变量(教育程度:
属于定序变量,且有3个取值,分别是1小学,2初中,3高中)设置时,用重新编码不同变量命令将教育程度取值1变为0,2变为1,3变为0,标签为初中;
再次运用这个命令,将教育程度1变为0,2变为0,3变为1.标签为高中,选中的那个变量值重新取值为1,其余全部重新取值为0。
(以小学为对照,不用重新再设置标签为小学的的变量)(对照一般是选择以原自变量水平最低的值,如本题中教育程度最低的是小学)
(变量为初中的设置)
(变量为高中的设置)
虚拟变量设置以后,进行下一步:
解释:
当受访者性别不变时,初中生比小学生的人均月收入多102.904元;
当受访者性别不变时,高中生比小学生的人均月收入多467.127元。