SPSS期末大作业完整版Word下载.docx
《SPSS期末大作业完整版Word下载.docx》由会员分享,可在线阅读,更多相关《SPSS期末大作业完整版Word下载.docx(51页珍藏版)》请在冰豆网上搜索。
年龄"
变量到[分组方式]框中,选中[比较组]和[按分组变量排序文件],确定;
[分析→描述统计→频率],选择"
存款金额"
到[变量]框中,单击[统计量]按钮,选择[四分位数]→继续→确定。
统计量
存<
取>
款金额
20岁以下
N
1
缺失
百分位数
25
50.00
50
75
20~35岁
131
500.00
1000.00
5000.00
35~50岁
73
4500.00
50岁以上
32
525.00
2000.00
结果及结果描述:
频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。
统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0〔50-50元,年龄在20~35岁之间的人有131人,其存取款金额的四分位差是4500〔5000-500元,年龄在35~50岁之间的人有73人,其存取款金额的四分位差是4000〔4500-500元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475〔2000-525元。
可见,20~35,35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。
2、基本思路:
本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。
该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。
〔1[分析→描述统计→交叉表],选择"
户口"
到[行]框中,选择"
物价趋势"
到[列]框中;
并选中[显示复式条形图]
〔2单击[单元格]按钮,选中[观测值]、[期望值]、[行]、[列]、[总计]各框→继续;
〔3单击[统计量],选中[卡方]框→继续;
结果及其结果分析:
户口*物价趋势交叉制表
物价趋势
上升
稳定
下降
户口
城镇户口
计数
21
18
170
期望的计数
20.1
122.7
27.3
170.0
户口中的%
12.4%
77.1%
10.6%
100.0%
物价趋势中的%
75.0%
76.6%
47.4%
71.7%
总数的%
8.9%
55.3%
7.6%
农村户口
7
40
20
67
7.9
48.3
10.7
67.0
10.4%
59.7%
29.9%
25.0%
23.4%
52.6%
28.3%
3.0%
16.9%
8.4%
28
171
38
28.0
171.0
38.0
237.0
11.8%
72.2%
16.0%
卡方检验
值
df
渐进Sig.<
双侧>
Pearson卡方
13.276a
2
.001
似然比
12.159
.002
线性和线性组合
7.750
.005
有效案例中的N
a.0单元格<
0.0%>
的期望计数少于5。
最小期望计数为7.92。
上面交叉列联表表明,
共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;
认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的11.8%,72.2%,16.0%。
对不同户口的人群进行分析:
城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;
农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;
对物价趋势不同态度的人群分析:
认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;
认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高于总比例;
认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低于总比例;
总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。
从所得卡方检验结果来看,概率p值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。
3、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏度。
3、基本思路
本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。
[数据→拆分文件],选择"
收入水平"
到[变量]框中,单击[统计量]按钮,选中[均值]、[中位数]、[方差]、[偏度]→继续→确定。
结果及其分析:
300元以下
41
均值
2043.17
中值
300.00
方差
30740437.195
偏度
4.066
偏度的标准误
.369
300~800元
137
4314.15
134185788.508
6.490
.207
800~1500元
46
5687.67
1750.00
116385836.002
4.415
.350
1500元以上
13
11026.92
7000.00
197942756.410
2.193
.616
第2题:
基本统计分析2
用随机抽样中的近似抽样方法选取85%的样本,数据→选择个案→随机样本→大约〔A85所有个案的%。
第一问
基本思路:
由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。
进行数据拆分,分别计算"
300以下"
、"
300-800"
800-1500"
1500以上"
收入的四分位数,并通过四分位数比较上述四者分布上的差异。
[转换→重新编码为不同变量〔R];
到[数字变量→输出变量〔V]框中;
存款金额分组
85
34.3
77
31.0
65.3
16
6.5
71.8
10.1
81.9
45
18.1
248
[分析→描述统计→频率];
[数据→拆分文件],选择"
43
200.00
148
4475.00
710.00
6000.00
3000.00
4450.00
9750.00
第二问
该问题中设计到两个变量,应采用交叉分组下的频数分析,行变量为"
列变量为"
未来收入状况的变化趋势"
在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对"
的态度是否一致进行分析。
[分析→描述统计→交叉表],选择"
未来收入情况"
单击[单元格]按钮,选中[观测值]、[期望值]、[行]、[列]、[总计]各框→继续;
单击[统计量],选中[卡方]框→继续;
选中[显示复式条形图]→确定。
年龄*未来收入情况交叉制表
未来收入情况
增加
基本不变
减少
年龄
3
.7
1.8
.5
3.0
年龄中的%
0.0%
66.7%
33.3%
未来收入情况中的%
1.3%
2.4%
1.2%
0.8%
0.4%
35
65
27
127
28.2
77.3
21.5
127.0
27.6%
51.2%
21.3%
63.6%
43.0%
64.3%
14.1%
26.2%
10.9%
55
81
18.0
49.3
13.7
81.0
19.8%
67.9%
12.3%
29.1%
36.4%
23.8%
32.7%
6.5%
22.2%
4.0%
4
29
37
8.2
22.5
6.3
37.0
10.8%
78.4%
7.3%
19.2%
9.5%
14.9%
1.6%
11.7%
151
42
55.0
151.0
42.0
248.0
60.9%
12.895a
6
.045
13.905
.031
.017
.895
a.3单元格<
25.0%>
最小期望计数为.51。
第三问
首先按照户口对数据进行拆分,然后计算存款金额的统计量:
均值、四分位数和标准差。
[数据→拆分文件],选择"
到[变量]框中,单击[统计量]按钮,选中[均值]、[四分位数]、[标准差]→继续→确定。
178
4476.84
标准差
8813.369
70
2856.47
8317.295
775.00
第3题:
基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
1.分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
2.分析不同年龄的储户对什么合算的认同是否一致。
3.检验城镇储户的一次存款金额的均值为5000元,是否可信?
利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。
选择菜单→数据→选择个案→随机个案样本,样本尺寸填大约所有个案85%
分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
〔1由于存〔取款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
〔2进行数据拆分,并分别计算城镇储户和农村储户的一次存〔取款金额的四分位数,并通过四分位数比较两者分布上的差异。
转换→重新编码为不同变量→选择存〔取款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。
最后点击确定。
再分析→描述统计→频率→变量:
存款金额分组,图表选择直方图,选择显示正态曲线。
步骤:
数据→拆分文件→分组方式:
户口→确定。
分析→描述统计→频率→统计量→四分位数前打勾→确定。
87
35.4
30.9
66.3
14
5.7
72.0
8.1
80.1
49
19.9
246
177
2.0000
3.0000
5.0000
69
1.5000
存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。
而存款在5000以上的也有19.9%,说明存款数额悬殊较大。
从输出图表中看出城镇储户较农村储户有两倍之多,可能是因为城镇居民比较富裕而且存款意识比较强。
农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。
分析不同年龄的储户对什么合算的认同是否一致。
该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.
分析→描述统计→交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。
3.997a
.262
3.986
.263
3.337
.068
a.2单元格<
最小期望计数为.77。
因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.
单个样本统计量
均值的标准误
4871.11
9643.647
724.861
4517.45
14528.340
1749.007
单个样本检验
检验值=5000
t
Sig.<
均值差值
差分的95%置信区间
下限
上限
-.178
176
.859
-128.887
-1559.42
1301.65
-.276
68
.783
-482.551
-3972.64
3007.54
由上表可知,城镇储户的一次存款金额的均值为5000元,不可信.
第4题:
方差分析Ⅰ
解题思路
问题〔2是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。
建立原假设为:
不同浓度没有对收率产生显著影响,对原假设进行检验。
问题〔3首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。
H01不同浓度没有对收率产生显著影响;
H02不同温度没有对收率产生显著影响;
H03浓度和温度对化工厂的收率没有产生显著性的交互影响。
操作步骤
问题〔2:
选择菜单[分析→比较均值→单因素],将收率选入到因变量列表中,将浓度选入到因子框中,则SPSS会将结果显示到输出窗口中。
问题〔3:
选择菜单[分析→一般线性模型→单变量],把收率制定到因变量中,把浓度与温度制定到固定因子框中,则SPSS会将结果显示到输出窗口。
输出结果解释与结论
问题〔1:
单因素方差分析
收率
平方和
均方
F
显著性
组间
39.083
19.542
5.074
.016
组内
80.875
3.851
总数
119.958
23
单因素方差分析结果解释:
可以看到观测变量收率的总离差平方和为119.958,如果仅考虑浓度单个因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,他们的方差分别为19.542和3.851,相除所得的F统计量的观测值为5.074,对应的概率p值近似为0.016。
由于显著性水平α=0.05,概率p值小于显著性水平,则应拒绝原假设,认为不同浓度对收率产生了显著影响。
主体间效应的检验
因变量:
收率
源
III型平方和
Sig.
校正模型
70.458a
11
6.405
1.553
.230
截距
2667.042
646.556
.000
浓度
4.737
.030
温度
13.792
4.597
1.114
.382
浓度*温度
17.583
2.931
.710
.648
误差
49.500
12
4.125
总计
2787.000
24
校正的总计
a.R方=.587〔调整R方=.209
多因素方差分析结果解释:
输出结果中,第一列是对观测变量总变差分解的说明,第二列是观测变量变差分解的结果,第三列是自由度,第四列是均方,第五列是F检验统计量的观测值,第六列是检验统计量的概率p值。
可以看