SPSS统计软件期末作业.docx
《SPSS统计软件期末作业.docx》由会员分享,可在线阅读,更多相关《SPSS统计软件期末作业.docx(21页珍藏版)》请在冰豆网上搜索。
![SPSS统计软件期末作业.docx](https://file1.bdocx.com/fileroot1/2023-1/7/bb8b592f-45af-40f9-9ec0-4ed769769efd/bb8b592f-45af-40f9-9ec0-4ed769769efd1.gif)
SPSS统计软件期末作业
统计软件及应用期末作业
完成作业:
3、5、11、12题
第3题:
基本统计分析3
利用居民储蓄调查数据,从中随机选取85%的样本,进行分析,实现以下目标:
1、分析不同职业储户的储蓄目的
(一),只输出图形并进行分析即可,不需要输出频数表格;
2、分析城镇和农村储户对未来收入状况的变化趋势”是否持相同的态度;分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。
基本思路:
首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。
操作步骤:
选择菜单数据t选择个案t随机个案样本,样本尺寸填大约所有个案85%。
殳fhiear*m
a-
去血戦x陽⑺m:
.j切.半印
*.甘訂戸屮后I总目旳一附-U
丄1目虻ilrrti?
■
JFg
勺能r-
鼎血零
■口b
£VUk||
_]三笊'3
1、题目:
分析不同职业储户的储蓄目的
(一),只输出图形并进行分析即可,不需要输出频
数表格。
基本思路:
首先进行多选项分析,定义名为X的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;对不同职业储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。
操作步骤:
SX预率
响应
N
⑴出.
4.;'买高档消货品
55
7.5%
22.4%
站婚用
44
6.0%
17.9%
正常血舌琴用
155
21.1%
63.0%
做生愆
46
6.3%
18.7%
匪.•“址生产赏料
14
1.9%
5.7%
买证券及讹位:
毎资
32
4.4%
13.0%
买房或建房
77
10.5%
31.3%
支何筱「孜育货
66
9.0%
26.8%
养老龛
52
7.1%
21.1%
财以外事故
92
12.5%
37.4%
侔利息
102
13.9%
41.5%
735
100.0%
298.8%
a
tL^Mlffl陌H
粗圭交$虫吨工
「左®E兌
殳台中^©(V
斛卄么«S?
[31Jii收入悄氏曲j|克必收入“况aldi敢入水耳I04J0环和ir#处‘拥
*>目的nJ□的二M_23d忖E一僅Ul
SX
A"(®i訪种巫[jj初恰弘邛08:
dirties|川)念换仪卜冨*杰•”〒
亠结常用
—正常生活枣斥做生意
•购买农业生产窃料
XY*■十r*»4m,・—
I?
賁爭8疋为
(7二分右0()
©项◎ras1卩kdFH
£^W.
way
ti)钟
tft失值
在二分抉内法耶焙顺吝h來MX®亡在眉别内疔瞬欣顺般邦林、窯(X)
L
I.
iTft^][Wa(P)jS£(R)j取舅|[经跡
i4..4..■-=3na
「:
:
操作步骤』|寸认也平皿:
I
护降取卿宝前i世祀淨[和入情况,
啊m二is\2t
-格计数前
P11fr+平:
3Q
亍t描述统计t交叉表-显
统计量I
选择
式条
形图前打勾,行选择户口,列选扌择未来收
相依隶致(宜)
期望值、行、列、总计、、四舍五.
LambdatLi
茶定性糸酸y
__Gdirm^G;
巳入单元拓芯⑸
HKendall^lau-blB)
KendahstEuc(C.'
jCochrans2ndl^antel-Haenszel绮计星祇〕舱池一舲几率匕弄于厂
打勾,撮后确认。
*枸谢上囲m竜矿01按刊牢于卷脊[=-1]
—JM宀
坐㈢
□Kappas:
□风飙)
I.IcNema'i'M
分析:
从折线图看出,储户中商业服务业的人数最多,总体上所有职业储户的正常生活零用
所占的百分比最大,买证券及单位集资的人较少,说明大部分人群还没有这方面的意识。
2、分析城镇和农村储户对未来收入状况的变化趋势”是否持相同的态度。
基本思路:
该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验
境主肚方法,对城镇和农村储户对该问题的态度是否一致进行分析。
玄叉恚统卷
输出以下表格和图形:
户口*未来收入情况交叉制表
未来收入情况
合计
增加
基本不变
减少
户口
城镇户口
计数
38
111
20
169
期望的计数
户口中的%
%
%
%
%
未来收入情况中的%
%
%
%
%
总数的%
%
%
%
%
农村户口
计数
14
32
19
65
期望的计数
户口中的%
%
%
%
%
未来收入情况中的%
%
%
%
%
总数的%
%
%
%
%
合计
计数
52
143
39
234
期望的计数
户口中的%
%
%
%
%
未来收入情况中的%
%
%
%
%
总数的%
%
%
%
%
卡方检验
糸形慢I
234
.043
S3-
戋性和线性组合
讣
数创r有效案例中的N
a.0单元格%)的期望计数少于5。
最小期望计数为
12D-
df
渐进Sig.双侧)
■:
;!
;J.I
1I牡V1■'<
口昨一
2
.005
.007
■imPearson卡方
似然比
'析:
因为卡方值小
'于拒绝
原假设,认为行列变量之间相关
,户口对未来收入看法有影响,说
PU
4旷I
斷HE
'■J(L-
匚角蜿联存也:
L.X*1IUUiP.
C1牺R叱知3
(Ji鼻蚪弐用(户抄乩[_q
明城镇和农村储户对朱来收入状况的变化趋势鴛”持不同的态度。
501Thru2Qg亠2MfillhFJ35O0->3i50nhni500D-^4ifiOQinruHi>5
JiSl-h鈿i钊些世.
3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。
口PI4I‘.口直丸墨云IE
二Jfi出要=住手征駁型~--'
基本思路血肺于存款金额数据为定距型变量,口直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
操作步骤:
转换f重新编码为不同变量f选择存(取)款金额,输出变量名称填存款金额分
组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、
5000以上五个组。
最后点击确定。
再分析f描述统计f频率f变量:
存款金额分组,图表
选择直方图,选择显示正态曲线。
0iiiiii■i
001002003(jg40050QRQO
最后输出下列图表:
BJ-
并通过四分
基本思路:
进行数据拆分,綁计算不同年龄段储户的一次存款金额的四分位数,位数比较分布上的差异。
步骤:
数据T拆分文件T分组方式:
年龄T确定。
分析T描述统计T频率T统计量T四分位
数前打勾T确定。
输出如下图表:
统计量
存款金额分组
20岁以下
N
有效
2
缺失
0
百分位数
25
50
75
20〜35岁
N
有效
133
缺失
0
百分位数
25
50
75
35〜50岁
N
有效
78
缺失
0
百分位数
25
50
75
50岁以上
N
有效
33
缺失
0
百分位数
25
50
75
分析:
分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。
存款在500以下所占百分比最大,有%,其次是500-1000的人数。
而存款在5000以上的也有%,说明存款数额悬殊较大。
从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄段,这两部分的人群存款意识比较强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大部分是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。
第5题:
方差分析2
在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。
在同一浓度与
温度组合下各做两次试验,其收率数据如下面计算表所列(数据均已减去75)。
试在a血
著性水平下分析:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标);
(3)浓度、温度以及它们间的交互作用对收率有无显著影响。
基本思路:
本道题重点考察我们对于在SPSS应用过程中对于方差分析的应用情况。
先将这
组数据输入SPSS然后进行两个方面的计算:
单因素方差分析和多因素方差分析。
利用SPSS
的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。
多重比较检验的方法:
LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey
方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵
敏。
(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标);
操作步骤:
分析-比较均值-单因素ANOVA因变量列表:
收率,因子列表:
浓度-确定。
输出如下图表:
单因素方差分析
收率
平方和
df
均方
F
显著性
组间
2
.041
组内
21
总数
23
显著性=小于说明拒绝原假设(浓度对收益无显著影响),证明浓度对收益有显著影响。
..均值图迥)
均值
取消糾助
操作步骤:
分析-比较均值-单因素ANOVA两两比较:
LSD选项:
描述性-确定
IIIUJI■■■UIIIIIUJI■■■<&»■
.固疋和随机效果叵)收率2汀亍mJ.
Ercwn-ForsytheiB:
CWelchWN
醴失值
1iil-j-i-:
8?
-
「按列勃瞬个氯L)
2
总数
24
.49262
多重比较
因变量:
收率
LSD
(I)浓度
(J)浓度
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
1
2
*
.032
.2438
3
.909
2
1
*
.032
3
*
.025
3
1
.12500
.909
2
*
.025
.3688
*.均值差的显著性水平为。
上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。
(3)浓度、温度以及它们间的交互作用对收率有无显著影响。
全因子-确定。
曲单吏1
赠畑』
st比逍_J
冏11
丙FSfcto^:
IW^iSh.
啊◎_」
WLE^lIWI'
I^LIIsI
hKttr>i
砖G
M*J|a
操作步骤:
分析-一般线性模型-单变量-因变量:
收率,固定因子:
浓度、温度,-模型选择
器壬唾遍Oi5t®(C>
平方和心・2litr/
业芬]出;电|\
输出:
主体间因子
N
浓度
1
8
2
8
3
8
温度
1
6
2
6
3
6
4
6
主体间效应的检验
因变量:
收率
源
III型平方和
df
均方
F
Sig.
校正模型
11
.391
截距
1
.000
A
2
.074
B
3
.917
.462
A*B
6
.607
.721
误差
12
总计
24
校正的总计
23
a.R方=.519(调整R方=.077)
分析:
结果表明,只有因子A(浓度)是显著的,即浓度不同将对收率产生显著影响,而温度及交
互作用的影响都不显著,这说明要提高收率必须把浓度控制好。
方差分析可以很好的去辨别两个事物之间存在联系的紧密性。
通过数据,我们可以分辨出浓
度的影响更加显著,从而做出调整。
第11题:
曲线回归3
根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。
(提示:
首先绘制两者的散点图。
再尝试选择二次、三次曲线、复合函数和幕函数模型,利用曲线估计进行本质线性模型分析。
)
思路:
本题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立方、复合、幕函数模型,进行分析。
操作步骤:
图形t旧对话框t散点/点状t简单分布tY轴:
教育支出,X轴:
年人均可支配
得到散点图如下:
收入t确定。
Gco.ao-
教^ao.oo-
出
2QO.OD1
nn-
ZCOa.OD4000DOEOOO.COSOOO.Ol13000.0312CXXJOO
年人期训支配收入
步骤:
分析T回归T曲线估计T因变量:
教育支出,自变量:
年人均可支配收入,个案标签:
年份,模型二次项、立方、幕、复合前打勾T确定。
得到以下图表:
模型汇总和参数估计值
因变量:
教育支岀
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
b2
b3
二次
.963
2
8
.000
三次
.964
3
7
.000
复合
.985
1
9
.000
幕
.946
1
9
.000
.000
自变量为年人均可支配收入。
DO-
QB
tZIJAdU
I*II-
2t£ur
W-0DCI
bOUDJO
^AKjHAHd收入
迪LO.D01DODOcn
分析:
在二次、三次、复合、幕函数的模型中复合函数的R方是最大、最接近1的。
所以
应用复合函数来表示年人均可支配收入与教育支出的函数关系。
根据函数图象看出,教育支
出是随年人均可支配收入增长而增长的,说明随着人们可支配收入增加,对教育的关注更多,
投入更多。
第12题:
聚类分析1
9个学生的数学、物理、化学、语文、历史、英语的成绩如下表。
要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。
K和确定K个初
思路:
本题考察K聚类(快速聚类)的内容,根据题目只要指定聚类数目
始类中心即可。
K-均值聚类t变量中把数学、物
ANOVA表前打勾
操作步骤:
先把表格数据输入数据编辑器中。
分析T分类
理、化学、语文、历史、英语选进,聚类数为3宀选项t初始聚类中心和
初始聚类中心
聚类
1
2
3
数学
65
83
67
物理
61
100
63
化学
72
79
49
语文
84
41
65
历史
81
67
67
英语
79
50
57
迭代历史记录a
迭代聚类中心内的更改
123
000蔦.000
.000
皑荚申电
|里・“•畑聽%甲仁I日砂J1歼弭JI鼻甘
黙購Mj3J
4炉代t'tjuriC
a.由于聚类中心内没有改动或改动较小而达到收敛。
任何中心
的最大绝对坐标更改为.000。
当前迭代为2。
初始中心间的最
小距离为。
最终聚类中心
聚类
1
2
3
数学
74
81
70
物理
68
92
70
化学
71
77
64
语文
79
52
60
历史
81
69
67
英语
72
57
56
ANOVA
聚类
误差
F
Sig.
均方
df
均方
df
数学
2
6
.234
物理
2
6
.017
化学
2
6
.926
.446
语文
2
6
.022
历史
2
6
.009
英语
2
6
.031
F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。
观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。
每个聚类中的案例数
聚类
1
2
3
有效
缺失
.000