spss实验报告.docx
《spss实验报告.docx》由会员分享,可在线阅读,更多相关《spss实验报告.docx(36页珍藏版)》请在冰豆网上搜索。
spss实验报告
(此文档为word格式,下载后您可任意编辑修改!
)
《统计实习》SPSS实验报告
姓名:
成功
学号:
班级:
会计二班
实验报告二
实验项目:
描述性统计分析
实验目的:
1、掌握数据集中趋势和离中趋势的分析方法;
2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验内容及步骤
一、数据输入
案例:
对6名男生和6名女生的肺活量的统计,数据如下:
1.打开SPSS软件,进行数据输入:
通过打开数据的方式对XLS的数据进行输入
其变量视图为:
二、探索分析
进行探索分析得出如下输出结果:
浏览
由上表可以看出,6例均为有效值,没有记录缺失值得情况。
由上表可以看出,男女之间肺活量的差异,男生明显优于女生,范围更广,偏度大。
男
男Stem-and-LeafPlot
FrequencyStem&Leaf
2.001.34
2.001.89
2.002.02
Stemwidth:
1000
Eachleaf:
1case(s)
女
女Stem-and-LeafPlot
FrequencyStem&Leaf
2.001.23
3.001.568
1.002.0
Stemwidth:
1000
Eachleaf:
1case(s)
三、频率分析
进行频率分析得出如下输出结果:
由上图可知,分析变量名:
肺活量。
可见样本量N为6例,缺失值0例,1500以下的33%,男生33%女生50%,2000以上女生16.7%,男生33%。
四、描述分析
进行描述分析得出如下输出结果:
由上图可知,分析变量名:
工资,可见样本量N为6例,极小值为男1342女1213,极大值为男2200女2077,说明12人中肺活量最少的为女生是1213,最多的为男生有2200,均值为1810.501621.33,.标准差为327.735325.408,离散程度不算大。
五、交叉分析
实验报告三
实验项目:
均值比较
实验目的:
.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
实验内容及步骤
(1)描述统计案例:
某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
编号
1
2
3
4
5
服药前
198
237
233
179
219
服药后
192
225
226
172
214
编号
6
7
8
9
10
服药前
169
222
167
199
233
服药后
161
210
161
193
226
编号
11
12
13
14
15
服药前
179
158
157
216
257
服药后
173
154
143
206
249
输入SPSS建立数据。
由上图可知,结果输出均值、样本量和标准差。
因为选择了分组变量,所以三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。
由上表可知,在显著性水平为0.05时,服药前后的概率p值为小于0.05,拒绝零假设,说明服药前后的体重有显著性变化
(2)单样本T检验
进行单样本T检验分析得出如下输出结果:
由上表可以知,单个样本统计量分析表,的基本情况描述,有样本量、均值、标准差和标准误,单样本t检验表,第一行注明了用于比较的已知总体均值为14,从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均值的差值(MeanDifference)、差值的95%可信区间。
由上表可知:
t=34.215,P=0.000<0.05。
因此可以认为肺气肿的总体均值不等于0.
(3)双样本T检验
案例:
研究某安慰剂对肥胖病人治疗作用,用20名患者分组配对,测得体重
如下表,要求测定该安慰剂对人的体重作用是否比药物好。
进行双样本T检验得出如下输出结果:
T检验
成对样本统计量
均值
N
标准差
均值的标准误
对1
安慰剂组
121.80
10
11.419
3.611
药物组
111.80
10
10.185
3.221
由上图可知,对变量各自的统计描述,此处只有1对,故只有对1。
成对样本相关系数
N
相关系数
Sig.
对1
安慰剂组&药物组
10
.802
.005
此处进行配对变量间的相关性分析
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分95%置信区间
下限
上限
对1
安慰剂组-药物组
10.000
6.896
2.181
5.067
14.933
4.586
9
.001
配对t检验表,给出最终的检验结果,由上表可见P=0.001,故可认为安慰剂组和药物组对肥胖病人的体重有差别影响
实验报告四
实验项目:
相关分析
实验目的:
1.学习利用SPSS进行相关分析、偏相关分析、距离分析、线性回归分析和曲线回归。
实验内容及步骤
(1)两变量的相关分析
案例:
某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
编号
1
2
3
4
5
服药前
198
237
233
179
219
服药后
192
225
226
172
214
编号
6
7
8
9
10
服药前
169
222
167
199
233
服药后
161
210
161
193
226
编号
11
12
13
14
15
服药前
179
158
157
216
257
服药后
173
154
143
206
249
进行相关双变量分析得出如下输出结果:
相关性
相关系数系数表。
变量间两两的相关系数是用方阵的形式给出的。
每一行和每一列的两个变量对应的格子中就是这两个变量相关分析结果结果,共分为三列,分别是相关系数、P值和样本数。
由于这里只分析了两个变量,因此给出的是2*2的方阵。
由上表可见,服药前和服药后自身的相关系数均为1(ofcourse),而治疗前和治疗后的相关系数为0.911
,P<0.01
(2)偏相关分析
偏相关
已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。
试分析温度与河水流量之间的相关关系。
观测数据表
月份
月平均流量
月平均雨量
月平均气温
1
0.50
0.10
-8.80
2
0.30
0.10
-11.00
3
0.40
0.40
-2.40
4
1.40
0.40
6.90
5
3.30
2.70
10.60
6
4.70
2.40
13.90
7
5.90
2.50
15.40
8
4.70
3.00
13.50
9
0.90
1.30
10.00
10
0.60
1.80
2.70
11
0.50
0.60
-4.80
12
0.30
0.20
-6.00
由上表可见控制月平均雨量之后,“月平均流量”与“月平均气温”的相关系数为0.365,P=0.27,P>0.05,因此“月平均流量”与“月平均气温”不存在显著相关性。
(3)距离分析
案例:
植物在不同的温度下的生长状况不同,下列是三个温度下的植物生长
编号
10度
20度
30度
1
12.36
12.4
12.18
2
12.14
12.2
12.22
3
12.31
12.28
12.35
4
12.32
12.25
12.21
5
12.12
12.22
12.1
6
12.28
12.34
12.25
7
12.24
12.31
12.2
8
12.41
12.3
12.46
近似值
(4)线性回归分析
已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。
试分析关系。
观测数据表
月份
月平均流量
月平均雨量
月平均气温
1
0.50
0.10
-8.80
2
0.30
0.10
-11.00
3
0.40
0.40
-2.40
4
1.40
0.40
6.90
5
3.30
2.70
10.60
6
4.70
2.40
13.90
7
5.90
2.50
15.40
8
4.70
3.00
13.50
9
0.90
1.30
10.00
10
0.60
1.80
2.70
11
0.50
0.60
-4.80
12
0.30
0.20
-6.00
进行线性回归分析得出如下输出结果:
回归
输入移去的变量b
模型
输入的变量
移去的变量
方法
1
月平均流量a
.
输入
a.已输入所有请求的变量。
b.因变量:
月平均雨量
由表可知,是第一个问题的分析结果。
这里的表格是拟合过程中变量进入退出模型的情况记录,由于只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中身高为进入的变量,没有移出的变量,这里的表格是拟合过程中变量进入退出模型的情况记录,由于只引入了一个自变量,所以只出现了一个模型(在多元回归中就会依次出现多个回归模型),该模型中身高为进入的变量,没有移出的变量。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.855a
.732
.705
.6117
a.预测变量:
(常量),月平均流量。
拟合模型的情况简报,显示在模型中相关系数R为0.855,而决定系数R2为0.732,校正的决定系数为0.705,说明模型的拟合度较高。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
10.208
1
10.208
27.283
.000a
残差
3.741
10
.374
总计
13.949
11
a.预测变量:
(常量),月平均流量。
b.因变量:
月平均雨量
这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!
从上表可见所用的回归模型F值为27.283,P值为.00a,因此用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。
由于这里所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
.387
.247
1.564
.149
月平均流量
.462
.088
.855
5.223
.000
a.因变量:
月平均雨量
包括常数项在内的所有系数的检验结果。
用的是t检验,同时还会给出标化未标化系数。
可见常数项和身高都是有统计学意义的
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
.526
3.113
1.292
.9633
12
残差
-.6337
1.1358
.0000
.5832
12
标准预测值
-.795
1.890
.000
1.000
12
标准残差
-1.036
1.857
.000
.953
12
a.因变量:
月平均雨量
图表
(5)曲线回归分析
某地1963年调查得儿童年龄(岁)与体重的资料试拟合对数曲线。
年龄(岁)
体重
1
2
3
4
5
6
7
68
65
67
50
70
76
77
进行曲线回归分析得出如下输出结果:
实验报告五
实验项目:
聚类分析和判别分析
实验目的:
1.学习利用SPSS进行聚类分析和判别分析。
实验内容及步骤
(一)系统聚类法
为确定老年妇女进行体育锻炼还是增加营养会减缓骨骼损伤,一名研究者用光子吸收法测量了骨骼中无机物含量,对三根骨头主侧和非主侧记录了测量值,结果见教材表。
:
受试者编号
主侧桡骨
桡骨
主侧肱骨
肱骨
主侧尺骨
尺骨
1
1.103
1.052
2.139
2.238
0.873
0.872
2
0.842
0.859
1.873
1.741
0.590
0.744
3
0.925
0.873
1.887
1.809
0.767
0.713
4
0.857
0.744
1.739
1.547
0.706
0.674
5
0.795
0.809
1.734
1.715
0.549
0.654
6
0.787
0.779
1.509
1.474
0.782
0.571
7
0.933
0.880
1.695
1.656
0.737
0.803
8
0.799
0.851
1.740
1.777
0.618
0.682
9
0.945
0.876
1.811
1.759
0.853
0.777
10
0.921
0.906
1.954
2.009
0.823
0.765
输入SPSS建立数据。
进行系统聚类分析得出如下输出结果:
聚类
快捷聚类
研究儿童生长发育的分期,调查名1月至7岁儿童的身高(cm)、体重(kg)、胸围(cm)和资料。
求出月平均增长率(%),
判别分析
对某企业,搜集整理了10名员工2009年第1季度的数据资料。
构建1个10×6维的矩阵
职工代号
工作产量
工作质量
工作出勤
工砟损耗
工作态度
工作能力
1
9.68
9.62
8.37
8.63
9.86
9.74
2
8.09
8.83
9.38
9.79
9.98
9.73
3
7.46
8.73
6.74
5.59
8.83
8.46
4
6.08
8.25
5.04
5.92
8.33
8.29
5
6.61
8.36
6.67
7.46
8.38
8.14
6
7.69
8.85
6.44
7.45
8.19
8.1
7
7.46
8.93
5.7
7.06
8.58
8.36
8
7.6
9.28
6.75
8.03
8.68
8.22
9
7.6
8.26
7.5
7.63
8.79
7.63
10
7.16
8.62
5.72
7.11
8.19
8.18
1、“分析——分类——判别分析”,把“分类”选入“分组变量”,定义范围:
最小值
(1),最大值(4),把X1、X2、X3、X4、X5和X6输入“自变量框”,选择“使用逐步式方法”;
2、“统计量”中选择“均值”、“单变量ANOVA”、“Fisher”、“未标准化”、“组内相关”;
3、“方法”默认设置;
4、“分类”中选择“根据组大小计算”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图、分组、区域图”;
5、“保存”中选择“预测组成员”、“判别得分”;
6、点击确定。
得到以下各表和图。
特征值
函数
特征值
方差的%
累积%
正则相关性
1
1.002a
100.0
100.0
.707
a.分析中使用了前1个典型判别式函数。
Wilks的Lambda
函数检验
Wilks的Lambda
卡方
df
Sig.
1
.499
3.471
6
.748
函数
1
工作质量
.270
工作产量
-.831
工作出勤
-.406
工砟损耗
1.415
工作态度
1.879
工作能力
-2.061
结构矩阵
函数
1
工砟损耗
.541
工作出勤
.355
工作态度
.175
工作产量
.063
工作能力
-.056
工作质量
-.050
判别变量和标准化典型判别式函数之间的汇聚组间相关性
按函数内相关性的绝对大小排序的变量。
典型判别式函数系数
函数
1
工作质量
.581
工作产量
-.830
工作出勤
-.312
工砟损耗
1.248
工作态度
2.798
工作能力
-2.803
(常量)
-6.817
非标准化系数
组质心处的函数
职工代号
函数
1
1
-.731
2
1.097
在组均值处评估的非标准化典型判别式函数
分类统计量
分类处理摘要
已处理的
10
已排除的
缺失或越界组代码
0
至少一个缺失判别变量
0
用于输出中
10
组的先验概率
职工代号
先验
用于分析的案例
未加权的
已加权的
1
.600
6
6.000
2
.400
4
4.000
合计
1.000
10
10.000
分类函数系数
职工代号
1
2
工作质量
121.299
122.360
工作产量
-58.894
-60.411
工作出勤
-14.803
-15.373
工砟损耗
3.739
6.020
工作态度
123.979
129.094
工作能力
-63.284
-68.407
(常量)
-547.493
-560.691
Fisher的线性判别式函数
单独组图表
分类结果b,c
职工代号
预测组成员
合计
1
2
初始
计数
1
5
1
6
2
1
3
4
%
1
83.3
16.7
100.0
2
25.0
75.0
100.0
交叉验证a
计数
1
2
4
6
2
4
0
4
%
1
33.3
66.7
100.0
2
100.0
.0
100.0
a.仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.已对初始分组案例中的80.0%个进行了正确分类。
c.已对交叉验证分组案例中的20.0%个进行了正确分类。
实验报告六
实验项目:
因子分析和主成分分析
实验目的:
1.学习利用SPSS进行因子分析和主成分分析。
实验内容及步骤
(一)因子分析
下表资料为15名健康人的7项生化检验结果,6项生化检验指标依次命名为X1至X6,请对该资料进行因子分析。
因子分析
1.打开导入excle数据
2.选择菜单“分析→降维→因子分析”,弹出“因子分析”对话框。
在对话框左侧的变量列表中选除地区外的变量,进入“变量”框,
3.单击“描述”按钮,弹出“因子分析:
描述”对话框,在“统计量”中选“单变量描述”项,输出各变量的均数与标准差,“相关矩阵”栏内选“系数”,计算相关系数矩阵,并选“KMO和Bartlett’s球形度检验”项,对相关系数矩阵进行统计学检验,
对以上资料进行因子分析:
分析——降维——因子分析,确定操作得出
描述统计量
均值
标准差
分析N
X1
6.0213
1.23848
15
X2
7.9880
.57340
15
X3
3.9960
1.01195
15
X4
5.5700
1.38699
15
X5
8.3727
.77780
15
X6
8.0247
.68955
15
相关矩阵
X1
X2
X3
X4
X5
X6
相关
X1
1.000
.966
.782
.055
.104
.019
X2
.966
1.000
.747
.028
.233
.158
X3
.782
.747
1.000
.125
.214
-.024
X4
.055
.028
.125
1.000
-.150
.233
X5
.104
.233
.214
-.150
1.000
.753
X6
.019
.158
-.024
.233
.753
1.000
Sig.(单侧)
X1
.000
.000
.423
.356
.473
X2
.000
.001
.461
.202
.287
X3
.000
.001
.329
.222
.467
X4
.423
.461
.329
.297
.202
X5
.356
.202
.222
.297
.001
X6
.473
.287
.467
.202
.001
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.460
Bartlett的球形度检验
近似卡方
64.035
df
15
Sig.
.000
公因子方差
初始
提取
X1
1.000
.950
X2
1.000
.930
X3
1.000
.801
X4
1.000
.989
X5
1.000
.928
X6
1.000
.936
提取方法:
主成份分析。
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
2.768
46.127
46.127
2.768
46.127
46.127
2.678
44.634
44.634
2
1.683
28.050
74.177
1.683
28.050
74.177
1.766
29.432
74.066
3
1.084
18.074
92.251
1.084
18.074
92.251
1.091
18.186
92.251
4
.360
5.995
98.246
5
.084
1.401
99.647
6
.021
.353
100.000