SPSS数据分析报告金典模板三篇.docx
《SPSS数据分析报告金典模板三篇.docx》由会员分享,可在线阅读,更多相关《SPSS数据分析报告金典模板三篇.docx(48页珍藏版)》请在冰豆网上搜索。
SPSS数据分析报告金典模板三篇
SPSS数据分析报告(模板一)
学 院:
经济管理学院
专业、班级:
**人资*班
学生 姓名:
某某人
学号:
131********520
二○一*年十一月十一日
SPSS数据分析报告
第一部分:
原始资料和数据
资料来源:
华东交通大学经济管理学院11级人力资源管理3班29名同学实际情况
编号
姓名
性别
学科背景
年龄
身高
体重
体测成绩
1
吕鑫
0
文科
20.5
164.2
54.2
81
2
王阳
0
文科
20
158.3
46.2
75
3
洪华阳
0
理科
21
171
57.2
71
4
刘卫秀
0
理科
21
165.5
54
75
5
吴梦琦
0
文科
21
166.2
48
69
6
韩玮
0
文科
20
164.3
47
61
7
汤丽娟
0
文科
21
162.8
48.2
66
8
江桂英
0
理科
20
157.2
44.2
70
9
熊如意
0
文科
20
166.5
54.5
73
10
余婵
0
文科
19.5
156.2
45.5
77
11
彭茜
0
文科
20
165.4
52.4
66
12
赵丹
0
文科
20.5
174.3
55.6
76
13
安怡君
0
文科
20
175
56.2
72
14
武阳帆
0
文科
20.5
162.4
55.5
67
15
倪亚萍
0
文科
22
157.5
48.6
74
16
张明辉
1
文科
21.5
170
60
71
17
张春旭
1
理科
20.5
168.5
57.8
80
18
刘晓伟
1
文科
21
170.5
59.5
70
19
黄炜
1
文科
20.5
171
62.2
76
20
李强
1
文科
20.5
167.5
56.5
68
21
温明煌
1
文科
21.5
170
60
75
22
雷翀翀
1
理科
21
168.5
60
79
23
陈志强
1
文科
22
180
70.4
79
24
尹传萍
1
文科
21.5
165.2
55.6
78
25
郑南
1
理科
21.5
168.5
55.9
64
26
幸恒恒
1
文科
21.5
168.5
58
79
27
李拓
1
理科
21.5
172
68.1
66
28
张发宝
1
理科
21
160.5
52.5
73
29
杨涛
1
理科
21.5
176
70.5
72
原始资料和数据(SPSS软件截图):
图1变量视图
图2数据视图
第二部分:
数据分析
一、描述性分析
打开文件“11人资3班29名同学的身高、体重、年龄数据”,通过菜单兰中的分析选项,进行描述性分析,选择年龄、体重和身高,求最大值、最小值、方差、偏度、峰度和均值,
得到如下结果:
描述统计量
N
极小值
极大值
均值
方差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
标准误
身高
29
156.20
180.00
167.0172
33.840
-0.015
0.434
-0.146
0.845
体重
29
44.20
70.50
55.6655
46.780
0.437
0.434
0.159
有效的N(列表状态)
29
0.845
表1-1统计量描述分析
年龄
频率
百分比
有效百分比
累积百分比
有效
19.50
1
3.4
3.4
3.4
20.00
6
20.7
20.7
24.1
20.50
6
20.7
20.7
44.8
21.00
7
24.1
24.1
69.0
21.50
7
24.1
24.1
93.1
22.00
2
6.9
6.9
100.0
合计
29
100.0
100.0
表1-2年龄分布表
图1-3身高分布直方图
图1-4体重分布条形图
文字描述:
从SPSS分析结果中可以得出,有效数据共有29个。
其中年龄主要分布在19.5-22.0岁之间,其中又以20.5-21.5之间最多。
身高的极小值为156.20cm,极大值为180.00cm,均值为167.01,方差为33.84,该项指标方差过大,说明身高存在较大差异,当然极值的出现对此影响较大,从条形分布图中看出身高在165-175之间人数较多,身高的偏度为负,呈现右偏分布状态。
体重的极小值为44.20kg,极大值为70.5kg,均值为55.67kg,方差为46.78,该指标方差偏大,个体之间差异性显著,从条形图中可以看出50-60kg之间分布较多,体重的偏度为负,呈现出右偏分布状态,峰度为负,分布呈低峰态。
这些数据都可以从图表中轻易得出。
二、参数检验(在此以身高为例,其他指标分析类似)
单个样本统计量
N
均值
标准差
均值的标准误
身高
29
167.0172
5.81722
1.08023
易知该样本总体服从正态分布,从中选出吴梦琪166.20cm,熊如意166.50cm,刘晓伟170.00cm,尹传萍165.20cm共4个数据。
计算得出的平均值为166.975。
我们现在以单样本T检验为例,对身高进行参数检验。
建立原假设H0:
总体均值与检验值之间不存在显著性差异。
下面我们对此进行分析:
选择菜单【分析】→【比较均值】→【单样本t检验】得出结果如下图
单个样本检验
检验值=166.975
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
身高
0.039
28
0.969
0.04224
-2.1705
2.2550
表2-1,单样本T检验分析结果
由图表可知:
样本总体均值为167.02,标准差为5.82,均值标准误差为1.08023.样本检验值为166.975,第二列是统计量的观测值0.039;第三列是自由度;第四列是统计量观测值的双尾概率P值;第五列是样本均值与检验的差值;第六列和第七列是总体均值与原假设值差的95%的置信区间,因为167.0172在置信区间(164.8045,169.23)内,所以我们有95%的把握认为总体均值和样本均值之间不存在显著性差异。
三、非参数检验(此处以二项分布检验为例)
11人资3班共有男生14人,女生15人,这个班级的性别比例是否与通常的男女比例(总体概率为0.5)不同呢?
我们可以利用二项分布对此进行分析。
在这里假设显著性水平位0.05.进行如下操作:
得出结果如下:
二项式检验
类别
N
观察比例
检验比例
精确显著性(双侧)
精确显著性(双侧)
性别
组1
0
15
.52
.50
1.000
1.000a
组2
1
14
.48
总数
29
1.00
a.将为该检验提供了精确结果而不是MonteCarlo。
表3-1二项式检验结果分析
从表3-1中可以看出,男生共有14个,概率值为0.48,女生共有15个,概率值为.52,检验值P=0.5,显著性水平位0.05,因为1远大于显著性水平0.5,所以认为该班的男女性别分布十分接近通知男女比例(总体概率为0.5)。
四、相关分析(以身高和体测成绩为例进行相关性分析)
图4-1身高和体测成绩之间的散点图
身高
体测成绩
身高
Pearson相关性
1
.097
显著性(双侧)
.615
N
29
29
体测成绩
Pearson相关性
.097
1
显著性(双侧)
.615
N
29
29
表4-1身高和体测成绩之间的相关性分析
按【图形】→【旧对话框】→【散点图】的流程,以身高为横轴,体测成绩为纵轴,得到如上如所示的散点图,可以看出各点分布较多零散,相关性不强。
再做【分析】→【相关】→【双变量】操作,得出如4-1所示的表格,可以看出相关系数仅为0.097,相关性较弱,与上面散点图所呈现出的状态相符合。
这表明身高和体测成绩之间的相关性不大。
5.回归分析(在此以身高和体重之间的关系为例进行分析)
有科学研究表明,身高和体重存在一定得线性相关关系,在此我们以11人资3班29个样本为例为此作出分析。
选择【分析】→【回归】→【线性】进行分析,得到如下的输出结果:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
体重a
.
输入
a.已输入所有请求的变量。
b.因变量:
身高
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.847a
.717
.706
3.15356
a.预测变量:
(常量),体重。
表5-1
表5-2
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
679.007
1
679.007
68.276
.000a
残差
268.514
27
9.945
总计
947.521
28
a.预测变量:
(常量),体重。
b.因变量:
身高
从表5-2中可以看出相关系数R=0.847,即身高和体重之间存在较强的线性相关关系。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
126.939
4.886
25.982
.000
体重
.720
.087
.847
8.263
.000
a.因变量:
身高
系数Bootstrap
模型
B
Bootstrapa
偏差
标准误差
显著性水平(双侧)
93.3%置信区间
下限
上限
1
(常量)
126.939
-.719
5.924
.033
113.641
139.147
体重
.720
.014
.104
.033
.514
.962
a.Unlessotherwisenoted,bootstrapresultsarebasedon29bootstrapsamples
从上图中可以得出体重x对身高y的线性关系可以用二元线性函数表示,a=0.72,b=126.939.相应的直线方程为y=0.72x+126.939.
SPSS数据分析报告(模板二)
学生姓名:
李婷
学号:
13145201314
专业:
统计学
班级:
统计0902
指导教师:
某某女
完成日期:
201*年12月12日
关于某地区361个人旅游情况统计分析报告
一、数据介绍:
此数据来源于http:
//www.amstat.org/publications/jse/jse_data_archive.htm
本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:
年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好4代表积极性非常好);额外收入,一类变量。
通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。
。
。
以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。
二、频数分析:
基本的统计分析往往从频数分析开始。
通过频数分地区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。
Statistics
性别
N
Valid
359
Missing
0
首先,对该地区的男女性别分布进行频数分析,结果如下
性别
Frequency
Percent
ValidPercent
CumulativePercent
Valid
女
198
55.2
55.2
55.2
男
161
44.8
44.8
100.0
Total
359
100.0
100.0
表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。
其次对原有数据中的旅游的积极性进行频数分析,结果如下表:
旅游积极性
Frequency
Percent
ValidPercent
CumulativePercent
Valid
差
171
47.6
47.6
47.6
一般
79
22.0
22.0
69.6
比较好
79
22.0
22.0
91.6
好
24
6.7
6.7
98.3
非常好
6
1.7
1.7
100.0
Total
359
100.0
100.0
其次对原有数据中的是否进通道进行频数分析,结果如下表:
Statistics
通道
N
Valid
359
Missing
0
通道
Frequency
Percent
ValidPercent
CumulativePercent
Valid
没走通道
293
81.6
81.6
81.6
通道
66
18.4
18.4
100.0
Total
359
100.0
100.0
表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。
上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。
三、描述统计分析。
再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。
下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。
描述统计量
N
极小值
极大值
均值
标准差
方差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
标准误
收入
359
7.426
6250.000
1032.93021
762.523942
581442.762
1.790
.129
6.869
.257
旅游花费
359
21
1006
116.41
130.716
17086.704
3.145
.129
13.401
.257
有效的N(列表状态)
359
如表所示,以起始工资为例读取分析结果,359个人中收入最小值为7.426¥,最大值为
6250.00000¥,平均1032.9302¥,标准差为762.5239¥
偏度系数和峰度系数分别为1.790和6.869。
其他数据依此读取,则该表表明该地区旅游花费的详细分布状况。
四、探索性数据分析
(1)、交叉分析
通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。
就本数据而言,。
现以现性别与旅游积极性的列联表分析为例,读取数据(下面数据分析表为截取的一部分):
Count
CaseProcessingSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
性别*旅游积极性
359
100.0%
0
.0%
359
100.0%
性别*旅游积极性Crosstabulation
Count
旅游积极性
Total
差
一般
比较好
好
非常好
性别
女
96
47
41
12
2
198
男
75
32
38
12
4
161
Total
171
79
79
24
6
359
上联表及BarChart涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。
上表中,性别成为行向量,积极性列向量。
(2)、茎叶图
性别
CaseProcessingSummary
性别
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
收入
女
198
100.0%
0
.0%
198
100.0%
男
161
100.0%
0
.0%
161
100.0%
Descriptives
性别
Statistic
Std.Error
收入
女
Mean
1005.28562
49.514796
95%ConfidenceIntervalforMean
LowerBound
907.63853
UpperBound
1102.93272
5%TrimmedMean
957.92011
Median
937.50000
Variance
485439.577
Std.Deviation
696.734940
Minimum
7.426
Maximum
3125.000
Range
3117.574
InterquartileRange
937.563
Skewness
.896
.173
Kurtosis
.310
.344
男
Mean
1066.92791
65.993219
95%ConfidenceIntervalforMean
LowerBound
936.59779
UpperBound
1197.25802
5%TrimmedMean
986.95497
Median
937.50000
Variance
701171.907
Std.Deviation
837.360082
Minimum
58.630
Maximum
6250.000
Range
6191.370
InterquartileRange
718.750
Skewness
2.370
.191
Kurtosis
10.166
.380
收入
Stem-and-LeafPlots
收入Stem-and-LeafPlotfor
性别=女
FrequencyStem&Leaf
18.000.001111111111111111
26.000.22222222222223333333333333
17.000.44444444444555555
33.000.666666666666666666666777777777777
22.000.8889999999999999999999
13.001.0000000001111
18.001.222222222222222223
18.001.444455555555555555
4.001.7777
5.001.88888
14.002.00000111111111
.002.
4.002.5555
1.002.6
2.002.88
3.00Extremes(>=3000)
Stemwidth:
1000.000
Eachleaf:
1case(s)
收入Stem-and-LeafPlotfor
性别=男
FrequencyStem&Leaf
15.000.001111111111111
17.000.22222233333333333
13.000.4444445555555
26.000.66666666666667777777777777
19.000.8888899999999999999
13.001.0000000000011
19.001.2222222222222222223
13.001.4444555555555
2.001.77
6.001.888889
6.002.000111
12.00Extremes(>=2351)
Stemwidth:
1000.000
Eachleaf:
1case(s)
结果分析如下
收入
女男
平均数1005.285621066.92791
均数的95%可信区间(907.63853,1102.93272)(936.59779,1197.25802)
5%的调整均数957.92011986.95497
中位数937.50000937.50000
标准差696.734940837.360082
标准差485439.577701171.907
最小值7.42658.630
最大值3125.0006250.000
极差3117.5746191.370
四分位数间距937.