SPSS数据分析报告金典模板三篇.docx

资源描述

SPSS数据分析报告金典模板三篇.docx

《SPSS数据分析报告金典模板三篇.docx》由会员分享，可在线阅读，更多相关《SPSS数据分析报告金典模板三篇.docx（48页珍藏版）》请在冰豆网上搜索。

SPSS数据分析报告金典模板三篇.docx

SPSS数据分析报告金典模板三篇

SPSS数据分析报告（模板一）

学院：

　　　　经济管理学院

专业、班级：

**人资*班

学生姓名：

某某人

学号：

131********520

二○一*年十一月十一日

SPSS数据分析报告

第一部分：

原始资料和数据

资料来源：

华东交通大学经济管理学院11级人力资源管理3班29名同学实际情况

编号

姓名

性别

学科背景

年龄

身高

体重

体测成绩

吕鑫

文科

20.5

164.2

54.2

王阳

文科

158.3

46.2

洪华阳

理科

171

57.2

刘卫秀

理科

165.5

吴梦琦

文科

166.2

韩玮

文科

164.3

汤丽娟

文科

162.8

48.2

江桂英

理科

157.2

44.2

熊如意

文科

166.5

54.5

余婵

文科

19.5

156.2

45.5

彭茜

文科

165.4

52.4

赵丹

文科

20.5

174.3

55.6

安怡君

文科

175

56.2

武阳帆

文科

20.5

162.4

55.5

倪亚萍

文科

157.5

48.6

张明辉

文科

21.5

170

张春旭

理科

20.5

168.5

57.8

刘晓伟

文科

170.5

59.5

黄炜

文科

20.5

171

62.2

李强

文科

20.5

167.5

56.5

温明煌

文科

21.5

170

雷翀翀

理科

168.5

陈志强

文科

180

70.4

尹传萍

文科

21.5

165.2

55.6

郑南

理科

21.5

168.5

55.9

幸恒恒

文科

21.5

168.5

李拓

理科

21.5

172

68.1

张发宝

理科

160.5

52.5

杨涛

理科

21.5

176

70.5

原始资料和数据（SPSS软件截图）：

图1变量视图

图2数据视图

第二部分：

数据分析

一、描述性分析

打开文件“11人资3班29名同学的身高、体重、年龄数据”，通过菜单兰中的分析选项，进行描述性分析，选择年龄、体重和身高，求最大值、最小值、方差、偏度、峰度和均值，

得到如下结果：

描述统计量

极小值

极大值

均值

方差

偏度

峰度

统计量

标准误

统计量

标准误

身高

156.20

180.00

167.0172

33.840

-0.015

0.434

-0.146

0.845

体重

44.20

70.50

55.6655

46.780

0.437

0.434

0.159

有效的N（列表状态）

0.845

表1-1统计量描述分析

年龄

频率

百分比

有效百分比

累积百分比

有效

19.50

3.4

20.00

20.7

24.1

20.50

20.7

44.8

21.00

24.1

69.0

21.50

24.1

93.1

22.00

6.9

100.0

合计

100.0

表1-2年龄分布表

图1-3身高分布直方图

图1-4体重分布条形图

文字描述：

从SPSS分析结果中可以得出，有效数据共有29个。

其中年龄主要分布在19.5-22.0岁之间，其中又以20.5-21.5之间最多。

身高的极小值为156.20cm，极大值为180.00cm，均值为167.01，方差为33.84，该项指标方差过大，说明身高存在较大差异，当然极值的出现对此影响较大，从条形分布图中看出身高在165-175之间人数较多，身高的偏度为负，呈现右偏分布状态。

体重的极小值为44.20kg，极大值为70.5kg，均值为55.67kg，方差为46.78，该指标方差偏大，个体之间差异性显著，从条形图中可以看出50-60kg之间分布较多，体重的偏度为负，呈现出右偏分布状态，峰度为负，分布呈低峰态。

这些数据都可以从图表中轻易得出。

二、参数检验（在此以身高为例，其他指标分析类似）

单个样本统计量

均值

标准差

均值的标准误

身高

167.0172

5.81722

1.08023

易知该样本总体服从正态分布，从中选出吴梦琪166.20cm，熊如意166.50cm，刘晓伟170.00cm，尹传萍165.20cm共4个数据。

计算得出的平均值为166.975。

我们现在以单样本T检验为例，对身高进行参数检验。

建立原假设H0：

总体均值与检验值之间不存在显著性差异。

下面我们对此进行分析：

选择菜单【分析】→【比较均值】→【单样本t检验】得出结果如下图

单个样本检验

检验值=166.975

Sig.（双侧）

均值差值

差分的95%置信区间

下限

上限

身高

0.039

0.969

0.04224

-2.1705

2.2550

表2-1，单样本T检验分析结果

由图表可知：

样本总体均值为167.02，标准差为5.82，均值标准误差为1.08023.样本检验值为166.975，第二列是统计量的观测值0.039；第三列是自由度；第四列是统计量观测值的双尾概率P值；第五列是样本均值与检验的差值；第六列和第七列是总体均值与原假设值差的95%的置信区间，因为167.0172在置信区间（164.8045,169.23）内，所以我们有95%的把握认为总体均值和样本均值之间不存在显著性差异。

三、非参数检验（此处以二项分布检验为例）

11人资3班共有男生14人，女生15人，这个班级的性别比例是否与通常的男女比例（总体概率为0.5）不同呢？

我们可以利用二项分布对此进行分析。

在这里假设显著性水平位0.05.进行如下操作：

得出结果如下：

二项式检验

类别

观察比例

检验比例

精确显著性（双侧）

性别

组1

.52

.50

1.000

1.000a

组2

.48

总数

1.00

a.将为该检验提供了精确结果而不是MonteCarlo。

表3-1二项式检验结果分析

从表3-1中可以看出，男生共有14个，概率值为0.48，女生共有15个，概率值为.52，检验值P=0.5，显著性水平位0.05，因为1远大于显著性水平0.5，所以认为该班的男女性别分布十分接近通知男女比例（总体概率为0.5）。

四、相关分析（以身高和体测成绩为例进行相关性分析）

图4-1身高和体测成绩之间的散点图

身高

体测成绩

身高

Pearson相关性

.097

显著性（双侧）

.615

体测成绩

Pearson相关性

.097

显著性（双侧）

.615

表4-1身高和体测成绩之间的相关性分析

按【图形】→【旧对话框】→【散点图】的流程，以身高为横轴，体测成绩为纵轴，得到如上如所示的散点图，可以看出各点分布较多零散，相关性不强。

再做【分析】→【相关】→【双变量】操作，得出如4-1所示的表格，可以看出相关系数仅为0.097，相关性较弱，与上面散点图所呈现出的状态相符合。

这表明身高和体测成绩之间的相关性不大。

5.回归分析（在此以身高和体重之间的关系为例进行分析）

有科学研究表明，身高和体重存在一定得线性相关关系，在此我们以11人资3班29个样本为例为此作出分析。

选择【分析】→【回归】→【线性】进行分析，得到如下的输出结果：

输入／移去的变量b

模型

输入的变量

移去的变量

方法

体重a

输入

a.已输入所有请求的变量。

b.因变量:

身高

模型汇总

模型

R方

调整R方

标准估计的误差

.847a

.717

.706

3.15356

a.预测变量:

（常量）,体重。

表5-1

表5-2

Anovab

模型

平方和

均方

Sig.

回归

679.007

68.276

.000a

残差

268.514

9.945

总计

947.521

a.预测变量:

（常量）,体重。

b.因变量:

身高

从表5-2中可以看出相关系数R=0.847，即身高和体重之间存在较强的线性相关关系。

系数a

模型

非标准化系数

标准系数

Sig.

标准误差

试用版

（常量）

126.939

4.886

25.982

.000

体重

.720

.087

.847

8.263

.000

a.因变量:

身高

系数Bootstrap

模型

Bootstrapa

偏差

标准误差

显著性水平（双侧）

93.3%置信区间

下限

上限

（常量）

126.939

-.719

5.924

.033

113.641

139.147

体重

.720

.014

.104

.033

.514

.962

a.Unlessotherwisenoted,bootstrapresultsarebasedon29bootstrapsamples

从上图中可以得出体重x对身高y的线性关系可以用二元线性函数表示，a=0.72，b=126.939.相应的直线方程为y=0.72x+126.939.

SPSS数据分析报告（模板二）

学生姓名：

李婷

学号：

13145201314

专业：

统计学

班级：

统计0902

指导教师：

某某女

完成日期：

201*年12月12日

关于某地区361个人旅游情况统计分析报告

一、数据介绍：

此数据来源于http:

//www.amstat.org/publications/jse/jse_data_archive.htm

本次分析的数据为某地区361个人旅游情况状况统计表，其中共包含七变量，分别是：

年龄，为三类变量；性别，为二类变量（0代表女，1代表男）；收入，为一类变量；旅游花费，为一类变量；通道，为二类变量（0代表没走通道，1代表走通道）；旅游的积极性，为三类变量（0代表积极性差，1代表积极性一般，2代表积极性比较好，3代表积极性好4代表积极性非常好）；额外收入,一类变量。

通过运用spss统计软件，对变量进行频数分析、描述性统计、方差分析、相关分析、。

。

以了解该地区上述方面的综合状况，并分析个变量的分布特点及相互间的关系。

二、频数分析：

基本的统计分析往往从频数分析开始。

通过频数分地区359个人旅游基本状况的统计数据表，在性别、旅游的积极性不同的状况下的频数分析，从而了解该地区的男女职工数量、不同积极性况的基本分布。

Statistics

性别

Valid

359

Missing

首先，对该地区的男女性别分布进行频数分析，结果如下

性别

Frequency

Percent

ValidPercent

CumulativePercent

Valid

女

198

55.2

男

161

44.8

100.0

Total

359

100.0

表说明，在该地区被调查的359个人中，有198名女性，161名男性，男女比例分别为44.8%和55.2%，该公司职工男女数量差距不大，女性略多于男性。

其次对原有数据中的旅游的积极性进行频数分析，结果如下表：

旅游积极性

Frequency

Percent

ValidPercent

CumulativePercent

Valid

差

171

47.6

一般

22.0

69.6

比较好

22.0

91.6

好

6.7

98.3

非常好

1.7

100.0

Total

359

100.0

其次对原有数据中的是否进通道进行频数分析，结果如下表：

Statistics

通道

Valid

359

Missing

通道

Frequency

Percent

ValidPercent

CumulativePercent

Valid

没走通道

293

81.6

通道

18.4

100.0

Total

359

100.0

表说明，在该地区被调查的359个人中，有没走通道的占81.6%，占绝大多数。

上表及其直方图说明，被调查的359个人中，对与旅游积极性差的组频数最高的，为171人数的47.6%，其次为积极性一般和比较好的，占比例都为22.0%，积性为好的和非常好的比例比较低，分别为24人和6人，占总体的比例为6.7%和1.7%。

三、描述统计分析。

再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后，我们还需要对数据中的其他变量特征有更为精确的认识，这就需要通过计算基本描述统计的方法来实现。

下面就对各个变量进行描述统计分析，得到它们的均值、标准差、片度峰度等数据，以进一步把我数据的集中趋势和离散趋势。

描述统计量

极小值

极大值

均值

标准差

方差

偏度

峰度

统计量

标准误

统计量

标准误

收入

359

7.426

6250.000

1032.93021

762.523942

581442.762

1.790

.129

6.869

.257

旅游花费

359

1006

116.41

130.716

17086.704

3.145

.129

13.401

.257

有效的N（列表状态）

359

如表所示，以起始工资为例读取分析结果，359个人中收入最小值为7.426￥，最大值为

6250.00000￥，平均1032.9302￥，标准差为762.5239￥

偏度系数和峰度系数分别为1.790和6.869。

其他数据依此读取，则该表表明该地区旅游花费的详细分布状况。

四、探索性数据分析

（1）、交叉分析

通过频数分析能够掌握单个变量的数据分布情况，但是在实际分析中，不仅要了解单个变量的分布特征，还要分析多个变量不同取值下的分布，掌握多个变量的联合分布特征，进而分析变量之间的相互影响和关系。

就本数据而言，。

现以现性别与旅游积极性的列联表分析为例，读取数据（下面数据分析表为截取的一部分）：

Count

CaseProcessingSummary

Cases

Valid

Missing

Total

Percent

性别*旅游积极性

359

100.0%

.0%

359

100.0%

性别*旅游积极性Crosstabulation

Count

旅游积极性

Total

差

一般

比较好

好

非常好

性别

女

198

男

161

Total

171

359

上联表及BarChart涉及两个变量，即性别与积极性的二维交叉，反映了在不同的性别对于旅游积极性分布情况。

上表中，性别成为行向量，积极性列向量。

（2）、茎叶图

性别

CaseProcessingSummary

性别

Cases

Valid

Missing

Total

Percent

收入

女

198

100.0%

.0%

198

100.0%

男

161

100.0%

.0%

161

100.0%

Descriptives

性别

Statistic

Std.Error

收入

女

Mean

1005.28562

49.514796

95%ConfidenceIntervalforMean

LowerBound

907.63853

UpperBound

1102.93272

5%TrimmedMean

957.92011

Median

937.50000

Variance

485439.577

Std.Deviation

696.734940

Minimum

7.426

Maximum

3125.000

Range

3117.574

InterquartileRange

937.563

Skewness

.896

.173

Kurtosis

.310

.344

男

Mean

1066.92791

65.993219

95%ConfidenceIntervalforMean

LowerBound

936.59779

UpperBound

1197.25802

5%TrimmedMean

986.95497

Median

937.50000

Variance

701171.907

Std.Deviation

837.360082

Minimum

58.630

Maximum

6250.000

Range

6191.370

InterquartileRange

718.750

Skewness

2.370

.191

Kurtosis

10.166

.380

收入

Stem-and-LeafPlots

收入Stem-and-LeafPlotfor

性别=女

FrequencyStem&Leaf

18.000.001111111111111111

26.000.22222222222223333333333333

17.000.44444444444555555

33.000.666666666666666666666777777777777

22.000.8889999999999999999999

13.001.0000000001111

18.001.222222222222222223

18.001.444455555555555555

4.001.7777

5.001.88888

14.002.00000111111111

.002.

4.002.5555

1.002.6

2.002.88

3.00Extremes（>=3000）

Stemwidth:

1000.000

Eachleaf:

1case（s）

收入Stem-and-LeafPlotfor

性别=男

FrequencyStem&Leaf

15.000.001111111111111

17.000.22222233333333333

13.000.4444445555555

26.000.66666666666667777777777777

19.000.8888899999999999999

13.001.0000000000011

19.001.2222222222222222223

13.001.4444555555555

2.001.77

6.001.888889

6.002.000111

12.00Extremes（>=2351）

Stemwidth:

1000.000

Eachleaf:

1case（s）

结果分析如下

收入

女男

平均数1005.285621066.92791

均数的95%可信区间（907.63853，1102.93272）（936.59779，1197.25802）

5%的调整均数957.92011986.95497

中位数937.50000937.50000

标准差696.734940837.360082

标准差485439.577701171.907

最小值7.42658.630

最大值3125.0006250.000

极差3117.5746191.370

四分位数间距937.

展开阅读全文