spss的数据分析报告.docx
《spss的数据分析报告.docx》由会员分享,可在线阅读,更多相关《spss的数据分析报告.docx(25页珍藏版)》请在冰豆网上搜索。
spss的数据分析报告
Frequency
Percent
Valid Percent
Cumulative
Percent
Valid Female
Male
Total
216
258
474
45.6
54.4
100.0
45.6
54.4
100.0
45.6
100.0
关于某公司 474 名职工综合状况的统计分析报告
一、数据介绍:
本次分析的数据为某公司 474 名职工状况统计表,其中共包含十一变量,分别是:
id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等
级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以
前工作经历<月>),minority(民族类型),age(年龄)。
通过运用 spss 统计软件,对变量进行
频数分析、描述性统计、方差分析、相关分析、。
。
。
以了解该公司职工上述方面的综合状况,
并分析个变量的分布特点及相互间的关系。
二、数据分析
1、 频数分析。
基本的统计分析往往从频数分析开始。
通过频数分析能够了解变量的取值
状况,对把握数据的分布特征非常有用。
此次分析利用了某公司 474 名职工基本状况
的统计数据表,在 gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,
从而了解该公司职工的男女职工数量、受教育状况的基本分布。
Statistics
Educational
Gender
Level (years)
N
Valid 474 474
Missing00
首先,对该公司的男女性别分布进行频数分析,结果如下:
Gender
上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和
54.4%,该公司职工男女数量差距不大,男性略多于女性。
其次对原有数据中的受教育程度进行频数分析,结果如下表 :
Educational Level (years)
Cumulative
FrequencyPercentValid Percent
Percent
Valid85311.211.211.2
1219040.140.151.3
1461.31.352.5
1511624.524.577.0
165912.412.489.5
17112.32.391.8
1891.91.993.7
19275.75.799.4
202.4.499.8
211.2.2100.0
Total474100.0100.0
N
Minimu
m
Maximu
m
Mean
Std.
Deviation
Skewness
Kurtosis
Statisti
c
Statistic
Statistic
Statistic
Statistic
Statisti
c
Std.
Error
Statisti
c
Std.
Error
Educationa
l Level
(years)
474
8
21
13.49
2.885
-.114
.112
-.265
.224
Current
Salary
474
$15,750
$135,000
$34,419.5
7
$17,075.66
1
2.125
.112
5.378
.224
Beginning
Salary
474
$9,000
$79,980
$17,016.0
9
$7,870.638
2.853
.112
12.390
.224
Descriptive Ststistics
Histogram
200
150
100
50
0
Mean = 13.49
Std. Dev. = 2.885
N = 474
7.5
10
12.5
15
17.5
20
22.5
Educational Level (years)
上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,
为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。
且接受过高
于20年的教育的人数只有1人,比例很低。
2、 描述统计分析。
再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体
分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过
计算基本描述统计的方法来实现。
下面就对各个变量进行描述统计分析,得到它们的
均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。
Previous
Experience
(months)
474
0
476
95.86
104.586
1.510
.112
1.696
.224
Months
since Hire
474
63
98
81.11
10.061
-.053
.112
-1.153
.224
如表所示,以起始工资为例读取分析结果,474名职工的起始工资最小值为$9000 ,最大
值为$79980,平均起始工资为$17016,标准差为$7870.638,偏度系数和峰度系数分别
为2.853和12.390。
其他数据依此读取,则该表表明474名职工的受教育水平、起始工资、
现工资、先前工作经验、现在工作经验的详细分布状况。
3、 Exploratory data analysis。
(1)交叉分析。
通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变
量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进
而分析变量之间的相互影响和关系。
就本数据而言,需要了解现工资与性别、年龄、受教
育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。
现以现工资
与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):
Current Salary * Employment Category Crosstabulation
Count
Employment Category
ClericalCustodialManagerTotal
Current
Salary
$15,750 1 0 0 1
$15,900 1 0 0 1
$16,200 3 0 0 3
$16,350 1 0 0 1
$16,500 1 0 0 1
$16,650 1 0 0 1
$16,800 1 0 0 1
$16,950 3 0 0 3
$17,100 2 0 0 2
$17,250 1 0 0 1
$17,400 2 0 0 2
$17,700 1 0 0 1
$18,150 2 0 0 2
$18,450 1 0 0 1
$18,750 1 0 0 1
$19,200 2 0 0 2
$19,650 6 0 0 6
$19,800 1 0 0 1
$19,950 2 0 0 2
Sum of
Squares
df
Mean Square
F
Sig.
Between Groups
Within Groups
Total
1E+011
2E+010
1E+011
89
384
473
1370635995
41484093.53
33.040
.000
Bar Chart
12
10
8
6
4
2
0
Employment Category
Clerical
Custodial
Manager
$
1
5,
7
5
0
$
1
7,
4
0
0
$
2
0,
4
0
0
$
2
1,
9
0
0
$
2
3,
4
0
0
$
2
4,
9
0
0
$
2
6,
4
0
0
$
2
7,
9
0
0
$
2
9,
2
5
0
$
3
0,
4
5
0
$
3
2,
1
0
0
$
3
3,
9
0
0
$
3
6,
0
0
0
$
3
8,
8
5
0
$
0
4
1,
5
5
$
4
5,
1
5
0
$
5
0,
0
0
0
$
5
4,
8
7
5
$
5
8,
7
5
0
$
6
6,
0
0
0
$
7
2,
5
0
0
$
8
3,
7
5
0
$
1
3
5,
0
0
0
Current Salary
0
上联表及 Bar Chart 涉及两个变量,即现工资与职务级别的二维交叉,反映了在不同的职务
级别下现工资的分布情况。
上表中,职务级别成为行向量,现工资称为列向量。
(2)单因素方差分析。
单因素分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。
下面我
们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法
研究受教育水平和起始工资对现工资的影响进行分析。
分析结果如下:
ANOVA
上表是起始工资对现工资的单因素方差分析结果。
可以看出:
F 统计量的观测值为
33.040,对应的概率 P 值近似等于 0,如果显著性水平为 0.05,由于概率值 P 小于显著性
水平 q,则应拒绝原假设,认为不同的起始工资对现工资产生了显著影响。
Current Salary
Beginning
Salary
Months
since Hire
Previous
E