第二章SPSS基本统计分析.docx

上传人:b****6 文档编号:5078729 上传时间:2022-12-13 格式:DOCX 页数:19 大小:1.71MB
下载 相关 举报
第二章SPSS基本统计分析.docx_第1页
第1页 / 共19页
第二章SPSS基本统计分析.docx_第2页
第2页 / 共19页
第二章SPSS基本统计分析.docx_第3页
第3页 / 共19页
第二章SPSS基本统计分析.docx_第4页
第4页 / 共19页
第二章SPSS基本统计分析.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

第二章SPSS基本统计分析.docx

《第二章SPSS基本统计分析.docx》由会员分享,可在线阅读,更多相关《第二章SPSS基本统计分析.docx(19页珍藏版)》请在冰豆网上搜索。

第二章SPSS基本统计分析.docx

第二章SPSS基本统计分析

第二章:

SPSS基本统计分析

SPSS软件的基本统计计算和绘图功能主要通过Analyze菜单中的DescriptiveStatistics以及Reports来完成的。

另外,基本统计分析的报表是利用Analyze菜单中Tables制作的。

为更清楚地讨论SPSS基本统计分析,可引入实际的案例加以介绍。

以《世界500强公司》的数据为例:

✓我们想统计世界500强中,主营业务为电信的公司出现的频率怎么做?

✓我们想计算500强公司营业收入的均值、差异程度,怎么做?

●本章学习内容:

1.1数据的基本统计描述量

1.2频数分析(Frequencies)

1.3描述统计(Descriptives)

1.4探索分析(Explore)

1.5  报告输出

●具体内容:

1.1数据的基本统计描述量

表示集中趋势的统计量

总和(Sum)

所有数据的算术和

均值(Mean)

算术平均值

众数(Mode)

n个数据中出现次数最多的数

中位数(Median)

排在中间位置的数

百分位数(Percentile)

数据从小到大排序,处在k%位置的数称为第k百分位数

表示离散程度的统计量

方差(Variance)

标准差(Std.Deviation)

极差(Range)

最大值与最小值之差

四分位极差(Interquartile)

第75百分位数与第25百分位数之差

表示分布形状特征的统计量

偏度(Skewness)

接近0,对称分布;>0,右偏态;<0,左偏态。

峰度(Kurtosis)

接近0,为正态分布;>0,陡峭;<0,平缓。

1.2  频数分析(Frequencies)

1.2.1主要作用

可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。

1.2.2实例分析

打开文件《世界500强公司》,对世界500强公司数据进行频数分析:

(1)对世界500强公司主营业务进行频数分析;

(2)对世界500强公司的营业收入进行频数分析并画出直方图;

(3)对我国进入500强的公司进行频数分析。

具体操作如下:

题1. 对世界500强公司主营业务进行频数分析:

Analyze→DescriptiveStatistics→ Frequencies,打开Frequencies对话框,如下图。

4

题2.对世界500强公司的营业收入进行频数分析并画出直方图

题目分析:

由于营业收入属于数值型变量,其中每一数值都不相同,所以直接做频数分析没有意义。

应将其按数值大小分成不同区间,然后作频数分析;而这一步应首先基于对数值进行描述统计,找出最小值和最大值。

具体步骤分为描述统计、分组(通过“重新编码”(Recode))、频数分析等三步。

描述统计:

Analyze→Descriptive Statistics→Descriptives,打开如下对话框。

根据最小值和最大值,对原数据中营业收入进行重新分组:

(0-29999.9),(30000-59999.9),(60000-89999.9),(90000-119999.9),(120000-149999.9),(150000-179999.9),(180000-209999.9),(210000-)

分组(通过“重新编码”(Recode)):

Transform→Recode→IntoDifferentVariables(重新编码为新的变量)

此时我们会看到数据编辑窗口中变量栏多了一个:

收入分组。

频数分析:

现在可以对新的变量:

收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。

步骤同一。

结果如下两图。

题3:

对我国进入500强的公司进行频数分析。

(1)首先挑选出中国的公司,可以通过筛选观测量来完成。

具体操作:

Data→Select Cases,点选If对话框,然后设定“总部所在”为“中国”(总部所在=“中国”)。

将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。

见下图。

Ok之后将文件另存到桌面。

(2)对中国进入500强公司进行频数分析。

打开中国.sav文件,Analyze→Descriptive Statistics→Frequencies,打开Frequencies对话框,在charts选项中选择“BarCharts”,输出结果如下。

1.3 描述统计(Descriptives)

1.3.1  主要作用

对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。

1.3.2 实例分析

刚才已经使用过。

可对500强进行描述统计,操作后输出结果如下:

对结果的解释可参照教科书。

习题:

✓对“frequencies-舒张压.sav”文件中的数据进行频数分析(以10分组);

✓练习2

1.4 探索分析(Explore)

1.4.1主要功能:

此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。

剔除奇异值和错误数据。

探测数据的错误来源

✓人为的数据差错

✓仪器测量的误差

✓输入数据时的手误,如:

小写的“l”与“1”、“o”与“0”

数据探测的重要性

由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。

1.4.2实例分析

(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。

首先筛选出日本公司,步骤同上。

Analyze--DescriptiveStatistics--Explore 顺序单击,打开Explore 主对话框。

如图:

点击ok后,会出现输出窗口,如下:

百万美元Stem-and-Leaf Plotfor

filter_$=Selected

Frequency Stem&Leaf

33.00   1.33333333444

15.00  1. 556666666778999

 11.00  2.  00001122333

 6.00  2. 555669

2.00    3.03

 .003.

 7.00  4. 0011333

  1.00    4. 9

 12.00Extremes  (>=54997)

Stem width:

 10000.0

Eachleaf:

     1 case(s)

茎叶图从左到右分为三部分:

频数、茎和叶、茎是整数部分,叶是小数部分,Stem width表示茎宽。

每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。

例如:

从茎叶图中可以看出,25000

(2)按主营业务绘制日本500强公司的箱线图

首先用Select Cases选出500强中的所有银行业(If=”银行”)。

然后用Graphs→Boxplot,打开箱线图对话框,如图:

习题:

421/17

对“explore-合金温度测试.sav”数据文件进行探索分析,并利用Boxplot绘制新型合金的箱线图,找出其中的极端值。

1.5报告输出

作用:

对数据进行整理汇总,并作统计分析(仅举例均值、标准差、最大值及最小值),以便于阅读和分析。

1.5.1样品汇总报告(CaseSummaries)

打开文件“房屋地段与销售情况.sav”,具体操作如下:

Analyze→Reports→CaseSummaries,即会出现如下对话框。

随后可见输出结果(对所需图表右击来选择输出形式:

图-以图像形式;表-可以两种形式,图像和表格):

1.5.2行形式报告(ReportSummaries in Rows)

统计量以行的形式列出。

Analyze→Reports→ ReportSummariesinRows,即会出现如下对话框。

  房屋Page1

地段  标价 出售价格

________ ________________

城中心

Mean  3250 3330

Minimum2800 2800

Maximum 3600  3650

StdDev    328 338

近郊区

Mean  1892   1835

Minimum  1780 1650

Maximum 2250  2300

StdDev    179 245

卫星城

Mean   2064    2070

Minimum  1900  1950

Maximum  2400 2350

StdDev 197    168

远郊区

Mean 17681726

Minimum   1670  1650

Maximum   1880   1800

StdDev   96  72

GrandTotal

Mean  2227  2221

Minimum  1670   1650

Maximum 3600  3650

StdDev  627 681

1.5.3列形式报告(ReportSummariesinColumns)

操作过程和行形式报告相似

               Page  1

    标价    标价   标价出售价格 出售价格 出售价格

地段   MeanMinimum Maximum MeanMinimumMaximum

__________________________________ __________________________

城中心   3250  2800  3600  3330 2800 3650

近郊区   1892   1780 2250   1835  1650  2300

卫星城     2064  1900 2400  2070   1950 2350

远郊区   1768 1670  188017261650  1800

习题:

根据“各地区普通高等学校 (机构)教职工情况(2005年).xls”

(1)建立“各地区普通高等学校(机构) 教职工情况”的spss数据文件;

(2)对其中“正高级”人数进行描述统计;

(3)用“列形式报告”汇总文件中五种职称类型人数的均值、最大值和最小值。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 面试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1