应用统计学实验报告..doc

上传人:b****1 文档编号:182240 上传时间:2022-10-05 格式:DOC 页数:21 大小:565.38KB
下载 相关 举报
应用统计学实验报告..doc_第1页
第1页 / 共21页
应用统计学实验报告..doc_第2页
第2页 / 共21页
应用统计学实验报告..doc_第3页
第3页 / 共21页
应用统计学实验报告..doc_第4页
第4页 / 共21页
应用统计学实验报告..doc_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

应用统计学实验报告..doc

《应用统计学实验报告..doc》由会员分享,可在线阅读,更多相关《应用统计学实验报告..doc(21页珍藏版)》请在冰豆网上搜索。

应用统计学实验报告..doc

应用统计学实验报告

《应用统计学》

实验报告

班级:

管121班

姓名:

学号:

北京建筑大学

2015年01月

21

实验1描述统计 3

一、实验目的与要求 3

二、实验原理 3

三、实验步骤 3

1.频数分析(Frequencies) 3

2.描述统计(Descriptives) 8

实验2统计推断 11

一、实验目的与要求 11

二、实验原理 11

三、实验演示内容与步骤 11

1.单个总体均值的区间估计 12

2.两个总体均值之差的区间估计 14

4.两独立样本的假设检验(两独立样本T检验) 17

5.配对样本T检验 19

实验1描述统计

一、实验目的与要求

统计分析的目的在于研究总体特征。

但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。

因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。

通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。

二、实验原理

描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。

集中趋势的特征值:

算术平均数、调和平均数、几何平均数、众数、中位数等。

其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。

离散趋势的特征值:

全距、内距、平均差、方差、标准差、标准误、离散系数等。

其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。

分布特征值:

偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。

三、实验步骤

1.频数分析(Frequencies)

实验数据1:

表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。

表2.7某班16位学生的身高数据

学号

性别

身高(cm)

学号

性别

身高(cm)

1

M

170

9

M

150

2

F

173

10

M

157

3

F

169

11

F

177

4

M

155

12

M

160

5

F

174

13

F

169

6

F

178

14

M

154

7

M

156

15

F

172

8

F

171

16

F

180

基本统计分析往往从频数分析开始。

通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。

比如,在某项调查中,想要知道被调查者的性别分布状况。

频数分析的第一个基本任务是编制频数分布表。

SPSS中的频数分布表包括的内容有:

(1)频数(Frequency)即变量值落在某个区间中的次数。

(2)百分比(Percent)即各频数占总样本数的百分比。

(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。

这里有效样本数=总样本-缺失样本数。

(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。

最终取值为百分之百。

频数分析的第二个基本任务是绘制统计图。

统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。

频数分析中常用的统计图包括:

条形图,饼图,直方图等。

频数分析的应用步骤:

在SPSS中的频数分析的实现步骤如下:

选择菜单“【文件】—>【打开】—>【数据】”在对话框中的文件类型选项中选择所有文件,找到需要分析的数据文件“SPSS数据/学生身高数据.xls”,然后选择“打开”。

如图1.1所示。

图2.1打开数据

选择菜单“【分析】—>【描述统计】—>【频率】”。

如图2.2所示

图2.2频率

确定所要分析的变量,例如身高。

在变量选择确定之后,在同一窗口上,点击“统计量”按钮,打开统计量对话框,如下图2.3所示,选择统计输出选项。

图2.3统计量子对话框

表2.1描述性统计量

统计量

身高(cm)

N

有效

16

缺失

0

表2.2Gender频数分布表

身高(cm)

频率

百分比

有效百分比

累积百分比

有效

150

1

6.3

6.3

6.3

154

1

6.3

6.3

12.5

155

1

6.3

6.3

18.8

156

1

6.3

6.3

25.0

157

1

6.3

6.3

31.3

160

1

6.3

6.3

37.5

169

2

12.5

12.5

50.0

170

1

6.3

6.3

56.3

171

1

6.3

6.3

62.5

172

1

6.3

6.3

68.8

173

1

6.3

6.3

75.0

174

1

6.3

6.3

81.3

177

1

6.3

6.3

87.5

178

1

6.3

6.3

93.8

180

1

6.3

6.3

100.0

合计

16

100.0

100.0

图2.4变量身高的条形图

图2.5变量身高的饼图

图2.6变量身高的直方图

结果分析:

由实验结果可知,该班学生的平均身高为166.56cm,其中身高为169cm的同学数量最多,身高的标准偏差为9.668cm,根据直方图可得,该班学生的身高分布不均。

2.描述统计(Descriptives)

试验数据2:

测量18台电脑笔记重量,见表2.8,对其进行描述统计量分析,并对试验结果作出说明。

表2.818台笔记本电脑重量表

序号

1

2

3

4

5

6

7

8

9

重量

1.75

1.92

1.59

1.85

1.83

1.68

1.89

1.70

1.79

序号

10

11

12

13

14

15

16

17

18

重量

1.66

1.80

1.83

2.05

1.91

1.76

1.88

1.83

1.79

SPSS的【描述】命令专门用于计算各种描述统计性统计量。

选择菜单【分析】→【描述统计】→【描述】,如图2.7所示

图2.8描述对话框

将待分析的变量移入描述性列表框,将序号、重量2个变量进行描述性统计,以观察重量与序号的关系。

Savestandardizedvaluesasvariables,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。

其变量名为相应变量名前加前缀z。

标准化计算公式:

图2.9描述对话框选项

单击【选项】按钮,如图2.9所示,选择需要计算的描述统计量。

各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。

在主对话框中单击ok执行操作。

表2.3描述统计量表

描述统计量

N

极小值

极大值

均值

标准差

序号

18

1

18

9.50

5.339

重量

18

1.59

2.05

1.8083

.10777

有效的N(列表状态)

18

结果输出与分析:

结果分析:

从实验结果中可以看出,该批次笔记本的平均质量为1.8083kg,而大部分笔记本电脑重量在1.8kg左右,占到了总台数的50%以上。

存在个别过轻或者过重的笔记本电脑产品,有可能是不合格产品。

实验2统计推断

一、实验目的与要求

1.熟悉点估计概念与操作方法

2.熟悉区间估计的概念与操作方法

3.熟练掌握T检验的SPSS操作

4.学会利用T检验方法解决身边的实际问题

二、实验原理

1.参数估计的基本原理

2.假设检验的基本原理

三、实验演示内容与步骤

1.单个总体均值的区间估计

例题:

某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为:

72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?

设α=0.05

¨打开SPSS,建立数据文件:

“某省大学生四级英语测验成绩.sav”。

这里,研究变量为:

四级英语测验平均成绩成绩,即这20个样本的成绩。

¨选择区间估计选项,方法如下:

选择菜单【分析】—>【描述统计】—>【探索】”,打开图3.1探索对话框。

¨从源变量清单中将“四级英语测验平均成绩”变量移入、因变量列表框中。

图3.1探索对话框

图3.2探索:

统计量

计算结果

表3.1案例处理摘要

案例

有效

缺失

合计

N

百分比

N

百分比

N

百分比

四级英语测验平均成绩

21

100.0%

0

.0%

21

100.0%

表3.2描述

统计量

标准误

四级英语测验平均成绩

均值

70.1905

2.05243

均值的95%置信区间

下限

65.9092

上限

74.4718

5%修整均值

70.1561

中值

70.0000

方差

88.462

标准差

9.40542

极小值

54.00

极大值

87.00

范围

33.00

四分位距

15.00

偏度

.060

.501

峰度

-.848

.972

如上表显示。

从上表“95%ConfidenceIntervalforMean”中可以得出区间估计(置信度为95%)为:

(65.9092,74.4718),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。

点估计是:

70.1905

四级英语测验平均成绩Stem-and-LeafPlot

FrequencyStem&Leaf

1.005.4

2.005.69

4.006.1224

3.006.688

3.007.024

5.007.56688

1.008.3

2.008.57

Stemwidth:

10.00

Eachleaf:

1case(s)

图3.3

2.两个总体均值之差的区间估计

例题:

分析某班级学生的高考数学成绩是否存在性别上的差异。

数据如表所示:

某班级学生的高考数学成绩

性别

数学成绩

男(n=18)

858975588680787684899995828760857580

女(n=12)

9296868378877065706570787256

¨打开SPSS,按如下图示格式输入原始数据,建立数据文件:

“工会会员工资差别.spss”。

这里,“会员”表示是否为工会会员的变量,y表示是工会会员,n表示

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 幼儿教育 > 育儿知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1