SPSS课程设计报告南邮.docx

上传人:b****4 文档编号:12111330 上传时间:2023-04-17 格式:DOCX 页数:23 大小:292.19KB
下载 相关 举报
SPSS课程设计报告南邮.docx_第1页
第1页 / 共23页
SPSS课程设计报告南邮.docx_第2页
第2页 / 共23页
SPSS课程设计报告南邮.docx_第3页
第3页 / 共23页
SPSS课程设计报告南邮.docx_第4页
第4页 / 共23页
SPSS课程设计报告南邮.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

SPSS课程设计报告南邮.docx

《SPSS课程设计报告南邮.docx》由会员分享,可在线阅读,更多相关《SPSS课程设计报告南邮.docx(23页珍藏版)》请在冰豆网上搜索。

SPSS课程设计报告南邮.docx

SPSS课程设计报告南邮

学号:

南京邮电大学

课程设计(I)报告

题目:

SPSS的使用

班级:

姓名:

指导教师:

成绩:

南京邮电大学管理学院

课程设计指导教师成绩评定表

题  目

SPSS的使用

学生姓名

班级学号

专业

信息管理与信息系统

评分内容

评分标准

总分

评分

平时成绩

认真对待课程设计,遵守实验室规定,上机不迟到早退,不做和设计无关的事。

20

设计内容

设计内容丰富,符合大纲要求

10

界面外观漂亮、大方

10

功能符合大纲要求

10

数据分析设计正确合理

10

文档写作

文档反映设计规划分析过程

10

文档反映系统建模设计流程

10

答辩

简练、准确阐述设计内容,能准确有条理回答各种问题,系统演示顺利。

20

总评分

指导教师

评阅意见

该生对待课程设计的态度□认真□良好□一般□比较差。

课程设计的系统界面外观美工布局情况□很好□较好□一般□比较差

数据收集与处理、分析情况□很好□良好□一般□比较差

文档书写符合规划与设计流程程度□很好□良好□一般□比较差

设计演示顺利情况和答辩流畅准确情况□很好□良好□一般□比较差

 

成绩

指导教师签名

日期

1.SPSS系统概述

英文名称原为StatisticalPackageforSocialScience,即社会科学统计软件包。

涵盖了各种统计方法和模型,为统计分析用户提供全方位的统计学算法,为各种研究提供了相应的统计学方法。

提供各种表格和统计学图形,如线图、条形图和饼图等等。

SPSS可以直接将表格拷贝到word文档幻灯片之中,直接进行结果的展现。

在数据录入方面,可以直接录入,也可以把excel表格数据、文本数据导入到SPSS中进行分析,避免了拷贝错误。

在结果方面,SPSS可以直接导出为word文本、网页、excel格式,也可以将表格、交互式图形作为对象粘贴到word、ppt中,并在其中再利用SPSS对他们进行编辑。

SPSS界面友好,简单易用,使得工作变得节省时间和精力。

1.1SPSS的构成

SPSSforWindows6.0共有7个部分,包括:

Base基本统计系统、Pro.Stats专业统计系统、Adv.Stats高级统计系统、Tables制表系统、Trends趋势分析系统、Categeries项目分类分析系统和LISREL线性结构方程式模型分析系统。

1.2SPSS的功能

SPSS能通过数据统计揭示不同事物之间的联系,发现规律,被广泛应用于人文社会科学研究领域,具有强大的数据分析功能,界面友好、操作简单,广泛的应用于管理决策、市场分析、医学统计、金融等专业的统计分析。

SPSS非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。

特别适合设计调查方案、对数据进行统计分析,以及制作研究报告中的相关图表。

内含的众多技术使数据准备变得非常简单。

它可以同时打开多个数据集,方便研究时对不同数据库进行比较分析和进行数据库转换处理。

软件提供了更强大的数据管理功能帮助用户通过SPSS使用其它的应用程序和数据库。

支持Excel、文本、Dbase、Access、SAS等格式的数据文件,通过使用ODBC的数据接口,可以直接访问以结构化查询语言(SQL)为数据访问标准的数据库管理系统,通过数据库导出向导功能可以方便地将数据写入到数据库中等等。

  除了一般常见的摘要统计和行列计算,SPSS提供了广泛的基本统计分析功能。

SPSS提供了一个全新的演示图形系统,能够产生更加专业的图片。

它包括了以前版本软件中提供的所有图形,并且提供了新功能,使图形定制化生成更为容易,产生的图表分辨率更高。

SPSS软件进一步增强了高度可视化的图形构建器的功能,该演示图形系统使您更容易控制创建和编辑图表的时间,大大减少了工作量,并且,您可以一次创建一个图或表,然后使用作图模板以节省时间。

同时PDF格式的输出功能,能够让用户更好地同其它人员进行信息共享。

多维枢轴表使结果更生动,在SPSSStatistics软件中,用户可以在一个重叠图中基于不同的数值范围建立两个独立的Y轴。

通过对行、列和层进行重新排列,浏览您的表格。

找到在标准报表中可能会丢失的重要查找结果。

拆分表,一次仅显示一组,从而可以更容易地对各组进行比较。

1.3SPSS的使用方法

双击打开SPSS,然后就可以导入数据或者直接录入数据。

录入数据之后,可以通过菜单栏之类的进行相关的操作。

菜单栏里面有如下的按钮:

文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、窗口、帮助。

这些选项可以实现几乎所有的功能,我们可以通过这些选项来实现对数据的处理。

SPSS使用流程是导入数据(录入数据)——进行处理,实现统计目标——保存统计数据。

2数据文件的处理

2.1数据录入和编辑

从excel表中读取数据,点击文件,选择打开——数据,然后选择excel格式,从文件列表中选择要打开的文件。

2.2新变量计算

2.3变量筛选

我筛选健康指数大于“1”的数据,即除了偏胖的人的数据。

2.4数据文件的拆分与合并

数据文件的拆分:

2.5数据文件的存储与读取

3图形绘制

3.1条形图

从这个条形图中可以看出,我们在选取地区样本的时候保持了样本数量的一致,使得最后讨论的结果具可对比性,不存在对某个地区的样本过少或过多以至于数据不可进行对比的情况。

从这张统计图中可以看出,运用各个地方的健康指数的均值进行比较可以发现,地区代号为3的健康指数均值最大,地区代号分别是甲为1,乙为2,丙为。

3.2饼图

从这个饼图中我们能够知道,蓝色的代表偏向于肥胖的,黄色代表正常的,绿色代表偏瘦的,肥胖的还是比较多的,正常的最多,偏瘦的特少。

黄色的比重远远大于绿色和蓝色之和。

下面是对各个地区的健康饼图分布以及描述总结。

由于在条形图中我们统计了三个地区的样本数量是一样的,我们可以从上面的饼图中可以知道,根本蓝色3号地区即丙地区面积最大,可以得知丙地区的偏胖人数最多,甲地区的蓝色面积次之,乙地区的黄色是最多的,可见其正常人数最多,总而言之,可以得出结论,乙地区的健康状况最优,因为其偏瘦人数最少,偏胖人数也最少。

3.3线形图

在这个指数的均值折线图中,能够直观地看出乙地区的身体健康状况总体均值偏低,但是其均值是在正常的范围之内,然后我们可以看到丙地区的均值很高,超过了15,可以说丙地区的健康状况不太好。

3.4直方图

点击菜单栏中的分析,点击描述统计,然后选中频率,在图表中选中直方图和在

直方图上显示正态分布曲线的选项,然后把指数选进去,这样就能够描绘出各个地区身体身高状况BMI指数,然后得到值得直方图。

从上面的直方图中可以看出,整体上的BMI值分布在13.5~15之间,由此可知整体的健康指数在正常水平。

没有出现大规模的超重或偏瘦的状况。

下面的直方图是各个地区的BMI值情况,可以从这个图中看出三个地方各自的特点。

从上面可以看出,乙地区的BMI值趋向于14.25,甲略高于乙,丙高达15.25,这表明丙的健康状况不是很好,在均值中可知丙是整体上偏胖的,这些偏胖的人拉高了整体的BMI均值。

3.5散点图

从上面这个散点图可以看出,大部分数据分布在两条参考线之间,大部分的人指数在13到15之间,这是正常的范围,偏瘦的人很少,只有那么两三个,偏胖的人还是有点多的。

4基本统计分析

4.1频数统计

在统计分析各个地区身体身高发育指标的时候,需要统计其健康指数的频数情况,通过下图可知正常的有59个,肥胖的有28个,偏瘦的有3个,很明显这个统计结果符合中国的现状,整体上正常但是偏向于肥胖。

4.2描述性统计

描述统计量

N

极小值

极大值

均值

标准差

方差

峰度

统计量

统计量

统计量

统计量

统计量

统计量

统计量

标准误

指数_ZS

90

12.25

18.49

14.7593

1.16659

1.361

1.431

.503

身高_SG

90

105.20

141.00

122.6367

5.83624

34.062

1.092

.503

体重_TZ

90

17.50

32.30

22.2333

2.69836

7.281

2.555

.503

胸围_XW

90

51.00

65.80

58.4300

2.96312

8.780

-.104

.503

有效的N(列表状态)

90

从上面这张描述统计量的表格中,可以看出,健康指数方差不大,说明指数较为集中,相对于其他变量的方差而言是比较小的,身高的方差最大,可见各个地区的身高差异是比较大的。

指数的极大极小反映了身体状况的两个极值,毫无疑问的是18.49在定义中属于略微偏胖的,12.25是偏瘦,均值14.7593表示平均的情况是正常的。

4.3总体均值

案例处理摘要

案例

已包含

已排除

总计

N

百分比

N

百分比

N

百分比

指数_ZS*地区代号

90

100.0%

0

.0%

90

100.0%

报告

指数_ZS

地区代号

均值

N

标准差

dimension1

1

14.6538

30

.92924

2

14.2475

30

.84746

3

15.3767

30

1.38495

总计

14.7593

90

1.16659

通过这张表格可以知道3个地区的均值之间的对比情况,3个地区丙地区BMI值是最大,其均值超过15,属于偏胖的情况,甲乙两个都是正常,丙的标准差比较大,表示丙的数据差异较大。

三个地区总体BMI均值是14.7593,表示样本总体是正常的,但是略微偏向于偏胖的状况(正常与偏胖的临界值是15)。

4.4总体方差

描述统计量

N

极小值

极大值

标准差

方差

偏度

峰度

统计量

统计量

统计量

统计量

统计量

统计量

标准误

统计量

标准误

指数_ZS

90

12.25

18.49

1.16659

1.361

.916

.254

1.431

.503

有效的N(列表状态)

90

这张表格是反映整体的指数方差情况,总体的方差是1.361,这个值是比较小的,说明整体上BMI健康指数指数的分布差距并不大,比较集中。

4.5总体均值的置信区间

置信区间是指由样本统计量所构造的总体参数的估计区间。

在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。

置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。

置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。

这个概率被称为置信水平。

单个样本统计量

N

均值

标准差

均值的标准误

指数_ZS

90

14.7593

1.16659

.12297

单个样本检验

检验值=0

t

df

Sig.(双侧)

均值差值

差分的95%置信区间

下限

上限

指数_ZS

120.025

89

.000

14.75934

14.5150

15.0037

95%置信区间是[14.5150,15.0037],也就是说整体上三个地区有95%的概率是处于正常的体质健康情况。

对于甲乙丙三个地区身体状况研究的总结:

5回归分析

在这一部分,研究的是各国汽车的各种因素对于其耗油量的影响。

前期准备:

研究汽车三个地区的汽车样本频数:

CountryofOrigin

频率

百分比

有效百分比

累积百分比

有效

American

253

62.3

62.5

62.5

European

73

18.0

18.0

80.5

Japanese

79

19.5

19.5

100.0

合计

405

99.8

100.0

缺失

系统

1

.2

合计

406

100.0

从上面的表格中可以看出,欧洲的汽车从0加速到60km/h所花费的时间是最长的,和日本较为接近,美国汽车加速的时间是最短的。

5.1一元线性回归分析

在这一部分,选取的是汽车的质量与汽车一加仑汽油能够开的英里数的关系线性回归分析。

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.807a

.651

.650

4.622

a.预测变量:

(常量),VehicleWeight(lbs.)。

b.因变量:

MilesperGallon

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

15794.632

1

15794.632

739.503

.000a

残差

8457.943

396

21.358

总计

24252.575

397

a.预测变量:

(常量),VehicleWeight(lbs.)。

b.因变量:

MilesperGallon

在上述的表格中,可以看到R方为0.651,拟合度比较低,因为在现实中影响汽车耗油量的因素很多,但是从上面可知汽车质量对于汽车一加仑汽油能够开的距离还是有影响的。

Sig为0.000<0.05表示有显著性,在系数表中,我们看到sig值都为0,给出了回归方程的系数值。

也就是说汽车开的距离英里数=汽车质量*(-0.007)+45.492。

5.2多元线性回归分析

在这一部分,研究的是汽车的一加仑汽油能够行驶的英里数与汽车质量和发动机排量之间的关系。

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.813a

.661

.659

4.563

a.预测变量:

(常量),EngineDisplacement(cu.inches),VehicleWeight(lbs.)。

b.因变量:

MilesperGallon

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

16027.922

2

8013.961

384.881

.000a

残差

8224.653

395

20.822

总计

24252.575

397

a.预测变量:

(常量),EngineDisplacement(cu.inches),VehicleWeight(lbs.)。

b.因变量:

MilesperGallon

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

42.473

1.226

34.648

.000

VehicleWeight(lbs.)

-.005

.001

-.551

-6.738

.000

EngineDisplacement(cu.inches)

-.020

.006

-.274

-3.347

.001

a.因变量:

MilesperGallon

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

8.05

38.68

23.51

6.354

398

残差

-29.679

16.589

.000

4.552

398

标准预测值

-2.434

2.387

.000

1.000

398

标准残差

-6.504

3.635

.000

.997

398

a.因变量:

MilesperGallon

从上面的这些表格中可以看到,R方只有0.661,说明拟合度比较低,sig值小于0.05,说明汽车的质量和汽车发动机的排量对汽车一加仑汽油能够开的英里数有着显著的影响。

从系数表中,可以得到这一的公式:

汽车1加仑汽油能够行驶英里数=-0.005*汽车质量+(-0.02)*发动机排量+42.473。

系数都是负的表明,汽车的质量越小,发动机排量越小,其耗油量越小,汽车开出的距离越长。

6方差分析

6.1单因素方差分析

单因素方差分析的定义:

用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。

这部分是对各国汽车一加仑汽油能够跑英里数的研究。

研究的是汽车产出国对汽车其一加仑汽油开出距离的影响,也就是在讨论汽车各产地生产的汽车耗油量特征。

显著性<0.05,说明有国家不同,产出的汽车每加仑汽油跑的里程数有着显著的不同。

可见,美国的汽车跑的最少,日本的汽车跑的最多,欧洲的汽车居中。

日本与欧洲的差异不是很大。

6.2无重复试验的双因素方差分析

这部分讨论的是汽车的质量与汽车的马力对于汽车发动机排量的影响情况。

主体间效应的检验

因变量:

EngineDisplacement(cu.inches)

III型平方和

df

均方

F

Sig.

校正模型

4.446E6

387

11488.376

84.543

.000

截距

3791204.390

1

3791204.390

27899.459

.000

汽车质量

471787.576

296

1593.877

11.729

.000

马力

22181.176

37

599.491

4.412

.004

误差

1630.657

12

135.888

总计

1.966E7

400

校正的总计

4447632.144

399

a.R方=1.000(调整R方=.988)

从上表中可以看到,R值为0.998,接近于1,表明拟合度很高,sig值都小于0.05(Sig为F检验得出的p值,Sig<0.05.说明差异显著),说明汽车质量和汽车的马力对于汽车发动机的排量影响非常显著。

对于汽车各国汽车发动机排量和1加仑汽油能够行驶英里数的研究总结:

6.3重复试验的双因素方差分析

这一部分选取的是血清中白蛋白和球蛋白含量比在蒸馏水ph值与铜硫酸浓度值不同时的表现情况的数据,实验对于每种水的ph值和铜硫酸浓度的组合做了两次实验,根据在网络中寻找到的数据,我进行了数据录入。

这个数据符合双因素的要求,符合重复实验的要求,所以可以进行重复实验的双因素方差分析。

点击分析,选择一般线性分析,一般线性模型,重复度量,群体内部变量是水的ph值,因子是铜硫酸浓度值。

描述性统计量

铜硫酸浓度

均值

标准偏差

N

水的ph1

dimension1

1.00

3.4500

.07071

2

2.00

2.3500

.07071

2

3.00

2.0500

.07071

2

总计

2.6167

.66156

6

水的ph2

dimension1

1.00

2.5500

.07071

2

2.00

2.0500

.07071

2

3.00

1.9500

.07071

2

总计

2.1833

.29269

6

水的ph3

dimension1

1.00

2.0000

.00000

2

2.00

1.4500

.07071

2

3.00

1.4000

.28284

2

总计

1.6167

.32506

6

水的ph4

dimension1

1.00

1.4000

.00000

2

2.00

.7500

.07071

2

3.00

.3000

.00000

2

总计

.8167

.49565

6

上表是在不同水的ph值下,铜硫酸浓度不同的情况下,血清中蛋白质的含量比的均值。

多变量检验c

效应

F

假设df

误差df

Sig.

水的ph

Pillai的跟踪

1.000

714.148a

3.000

1.000

.027

Wilks的Lambda

.000

714.148a

3.000

1.000

.027

Hotelling的跟踪

2142.444

714.148a

3.000

1.000

.027

Roy的最大根

2142.444

714.148a

3.000

1.000

.027

水的ph*铜硫酸浓度

Pillai的跟踪

1.806

6.213

6.000

4.000

.049

Wilks的Lambda

.005

4.429a

6.000

2.000

.196

Hotelling的跟踪

37.556

.000

6.000

.000

.

Roy的最大根

32.454

21.636b

3.000

2.000

.045

a.精确统计量

b.该统计量是F的上限,它产生了一个关于显著性级别的下限。

c.设计:

截距+铜硫酸浓度

主体内设计:

水的ph

从上表可知,ph值和铜硫酸浓度不同,血清中白蛋白和球蛋白含量比95%置信区间是不重合的。

而且在各种情况下,标准误差很小。

主体内效应的检验

度量:

MEASURE_1

III型平方和

df

均方

F

Sig.

水的ph

采用的球形度

10.885

3

3.628

343.737

.000

Greenhouse-Geisser

10.885

1.576

6.905

343.737

.000

Huynh-Feldt

10.885

3.000

3.628

343.737

.000

下限

10.885

1.000

10.885

343.737

.000

水的ph*铜硫酸浓度

采用的球形度

.530

6

.088

8.368

.003

Greenhouse-Geisser

.530

3.153

.168

8.368

.024

Huynh-Feldt

.530

6.000

.088

8.368

.003

下限

.530

2.000

.265

8.368

.059

误差(水的ph)

采用的球形度

.095

9

.011

Greenhouse-Geisser

.095

4.729

.020

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1