SPSS课程设计报告南邮Word文档格式.docx
《SPSS课程设计报告南邮Word文档格式.docx》由会员分享,可在线阅读,更多相关《SPSS课程设计报告南邮Word文档格式.docx(21页珍藏版)》请在冰豆网上搜索。
专业
信息管理与信息系统
评分内容
评分标准
总分
评分
平时成绩
认真对待课程设计,遵守实验室规定,上机不迟到早退,不做和设计无关的事。
20
设计内容
设计内容丰富,符合大纲要求
10
界面外观漂亮、大方
功能符合大纲要求
数据分析设计正确合理
文档写作
文档反映设计规划分析过程
文档反映系统建模设计流程
答辩
简练、准确阐述设计内容,能准确有条理回答各种问题,系统演示顺利。
总评分
指导教师
评阅意见
该生对待课程设计的态度□认真□良好□一般□比较差。
课程设计的系统界面外观美工布局情况□很好□较好□一般□比较差
数据收集与处理、分析情况□很好□良好□一般□比较差
文档书写符合规划与设计流程程度□很好□良好□一般□比较差
设计演示顺利情况和答辩流畅准确情况□很好□良好□一般□比较差
成绩
指导教师签名
日期
1.SPSS系统概述
英文名称原为StatisticalPackageforSocialScience,即社会科学统计软件包。
涵盖了各种统计方法和模型,为统计分析用户提供全方位的统计学算法,为各种研究提供了相应的统计学方法。
提供各种表格和统计学图形,如线图、条形图和饼图等等。
SPSS可以直接将表格拷贝到word文档幻灯片之中,直接进行结果的展现。
在数据录入方面,可以直接录入,也可以把excel表格数据、文本数据导入到SPSS中进行分析,避免了拷贝错误。
在结果方面,SPSS可以直接导出为word文本、网页、excel格式,也可以将表格、交互式图形作为对象粘贴到word、ppt中,并在其中再利用SPSS对他们进行编辑。
SPSS界面友好,简单易用,使得工作变得节省时间和精力。
1.1SPSS的构成
SPSSforWindows6.0共有7个部分,包括:
Base基本统计系统、Pro.Stats专业统计系统、Adv.Stats高级统计系统、Tables制表系统、Trends趋势分析系统、Categeries项目分类分析系统和LISREL线性结构方程式模型分析系统。
1.2SPSS的功能
SPSS能通过数据统计揭示不同事物之间的联系,发现规律,被广泛应用于人文社会科学研究领域,具有强大的数据分析功能,界面友好、操作简单,广泛的应用于管理决策、市场分析、医学统计、金融等专业的统计分析。
SPSS非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。
特别适合设计调查方案、对数据进行统计分析,以及制作研究报告中的相关图表。
内含的众多技术使数据准备变得非常简单。
它可以同时打开多个数据集,方便研究时对不同数据库进行比较分析和进行数据库转换处理。
软件提供了更强大的数据管理功能帮助用户通过SPSS使用其它的应用程序和数据库。
支持Excel、文本、Dbase、Access、SAS等格式的数据文件,通过使用ODBC的数据接口,可以直接访问以结构化查询语言(SQL)为数据访问标准的数据库管理系统,通过数据库导出向导功能可以方便地将数据写入到数据库中等等。
除了一般常见的摘要统计和行列计算,SPSS提供了广泛的基本统计分析功能。
SPSS提供了一个全新的演示图形系统,能够产生更加专业的图片。
它包括了以前版本软件中提供的所有图形,并且提供了新功能,使图形定制化生成更为容易,产生的图表分辨率更高。
SPSS软件进一步增强了高度可视化的图形构建器的功能,该演示图形系统使您更容易控制创建和编辑图表的时间,大大减少了工作量,并且,您可以一次创建一个图或表,然后使用作图模板以节省时间。
同时PDF格式的输出功能,能够让用户更好地同其它人员进行信息共享。
多维枢轴表使结果更生动,在SPSSStatistics软件中,用户可以在一个重叠图中基于不同的数值范围建立两个独立的Y轴。
通过对行、列和层进行重新排列,浏览您的表格。
找到在标准报表中可能会丢失的重要查找结果。
拆分表,一次仅显示一组,从而可以更容易地对各组进行比较。
1.3SPSS的使用方法
双击打开SPSS,然后就可以导入数据或者直接录入数据。
录入数据之后,可以通过菜单栏之类的进行相关的操作。
菜单栏里面有如下的按钮:
文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、窗口、帮助。
这些选项可以实现几乎所有的功能,我们可以通过这些选项来实现对数据的处理。
SPSS使用流程是导入数据(录入数据)——进行处理,实现统计目标——保存统计数据。
2数据文件的处理
2.1数据录入和编辑
从excel表中读取数据,点击文件,选择打开——数据,然后选择excel格式,从文件列表中选择要打开的文件。
2.2新变量计算
略
2.3变量筛选
我筛选健康指数大于“1”的数据,即除了偏胖的人的数据。
2.4数据文件的拆分与合并
数据文件的拆分:
2.5数据文件的存储与读取
3图形绘制
3.1条形图
从这个条形图中可以看出,我们在选取地区样本的时候保持了样本数量的一致,使得最后讨论的结果具可对比性,不存在对某个地区的样本过少或过多以至于数据不可进行对比的情况。
从这张统计图中可以看出,运用各个地方的健康指数的均值进行比较可以发现,地区代号为3的健康指数均值最大,地区代号分别是甲为1,乙为2,丙为。
3.2饼图
从这个饼图中我们能够知道,蓝色的代表偏向于肥胖的,黄色代表正常的,绿色代表偏瘦的,肥胖的还是比较多的,正常的最多,偏瘦的特少。
黄色的比重远远大于绿色和蓝色之和。
下面是对各个地区的健康饼图分布以及描述总结。
由于在条形图中我们统计了三个地区的样本数量是一样的,我们可以从上面的饼图中可以知道,根本蓝色3号地区即丙地区面积最大,可以得知丙地区的偏胖人数最多,甲地区的蓝色面积次之,乙地区的黄色是最多的,可见其正常人数最多,总而言之,可以得出结论,乙地区的健康状况最优,因为其偏瘦人数最少,偏胖人数也最少。
3.3线形图
在这个指数的均值折线图中,能够直观地看出乙地区的身体健康状况总体均值偏低,但是其均值是在正常的范围之内,然后我们可以看到丙地区的均值很高,超过了15,可以说丙地区的健康状况不太好。
3.4直方图
点击菜单栏中的分析,点击描述统计,然后选中频率,在图表中选中直方图和在
直方图上显示正态分布曲线的选项,然后把指数选进去,这样就能够描绘出各个地区身体身高状况BMI指数,然后得到值得直方图。
从上面的直方图中可以看出,整体上的BMI值分布在13.5~15之间,由此可知整体的健康指数在正常水平。
没有出现大规模的超重或偏瘦的状况。
下面的直方图是各个地区的BMI值情况,可以从这个图中看出三个地方各自的特点。
从上面可以看出,乙地区的BMI值趋向于14.25,甲略高于乙,丙高达15.25,这表明丙的健康状况不是很好,在均值中可知丙是整体上偏胖的,这些偏胖的人拉高了整体的BMI均值。
3.5散点图
从上面这个散点图可以看出,大部分数据分布在两条参考线之间,大部分的人指数在13到15之间,这是正常的范围,偏瘦的人很少,只有那么两三个,偏胖的人还是有点多的。
4基本统计分析
4.1频数统计
在统计分析各个地区身体身高发育指标的时候,需要统计其健康指数的频数情况,通过下图可知正常的有59个,肥胖的有28个,偏瘦的有3个,很明显这个统计结果符合中国的现状,整体上正常但是偏向于肥胖。
4.2描述性统计
描述统计量
N
极小值
极大值
均值
标准差
方差
峰度
统计量
标准误
指数_ZS
90
12.25
18.49
14.7593
1.16659
1.361
1.431
.503
身高_SG
105.20
141.00
122.6367
5.83624
34.062
1.092
体重_TZ
17.50
32.30
22.2333
2.69836
7.281
2.555
胸围_XW
51.00
65.80
58.4300
2.96312
8.780
-.104
有效的N(列表状态)
从上面这张描述统计量的表格中,可以看出,健康指数方差不大,说明指数较为集中,相对于其他变量的方差而言是比较小的,身高的方差最大,可见各个地区的身高差异是比较大的。
指数的极大极小反映了身体状况的两个极值,毫无疑问的是18.49在定义中属于略微偏胖的,12.25是偏瘦,均值14.7593表示平均的情况是正常的。
4.3总体均值
案例处理摘要
案例
已包含
已排除
总计
百分比
指数_ZS*地区代号
100.0%
.0%
报告
地区代号
dimension1
1
14.6538
30
.92924
2
14.2475
.84746
3
15.3767
1.38495
通过这张表格可以知道3个地区的均值之间的对比情况,3个地区丙地区BMI值是最大,其均值超过15,属于偏胖的情况,甲乙两个都是正常,丙的标准差比较大,表示丙的数据差异较大。
三个地区总体BMI均值是14.7593,表示样本总体是正常的,但是略微偏向于偏胖的状况(正常与偏胖的临界值是15)。
4.4总体方差
偏度
.916
.254
这张表格是反映整体的指数方差情况,总体的方差是1.361,这个值是比较小的,说明整体上BMI健康指数指数的分布差距并不大,比较集中。
4.5总体均值的置信区间
置信区间是指由样本统计量所构造的总体参数的估计区间。
在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。
置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。
置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。
这个概率被称为置信水平。
单个样本统计量
均值的标准误
.12297
单个样本检验
检验值=0
t
df