ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:292.19KB ,
资源ID:12111330      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12111330.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS课程设计报告南邮.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS课程设计报告南邮.docx

1、SPSS课程设计报告南邮学 号: 南京邮电大学课程设计(I)报告题 目: SPSS的使用 班 级: 姓 名: 指导教师: 成 绩: 年 月 日 南京邮电大学管理学院课程设计指导教师成绩评定表题目SPSS的使用学生姓名 班级学号 专业信息管理与信息系统评分内容评分标准总分评分平时成绩认真对待课程设计,遵守实验室规定,上机不迟到早退,不做和设计无关的事。20设计内容设计内容丰富,符合大纲要求10界面外观漂亮、大方 10功能符合大纲要求 10数据分析设计正确合理 10文档写作文档反映设计规划分析过程 10文档反映系统建模设计流程 10答辩简练、准确阐述设计内容,能准确有条理回答各种问题,系统演示顺利

2、。20总评分指导教师评阅意见该生对待课程设计的态度 认真 良好 一般 比较差。课程设计的系统界面外观美工布局情况很好 较好 一般 比较差数据收集与处理、分析情况 很好 良好 一般 比较差文档书写符合规划与设计流程程度 很好 良好 一般 比较差设计演示顺利情况和答辩流畅准确情况很好 良好 一般 比较差成绩指导教师签名 日期 1.SPSS系统概述 英文名称原为Statistical Package for Social Science,即社会科学统计软件包。涵盖了各种统计方法和模型,为统计分析用户提供全方位的统计学算法,为各种研究提供了相应的统计学方法。 提供各种表格和统计学图形,如线图、条形图和

3、饼图等等。SPSS可以直接将表格拷贝到word文档幻灯片之中,直接进行结果的展现。 在数据录入方面,可以直接录入,也可以把excel表格数据、文本数据导入到SPSS中进行分析,避免了拷贝错误。 在结果方面,SPSS可以直接导出为word文本、网页、excel格式,也可以将表格、交互式图形作为对象粘贴到word、ppt中,并在其中再利用SPSS对他们进行编辑。 SPSS界面友好,简单易用,使得工作变得节省时间和精力。1.1 SPSS的构成SPSS for Windows 6.0共有7个部分,包括:Base基本统计系统、Pro.Stats专业统计系统、Adv.Stats高级统计系统、Tables制

4、表系统、Trends趋势分析系统、Categeries项目分类分析系统和LISREL线性结构方程式模型分析系统。1.2 SPSS的功能 SPSS能通过数据统计揭示不同事物之间的联系,发现规律,被广泛应用于人文社会科学研究领域,具有强大的数据分析功能,界面友好、操作简单,广泛的应用于管理决策、市场分析、医学统计、金融等专业的统计分析。SPSS非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。特别适合设计调查方案、对数据进行统计分析,以及制作研究报告中的相关图表。内含的众多技术使数据准备变得非常简单。它可以同时打开多个数据集,方便研究

5、时对不同数据库进行比较分析和进行数据库转换处理。软件提供了更强大的数据管理功能帮助用户通过SPSS使用其它的应用程序和数据库。支持Excel、文本、Dbase 、Access、SAS等格式的数据文件,通过使用ODBC的数据接口,可以直接访问以结构化查询语言(SQL)为数据访问标准的数据库管理系统,通过数据库导出向导功能可以方便地将数据写入到数据库中等等。 除了一般常见的摘要统计和行列计算,SPSS提供了广泛的基本统计分析功能。SPSS提供了一个全新的演示图形系统,能够产生更加专业的图片。它包括了以前版本软件中提供的所有图形,并且提供了新功能,使图形定制化生成更为容易,产生的图表分辨率更高。SP

6、SS 软件进一步增强了高度可视化的图形构建器的功能,该演示图形系统使您更容易控制创建和编辑图表的时间,大大减少了工作量,并且,您可以一次创建一个图或表,然后使用作图模板以节省时间。同时PDF格式的输出功能,能够让用户更好地同其它人员进行信息共享。多维枢轴表使结果更生动,在SPSS Statistics软件中,用户可以在一个重叠图中基于不同的数值范围建立两个独立的Y轴。通过对行、列和层进行重新排列,浏览您的表格。找到在标准报表中可能会丢失的重要查找结果。拆分表,一次仅显示一组,从而可以更容易地对各组进行比较。1.3 SPSS的使用方法双击打开SPSS,然后就可以导入数据或者直接录入数据。录入数据

7、之后,可以通过菜单栏之类的进行相关的操作。菜单栏里面有如下的按钮:文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、窗口、帮助。这些选项可以实现几乎所有的功能,我们可以通过这些选项来实现对数据的处理。SPSS使用流程是导入数据(录入数据)进行处理,实现统计目标保存统计数据。2数据文件的处理2.1数据录入和编辑 从excel表中读取数据,点击文件,选择打开数据,然后选择excel格式,从文件列表中选择要打开的文件。2.2新变量计算 略2.3变量筛选 我筛选健康指数大于“1”的数据,即除了偏胖的人的数据。 2.4数据文件的拆分与合并数据文件的拆分: 2.5数据文件的存储与读取 3图形绘制3

8、.1条形图 从这个条形图中可以看出,我们在选取地区样本的时候保持了样本数量的一致,使得最后讨论的结果具可对比性,不存在对某个地区的样本过少或过多以至于数据不可进行对比的情况。 从这张统计图中可以看出,运用各个地方的健康指数的均值进行比较可以发现,地区代号为3的健康指数均值最大,地区代号分别是甲为1,乙为2,丙为。3.2饼图 从这个饼图中我们能够知道,蓝色的代表偏向于肥胖的,黄色代表正常的,绿色代表偏瘦的,肥胖的还是比较多的,正常的最多,偏瘦的特少。黄色的比重远远大于绿色和蓝色之和。下面是对各个地区的健康饼图分布以及描述总结。由于在条形图中我们统计了三个地区的样本数量是一样的,我们可以从上面的饼

9、图中可以知道,根本蓝色3号地区即丙地区面积最大,可以得知丙地区的偏胖人数最多,甲地区的蓝色面积次之,乙地区的黄色是最多的,可见其正常人数最多,总而言之,可以得出结论,乙地区的健康状况最优,因为其偏瘦人数最少,偏胖人数也最少。3.3线形图 在这个指数的均值折线图中,能够直观地看出乙地区的身体健康状况总体均值偏低,但是其均值是在正常的范围之内,然后我们可以看到丙地区的均值很高,超过了15,可以说丙地区的健康状况不太好。3.4直方图 点击菜单栏中的分析,点击描述统计,然后选中频率,在图表中选中直方图和在直方图上显示正态分布曲线的选项,然后把指数选进去,这样就能够描绘出各个地区身体身高状况BMI指数,

10、然后得到值得直方图。 从上面的直方图中可以看出,整体上的BMI值分布在13.515之间,由此可知整体的健康指数在正常水平。没有出现大规模的超重或偏瘦的状况。 下面的直方图是各个地区的BMI值情况,可以从这个图中看出三个地方各自的特点。 从上面可以看出,乙地区的BMI值趋向于14.25,甲略高于乙,丙高达15.25,这表明丙的健康状况不是很好,在均值中可知丙是整体上偏胖的,这些偏胖的人拉高了整体的BMI均值。3.5散点图 从上面这个散点图可以看出,大部分数据分布在两条参考线之间,大部分的人指数在13到15之间,这是正常的范围,偏瘦的人很少,只有那么两三个,偏胖的人还是有点多的。4基本统计分析4.

11、1频数统计在统计分析各个地区身体身高发育指标的时候,需要统计其健康指数的频数情况,通过下图可知正常的有59个,肥胖的有28个,偏瘦的有3个,很明显这个统计结果符合中国的现状,整体上正常但是偏向于肥胖。4.2描述性统计描述统计量N极小值极大值均值标准差方差峰度统计量统计量统计量统计量统计量统计量统计量标准误指数_ZS9012.2518.4914.75931.166591.3611.431.503身高_SG90105.20141.00122.63675.8362434.0621.092.503体重_TZ9017.5032.3022.23332.698367.2812.555.503胸围_XW905

12、1.0065.8058.43002.963128.780-.104.503有效的 N (列表状态)90从上面这张描述统计量的表格中,可以看出,健康指数方差不大,说明指数较为集中,相对于其他变量的方差而言是比较小的,身高的方差最大,可见各个地区的身高差异是比较大的。指数的极大极小反映了身体状况的两个极值,毫无疑问的是18.49在定义中属于略微偏胖的,12.25是偏瘦,均值14.7593表示平均的情况是正常的。4.3总体均值案例处理摘要案例已包含已排除总计N百分比N百分比N百分比指数_ZS * 地区代号90100.0%0.0%90100.0%报告指数_ZS地区代号均值N标准差dimension11

13、14.653830.92924214.247530.84746315.3767301.38495总计14.7593901.16659通过这张表格可以知道3个地区的均值之间的对比情况,3个地区丙地区BMI值是最大,其均值超过15,属于偏胖的情况,甲乙两个都是正常,丙的标准差比较大,表示丙的数据差异较大。三个地区总体BMI均值是14.7593,表示样本总体是正常的,但是略微偏向于偏胖的状况(正常与偏胖的临界值是15)。4.4总体方差描述统计量N极小值极大值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误指数_ZS9012.2518.491.166591.361.916.25

14、41.431.503有效的 N (列表状态)90这张表格是反映整体的指数方差情况,总体的方差是1.361,这个值是比较小的,说明整体上BMI健康指数指数的分布差距并不大,比较集中。4.5总体均值的置信区间置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。单个样本统计量N均值标准差均值的标准误指数_ZS9014.759

15、31.16659.12297单个样本检验检验值 = 0 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限指数_ZS120.02589.00014.7593414.515015.003795%置信区间是14.5150,15.0037,也就是说整体上三个地区有95%的概率是处于正常的体质健康情况。对于甲乙丙三个地区身体状况研究的总结:略5回归分析 在这一部分,研究的是各国汽车的各种因素对于其耗油量的影响。 前期准备:研究汽车三个地区的汽车样本频数:Country of Origin频率百分比有效百分比累积百分比有效American25362.362.562.5European7318

16、.018.080.5Japanese7919.519.5100.0合计40599.8100.0缺失系统1.2合计406100.0略从上面的表格中可以看出,欧洲的汽车从0加速到60km/h所花费的时间是最长的,和日本较为接近,美国汽车加速的时间是最短的。5.1一元线性回归分析在这一部分,选取的是汽车的质量与汽车一加仑汽油能够开的英里数的关系线性回归分析。模型汇总b模型RR 方调整 R 方标准 估计的误差1.807a.651.6504.622a. 预测变量: (常量), Vehicle Weight (lbs.)。b. 因变量: Miles per GallonAnovab模型平方和df均方FSi

17、g.1回归15794.632115794.632739.503.000a残差8457.94339621.358总计24252.575397a. 预测变量: (常量), Vehicle Weight (lbs.)。b. 因变量: Miles per Gallon在上述的表格中,可以看到R方为0.651,拟合度比较低,因为在现实中影响汽车耗油量的因素很多,但是从上面可知汽车质量对于汽车一加仑汽油能够开的距离还是有影响的。Sig为0.0000.05表示有显著性,在系数表中,我们看到sig值都为0,给出了回归方程的系数值。也就是说汽车开的距离英里数=汽车质量*(-0.007)+45.492 。5.2多

18、元线性回归分析在这一部分,研究的是汽车的一加仑汽油能够行驶的英里数与汽车质量和发动机排量之间的关系。模型汇总b模型RR 方调整 R 方标准 估计的误差1.813a.661.6594.563a. 预测变量: (常量), Engine Displacement (cu. inches), Vehicle Weight (lbs.)。b. 因变量: Miles per GallonAnovab模型平方和df均方FSig.1回归16027.92228013.961384.881.000a残差8224.65339520.822总计24252.575397a. 预测变量: (常量), Engine Dis

19、placement (cu. inches), Vehicle Weight (lbs.)。b. 因变量: Miles per Gallon系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)42.4731.22634.648.000Vehicle Weight (lbs.)-.005.001-.551-6.738.000Engine Displacement (cu. inches)-.020.006-.274-3.347.001a. 因变量: Miles per Gallon残差统计量a极小值极大值均值标准 偏差N预测值8.0538.6823.516.354398残差-29

20、.67916.589.0004.552398标准 预测值-2.4342.387.0001.000398标准 残差-6.5043.635.000.997398a. 因变量: Miles per Gallon从上面的这些表格中可以看到,R方只有0.661,说明拟合度比较低,sig值小于0.05,说明汽车的质量和汽车发动机的排量对汽车一加仑汽油能够开的英里数有着显著的影响。从系数表中,可以得到这一的公式:汽车1加仑汽油能够行驶英里数=-0.005*汽车质量+(-0.02)*发动机排量+42.473 。系数都是负的表明,汽车的质量越小,发动机排量越小,其耗油量越小,汽车开出的距离越长。6方差分析6.1

21、单因素方差分析 单因素方差分析的定义:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。这部分是对各国汽车一加仑汽油能够跑英里数的研究。研究的是汽车产出国对汽车其一加仑汽油开出距离的影响,也就是在讨论汽车各产地生产的汽车耗油量特征。显著性0.05,说明有国家不同,产出的汽车每加仑汽油跑的里程数有着显著的不同。可见,美国的汽车跑的最少,日本的汽车跑的最多,欧洲的汽车居中。日本与欧洲的差异不是很大。6.2无重复试验的双因素方差分析这部分讨论的是汽车的质量与汽车的马力对于汽车发动机排量的影响情况。主体间效应的检验因变量:Engine Displacement

22、(cu. inches)源III 型平方和df均方FSig.校正模型4.446E638711488.37684.543.000截距3791204.39013791204.39027899.459.000汽车质量471787.5762961593.87711.729.000马力22181.17637599.4914.412.004误差1630.65712135.888总计1.966E7400校正的总计4447632.144399a. R 方 = 1.000(调整 R 方 = .988)从上表中可以看到,R值为0.998,接近于1,表明拟合度很高,sig值都小于0.05(Sig为F检验得出的p值,

23、Sig0.05.说明差异显著),说明汽车质量和汽车的马力对于汽车发动机的排量影响非常显著。对于汽车各国汽车发动机排量和1加仑汽油能够行驶英里数的研究总结:略6.3重复试验的双因素方差分析这一部分选取的是血清中白蛋白和球蛋白含量比在蒸馏水ph值与铜硫酸浓度值不同时的表现情况的数据,实验对于每种水的ph值和铜硫酸浓度的组合做了两次实验,根据在网络中寻找到的数据,我进行了数据录入。这个数据符合双因素的要求,符合重复实验的要求,所以可以进行重复实验的双因素方差分析。点击分析,选择一般线性分析,一般线性模型,重复度量,群体内部变量是水的ph值,因子是铜硫酸浓度值。描述性统计量铜硫酸浓度均值标准 偏差N水

24、的ph1dimension11.003.4500.0707122.002.3500.0707123.002.0500.070712总计2.6167.661566水的ph2dimension11.002.5500.0707122.002.0500.0707123.001.9500.070712总计2.1833.292696水的ph3dimension11.002.0000.0000022.001.4500.0707123.001.4000.282842总计1.6167.325066水的ph4dimension11.001.4000.0000022.00.7500.0707123.00.3000.

25、000002总计.8167.495656上表是在不同水的ph值下,铜硫酸浓度不同的情况下,血清中蛋白质的含量比的均值。多变量检验c效应值F假设 df误差 dfSig.水的phPillai 的跟踪1.000714.148a3.0001.000.027Wilks 的 Lambda.000714.148a3.0001.000.027Hotelling 的跟踪2142.444714.148a3.0001.000.027Roy 的最大根2142.444714.148a3.0001.000.027水的ph * 铜硫酸浓度Pillai 的跟踪1.8066.2136.0004.000.049Wilks 的 L

26、ambda.0054.429a6.0002.000.196Hotelling 的跟踪37.556.0006.000.000.Roy 的最大根32.45421.636b3.0002.000.045a. 精确统计量b. 该统计量是 F 的上限,它产生了一个关于显著性级别的下限。c. 设计 : 截距 + 铜硫酸浓度 主体内设计: 水的ph从上表可知,ph值和铜硫酸浓度不同,血清中白蛋白和球蛋白含量比95%置信区间是不重合的。而且在各种情况下,标准误差很小。主体内效应的检验度量:MEASURE_1源III 型平方和df均方FSig.水的ph采用的球形度10.88533.628343.737.000Greenhouse-Geisser10.8851.5766.905343.737.000Huynh-Feldt10.8853.0003.628343.737.000下限10.8851.00010.885343.737.000水的ph * 铜硫酸浓度采用的球形度.5306.0888.368.003Greenhouse-Geisser.5303.153.1688.368.024Huynh-Feldt.5306.000.0888.368.003下限.5302.000.2658.368.059误差 (水的ph)采用的球形度.0959.011Greenhouse-Geisser.0954.729.020

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1