1、2.6$21,1505.3$21,4507.9$21,75010.5$21,900215.8$24,00021.1$26,25023.7$27,30026.3$27,75028.9$27,90031.6$28,350$29,10036.8$30,30039.5$31,05042.1$31,20044.7$31,35050.0$32,10052.6$32,55055.3$35,10057.9$36,00060.5$36,15063.2$38,850$40,20068.4$40,80071.1$42,00073.7$42,30076.3$45,00078.9$46,00081.6$57,00084
2、.2$60,37586.8$81,25089.5$92,00092.1$103,75094.7$110,62597.4$135,000(3)画出salary/100(取整后)茎叶图【结果分析、体会和收获】:通过本次的学习,对SPSS有了初步的了解、对一些数据的导入、变量的设置以及简单的数据分析等基本操作已经熟练掌握;但还有很多不足,对于一些复杂的分析不能完全理解。不过我会慢慢的学习,是自己可以理解的透彻,并熟练的掌握。实 验 二某年全国31个省、市、自治区的GDP数据分析 大学生月平均生活费支出的调查数据求数据平均值、中位数、标准差、峰度、偏度、排序和检验置信区间1、求出GDP的平均值、人均G
3、DP的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均GDP的95%的置信区间,根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。2、根据95的置信水平估计:全校本科学生平均月生活费支出的置信区间。得到求的均值为3547.09682、人均GDP的平均值定义新变量人均GDP计算变量: 人均GDP=GDP值/人口3、求人均GDP的平均值、中位数、标准差、峰度和偏度 在分析-描述统计-描述里面在选项里面选中均值、标准差、峰度和偏度,点继续、确定所以中位数为0.64824、求出人均GDP前五位及后五位的省份即对所有省份人均GDP进行排序点击确定,得到前五
4、位的省份是后五位的省份是5、并作出茎叶图、检验人均GDP的95%的置信区间在分析-描述统计-探索里面在统计量里人居GDP的茎叶图6根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。GDP的值的高低并不决定人均GDP的高低,因为人均GDP等于GDP值除以人数,GDP受人均GDP和人数共同作用。所以一个地区的GDP值很高 也不能说明该地的人均GDP很高。二、大学生日常生活费支出及生活费来源状况1根据95的置信水平估计:在分析-描述统计-探索里面 ,得到通过本次学习,在SPSS软件中认识到了求均值、中位数、平均数等一系列的应用,通过两次操作,更加深层了解SPSS软件。 实验三一、实验
5、目的与要求1.熟练掌握T检验的SPSS操作2.学会利用T检验方法解决身边的实际问题 二、实验原理1.假设检验的基本原理三、实验演示内容与步骤 1某项分析希望通过随机调查收集到的26家保险公司人员构成的数据(见数据文件:保险公司人员工程情况.sav),对保险公司从业人员受高等教育的程度和年轻化的程度进行推断。该分析的两个原假设为:(1)保险公司具有高等教育水平的员工比例的平均值不低于0.8,即H0:0.01,表明样本与正态分布没有显着差异2. 为检验某种新的训练方法是否有助于提高跳远运动员的成绩(见训练成绩.SAV),收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。这样得到了两个配对样
6、本,在对总体分布不作任何假设的条件下,推断新方法训练前后是否存在显着差异。检验统计量b训练后成绩 - 训练前成绩Z-1.599a渐近显着性(双侧).110a. 基于负秩。b. Wilcoxon 带符号秩检验两个方法的p值都大于0.05,所以没有显着差异3.从甲乙两种不同工艺生产出来的产品中随机选取若干个观测数据(见产品使用寿命.SAV),分析两种工艺产品的使用寿命是否存在显着差异?两个显着性概率p不都大于0.05,所以存在显着差异实验五1、某企业在制定某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估,(见数据文件:广告城市与销售额.SAV)。试以商品销售额为观测变量,
7、广告形式和地区为控制变量,利用单因素方差分析分别对广告形式、地区对销售额的影响进行分析。读入数据后:(1)点击分析,比较均值,单因素分析;(2)得出结果:ANOVA销售额平方和df均方显着性组间5866.08331955.36113.483.000组内20303.222140145.023总数26169.306143有以上结果可知:广告形式对于销售额是存在影响的。(4) 选择左框中的变量“销售额”,用箭头送入右边的因变量列表中,选择左框中的变量“广告形式”,用箭头送入右边的因子列表中;(5)得出结论:9265.30617545.0184.06216904.000126134.159地区对于销售
8、额也是有影响的。对上题进行双因素分析(包括无重复和有重复)无重复双因素分析:操作如下:(1)点击分析,一般线性模型,单变量; (2)将销售额移入因变量,广告形式移入固定因子,地区移入随机因子;(3)点击模型,弹出窗口后点击设定来自定义,选择类型为交互,将广告形式、地区移入右边;(4)得出结果:主体间效应的检验因变量:源III 型平方和Sig.截距假设642936.6941179.661误差545.018a广告形式21.78911037.91712389.739b地区6.073a. MS(地区)b. MS(错误)3、某补习机构为研究一个班3组不同性别的同学(分别接受了3种不同的教学方法)在数学成
9、绩上是否有显着差异,需要研究不同教学方法和不同性别对数学成绩的影响。数据如表所示。表三组不同性别学生的数学成绩人名数学组别Hxh99MaleYaju88FemaleYuShizg89Hah94S90Watet79Jess56Wish2-new12-new2702-new32-new4552-new5502-new6672-new72-new82-new9试进行方差分析性别和教学方法是否对数学成绩影响显着,说明过程及理由。(4)得出结论:99641.101306.037.038321.132.986325.585a3290.3331645.16718.5161243.9271488.852b31
10、9.7403.599.079a. 1.025 MS(性别) - .025 MS(错误)有结果可知:第六列表示的是F统计量的显着性水平。由此可知,性别对成绩的影响是显着的,组别对成绩的影响是不显着的。实 验 六普通相关分析2013年5月20日1.熟练掌握普通相关分析的SPSS操作2.学会利用普通相关分析方法解决身边的实际问题 1.某班级学生高等数学和统计学期末考试成绩如表所示,现要研究该班学生的高等数学和统计学成绩之间是否具有相关性,根据数据散点图及相关分析运算结果进行分析。2.某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值1”和“分值2”,如下表所示。问两次评分的等级相关有
11、多大,是否达到显着水平作出分析。3.某农业实验场通过试验取得小麦产量与单位虫害值和平均温度的数据,如下表所示。求单位虫害值对产量的偏相关(剔除温度变量的影响),作简要分析。一数据散点图及相关分析运算结果进行分析。相关性高等数学统计学Pearson 相关性.775*显着性(双侧)18*. 在 .01 水平(双侧)上显着相关。t统计量的值的显着性概率p=0.0000.05,说明剔除温度色影响后,单位害虫值对产量没有显着性关系。通过本次试验熟练掌握了用spps对两个或多个随机变量的线性相关关系,我们可以先通过散点图对关系进行简单判断,然后再通过数据的具体分析作出进一步判断。 实验七用SPSS处理经典
12、回归问题2014年5月 16日学习如何运用SPSS处理经典回归问题用SPSS处理经典回归问题来考察中国城镇居民2011年人均可支配收入与消费支出之间的关系(1)画散点图(2)判断人均可支配收入与消费支出之间是否大致呈线性关系输入移去的变量b模型输入的变量移去的变量方法消费支出Ya输入a. 已输入所有请求的变量。b. 因变量: 可支配收入X模型汇总RR 方调整 R 方标准 估计的误差.986a.971.970413.04952a. 预测变量: (常量), 消费支出Y。Anovab回归1.675E8981.703.000a残差4947687.22329170609.904总计1.724E830系数
13、a非标准化系数标准系数tB标准 误差试用版(常量)256.469270.434.948.351消费支出Y.717.02331.332a. 因变量:结果分析表1中显示的是拟合过程中变量输入/移去模型的情况记录,由于只引入了一个自变量,所以只出现一个模型1,该模型中“消费支出Y”为进入的变量,没有移除的变量,具体的输入/移去方法为输入。表2是模型拟合概述, 列出了模型的R、R2 、调整R2 及估计标准误。R2 值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。本题所用数据拟合结果显示:R(所考察的自变量和因变量之间的相关系数)= 0.986 ,R2(拟合线性回归的决定系数)= 0.9
14、71 ,经调整后的R2=0.970,标准误的估计= 413.04952 。表3方差分析表, 列出了变异源、自由度、均方、F值及对F的显着性检验。本题中回归方程显着性检验结果表明:回归平方和为1.675E8,残差平方和为 4964787.223 ,总平方和为 1.724E8 ,对应的F统计量的值为 981.703 , Sig=0.0000.05,可以认为所建立的回归方程有效,所以COD与BOD5之间成线性关系。表4回归系数表,列出了常数及非标准化回归系数的值及标准化的回归系数,同时对其进行显着性检验。本题中非标准化的回归系数B的估计值为 0.717 ,标准误为0.023,标准化的回归系数为0.9
15、86,回归系数显着性检验t统计量的值为 0.948 ,对应显着性水平Sig.= 0.351 0.05,可以偏回归系数与0有显着性差异,被解释的变量和解释的变量的线性关系是显着的,因此,本题回归分析得到的回归方程为:y=-0.492x-5.360 。对方程的方差分析及对回归系数的显着性检验均发现,所建立的回归方程显着。综上所述,人均可支配收入与消费支出之间大致呈线性关系3)用最小二乘估计求回归方程 由公式(为人均可支配收入,y为消费支出)4)决定系数R(所考察的自变量和因变量之间的相关系数)= 0.986 ,R2(拟合线性回归的决定系数)= 0.971 1) 给出置信水平为95%的预测区间。描述性统计量均值标准 偏差满意度23.00003.3636736Z156.72225.03480Z254.61115.96790Z359.72227.42048Z453.52786.97541Z553.36115.92406Z654.30566.20516Z71.1186.18667Z814.357811.72149.413.118.326-.076.245-.302.486.186.386.315.043.213-.223-.006.241.373.045-.127-.144.217.200
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1