1、统计分析与SPSS课后习题课后习题汇总统计剖析与 SPSS的应用(第五版) 课后练习答案第一章练习题答案1、 SPSS的中文全名是:社会科学统计软件包(后更名为:统计产品与服务解决方案)英 文 全 名 是 : Statistical Package for the Social Science.(StatisticalProduct and Service Solutions)2、 SPSS的两个主要窗口是数据编写器窗口和结果查察器窗口。数据编写器窗口的主要功能是定义 SPSS数据的结构、录入编写和管理待剖析的数据;结果查察器窗口的主要功能是现实管理 SPSS统计剖析结果、报表及图形。3、 S
2、PSS的数据集:SPSS 运转时可同时翻开多个数据编写器窗口。每个数据编写器窗口分别显示不一样的数据会合(简称数据集) 。活动数据集:此中只有一个数据集为目前数据集。 SPSS 只对某时辰的目前数据集中的数据进行剖析。4、 SPSS的三种基本运转方式:完好窗口菜单方式、程序运转方式、混淆运转方式。完好窗口菜单方式:是指在使用 SPSS的过程中,所有的剖析操作都经过菜单、按钮、输入对话框等方式来达成, 是一种最常有和最广泛的使用方式, 最大长处是简短和直观。程序运转方式:是指在使用 SPSS的过程中,统计剖析人员依据自己的需要,手工编写 SPSS命令程序,而后将编写好的程序一次性提交给计算机履行
3、。该方式合用于大规模的统计剖析工作。混淆运转方式:是前二者的综合。5、 .sav 是数据编写器窗口中的 SPSS数据文件的扩展名.spv 是结果查察器窗口中的 SPSS剖析结果文件的扩展名.sps 是语法窗口中的 SPSS程序6、 SPSS 的数据加工和管理功能主要集中在 编写、数据等菜单中;统计剖析和画图功能主要集中在 剖析、图形等菜单中。7、概率抽样 (probability sampling) :也称随机抽样,是指按必定的概率以随机原则抽取样本, 抽取样本时每个单位都有必定的时机被抽中, 每个单位被抽中的概率是已知的, 或是能够计算出来的。概率抽样包含简单随机抽样、系统抽样(等距抽样)
4、、分层抽样(种类抽样)、整群抽样、多阶段抽样等。简单随机抽样 (simple random sampling) :从包含整体 N 个单位的抽样框中随机地抽取 n 个单位作为样本, 每个单位抽入样本的概率是相等的。 是最基本的抽样方法,是其余抽样方法的基础。长处:简单、直观,在抽样框完好时,可直接从中抽取样本,用样本统计量对整体参数进行预计比较方便。 限制性:当 N 很大时,不易结构抽样框,抽出的单位很分别,给实行检查增添了困难。分层抽样 (stratified sampling) :将抽样单位按某种特点或某种规则区分为不一样的层,而后从不一样的层中独立、 随机地抽取样本。 长处:保证样本的结构
5、与整体的结构比较邻近,进而提升预计的精度,组织实行检查方便 ( 当层是以行业或行政区区分时 ) ,既能够对整体参数进行预计,也能够对各层的参数进行预计。整群抽样 (cluster sampling) :将整体中若干个单位归并为组 ( 群 ), 抽样时直接抽取群,而后对选中群中的所有单位所有实行检查。长处:抽样时只要群的抽样框,可简化工作量;检查的地址相对集中,节俭检查花费,方便检查的实行。弊端:估 的精度 差。系 抽 (systematic sampling):将 体中的所有 位( 抽 位 ) 按必定 序排列,在 定的范 内随机地抽取一个 位作 初始 位,而后按预先 定好的 确立其余 本 位,
6、 先从数字 1到 k 之 随机抽取一个数字r 作 初始 位, 此后挨次取 r+k , r+2k 等 位。 点:操作 便,可提升估 的精度。弊端: 估 量方差的估 困 。多 段抽 (multi-stage sampling):先抽取群,但其实不是 群内的所有 位,而是再 行一步抽 , 从 中的群中抽拿出若干个 位 行 。群是初 抽 位,第二 段抽取的是最 抽 位。将 方法推行,使抽 的段数增加,就称 多 段抽 。 点:拥有整群抽 的 点,保 真相 集中, 用。在大 模的抽 中, 常被采纳的方法。非概率抽 是指抽取 本 不是依照随机原 ,而是依据研究目的 数据的要求,采纳某种方式从 体中抽出部分
7、位 其 施 ,包含方便抽 、自发抽 、配 抽 、 判断抽 和 雪球抽 等。方便抽 : 本限于 体中易于抽到的一部分。最常 的方便抽 是偶遇抽 ,即研究者将在某一 和 境中所碰到的每一 体 位均作 本成 。“街 人法”就是一种偶遇抽 。 方便抽 是非随机抽 中最 的方法,省 省 ,但 本代表性因受有时要素的影响太大而得不到保 。自发抽 : 某些 被 者来 是不快乐的、麻 的, 方便起 就采纳以自发被 者 本的方法。判断抽 :研究人 从 体中 那些被判断 最能代表 体的 位作 本的抽 方法。当研究者 自己的研究 域十分熟习, 研究 体比 认识 采纳 种抽 方法,可 代表性 高的 本。 种抽 方法多
8、 用于 体小而内部差别大的状况,以及在 体 界没法确立或因研究者的 与人力、物力有限 采纳。 雪球抽 : 以若干个拥有所需特点的人 最先的 象,而后依赖他 供给 的合格的 象, 再由 些人供给第三批 象,挨次 推, 本好像 雪球般由小 大。 雪球抽 多用于 体 位的信息不足或 察性研究的状况。 种抽 中有些分子最后仍没法找到,有些分子被供给者漏而不提,二者都可能造成 差。配 抽 也称定 抽 ,是将 体依某种 准分 (群);而后依照各 本数与 体数成比率的原 主 抽取 本。配 抽 与分 概率抽 很靠近,最大的不一样是分 概率抽 的各 本是随机抽取的,而配 抽 的各 本是非随机的。 体也可依照多种
9、 准的 合分 ( 群) ,比如,在研究自 ,考 到婚姻与性 都可能 自 有影响,可将研究 象分 未婚男性、已婚男性、 未婚女性和已婚女性四个 , 而后从各群非随机地抽 。配 抽 是往常使用的非概率抽 方法, 本除所 外没法保 代表性。8、利用 SPSS 行数据剖析的一般步 :数据的准 - 数据的加工 理 - 数据的剖析 - 剖析 果的 和解 。第二章 答案1、 SPSS中两个基本的数据 方式:原始数据的 方式和 数数据的 方式。原始数据的 方式: 待剖析的数据是一些原始的 卷数据, 或是一些基本的 指 。 数数据的 方式: 所收集的数据不是原始的 卷数据, 而是 分 后的数据。2、个案:在原始
10、数据的组织方式中,数据编写器窗口中的一行称为一个个案或观察。变量:数据编写器窗口中的一列。3、默认的变量名: VAR- ;默认的变量种类:数值型。变量名标签和变量值标签可加强统计剖析结果的可读性。4、数据文件以下图:5、缺失值分为用户缺失值( User Missing Value )和系统缺失值( System MissingValue )。用户缺失值指在问卷检查中, 将无回答的一些数据以及显然失真的数据看作缺失值来办理。用户缺失值的编码一般用研究者自己能够识其余数字来表示,如“ 0”、“ 9”、“ 99”等。系统缺失值主要指计算机默认的缺失方式, 假如在输入数据时空缺了某些数据或输入了非法的
11、字符,计算机就把其界定为缺失值,这时的数据标志为一个圆点 “ ?”。在变量视图中定义。6、变量种类包含:数值型(身高) 、定序型(受教育程度)以及定种类(性别) 。在变量视图中定义。79 题 软件操作,答案略第三章练习题答案18 题 软件操作,答案略9、 SPSS排序功能仅实现将观察按用户指定次序从头摆列;拆分功能在按次摆列的基础上,能够实现对数据按排序变量进行分组,并分组进行后续的统计剖析。第四章练习题答案1、Statistics户口所在职业年纪地Valid282282282N000Missing户口所在地Frequency PercentValidCumulativePercentPerc
12、ent中心城市200Valid 边郊外区82Total282职业Frequency PercentValidCumulativePercentPercent国家机关24商业服务业54文教卫生18公交建筑业15经营性企业18学校15一般田户35种粮棉专业4Valid 户种果菜专业10户工商运专业34户退伍人员17金融机构35现役军人3Total282年纪Frequency PercentValidCumulativePercentPercent20 岁以下42035 岁146Valid 3550 岁9150 岁以上41Total282剖析: 本次检查的有效样本为 282 份。常住地的散布状况是:
13、 在中心城市的人最多,有200 人,而在边郊外区只有 82 人;职业的散布状况是:在商业服务业的人最多,其次是一般田户和金融机构; 年纪方面: 在 35-50 岁的人最多。因为变量中无缺失数据,所以频数散布表中的百分比同样。2、剖析:由表中能够看出,有效样本为 282 份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。 与标准正态散布曲线进行对照,由峰度系数能够看出,此表的存款金额的数据散布比标准正态散布更峻峭; 由偏度系数能够看出, 此表的存款金额的数据为右偏散布,表示此表的存款金额均值对均匀水平的测度偏大。剖析:由表中能够看出,中心城市有 200 人,边郊外区为 82 人。两部
14、分样本存取款金额均呈右偏尖峰散布,且边郊外区更显然。3、利用描绘菜单下窗口对话框中的“将标准得分另存为变量”功能实现。对标准分数变量按降序摆列,绝对值大于 3 的可视为“独出心裁”的样本。原因:标准化值反应的是样本值与样本均值的差是几个标准差单位。 假如标准化值等于0,则表示该样本值等于样本均值;假如标准化值大于 0,则表示该样本值大于样本均值;假如标准化值小于 0,则表示该样本值小于样本均值。假如标准化值的绝对值大于 3,则可以为是异样值。4、利用列联剖析实现。第一编制列联表,而后进行卡方查验。以户口和收入的列联剖析为例:表中, 卡方统计量的观察值等于,概率 -P值等于。 若明显性水平设为,
15、 因为 ,拒绝原假定,表示户口地与收入水平不独立。5、多项选择项分类法;存款的最主要目的是正常生活零用6、计算结果:卡方统计量:2rc( fijof ije )2,用于测度各个单元格的观察频数与希望频数的差别,f ijei 1j1并依卡方理论散布判断差别能否统计明显。因为希望频数代表的是队列变量独立下的散布,所以卡方值越大表示实质散布与希望散布差别越显然。本例中,因为概率 P 值小于明显性水平,应拒绝原假定,婆媳关系与住宅条件有关系。7、将计数数据复原为原始数据,采纳交错分组下的频数剖析,并进行卡方查验。表中,卡方统计量观察值为,对应的概率 P- 值为,小于明显性水平,应拒绝原假定,说明减肥成
16、效其实不一致。8、多项选择项二分法;102( 794 份)、 101( 514 份)、 401( 400 份)赚钱比率: %,赔钱比率 38%主要依照:基本要素法;最少依照:更跟方法采纳列联剖析。卡方查验结果表示:专职和业余投资者在投资结果上存在明显差别。9、( 1)变量:汽车价钱、居住地域;种类:定序型变量、定种类变量(2)上述是计数数据的组织方式, 应第一组织到 SPSS的数据编写器窗口中, 再利用交错分组下的频数剖析方法。列联剖析。原假定:不一样居住区的私人车主接受的汽车价钱拥有一致性的。上表可知,假如明显性水平为,因为卡方查验的概率 P- 值小于明显性水平,所以应拒绝原假定。第五章练习
17、题答案1、采纳单样本 T 查验(原假定H0:u=u0=75,整体均值与查验值之间不存在明显差别);NOne-Sample StatisticsMean Std.DeviationStd. ErrorMeanVAR0000111tdfOne-Sample TestTest Value = 75Sig. Mean(2-tailed) Difference95% Confidence Interval ofthe DifferenceLower UpperVAR0000110.668剖析: N=11人的均匀值( mean)为,标准差()为,均值标准偏差 (std error mean) 为。 t统计
18、量的观察值为, t 统计量观察值的双尾概率 P-值( sig.(2-tailed) )为;六七列是整体均值与原假定值差的 95%的置信区间: , 。采纳双尾查验比较 a 和 p。T 统计量观察值的双尾概率 p- 值( sig.(2-tailed) )为 a=所以不可以拒绝原设; 且整体均值的 95%的置信区间为 , ,查验值 75 包含在置信区间内,所以经理的话是可信的。2、每周上网时间的样本均匀值为,标准差为,整体均值95%的置信区间为、利用两独立样本的T 查验实现, 实质为两个整体比率差的查验。第一将计数数据经过加权功能复原为原始数据,而后,采纳两独立样本T 查验实现。查验变量为行为,分组
19、变量为方式。Group Statistics方式NMeanStd.Std. ErrorDeviationMean方式一200.4600.49965.03533a2183.8798.32611.02411方式二剖析:从上表能够看出票丢仍买的人数比率为 46%,钱丢仍买的人数比率为 88%,两种方式的样本比率有较大差距。1. 两整体方差能否相等 F 查验: F 的统计量的察看值为 , 对应的P 值为 , ;假如明显性水平为 , 因为概率 P 值小于 , 两种方式的方差有明显差别。看假定方差不相等行的结果。 2. 两整体均值(比率)差的查验: .T 统计量的观察值为 , 对应的双尾概率为 ,T 统计
20、量对应的概率 P 值 , 故颠覆原假定 , 表示两整体比率有明显差别 . 更倾向心理学家的说法。4、本题是单个整体的比率查验问题。第一将数据组织成计数方式,并以数目为加权变量还原为原始数据。而后,采纳独立样本的 T 查验实现。查验变量为能否开兰花,查验值为。剖析:由表知:样本中 200 棵开兰花的比率为 71%。假如整体比率的原假定为,因为 T 统计量的概率 P 值大于明显性水平() ,不可以拒绝原假定,不可以说与遗传模型不一致。5、方式一:采纳两配对样本 t 查验Paired Samples StatisticsMeanNStd.Std. ErrorDeviationMean饲料 19Pai
21、r 19饲料 2Paired Samples CorrelationsNCorrelatioSig.n饲料 1& 饲料9.571.108Pair 12Paired Samples TestPaired DifferencestdfSig.MeanStd.Std.95% Confidence(2-tailed)DeviatioErrorInterval of thenMeanDifferenceLowerUpperPair 饲料 1 -8.3061饲料 2由上表可知, t 统计量观察值为,概率 P- 值为,大于明显性水平,不该拒绝原假定,不能以为不一样饲料使幼鼠体内钙的保存量出现了明显不一样。方
22、式二:采纳两独立样本 t 查验由上边的表可知,两组残留的样本均匀值差别不大。由下表可知,该查验的 F 统计量的观察值为,对应的概率 P- 值为。假如明显性水平为 , 则能够以为两整体的方差无明显差别。两整体均值的查验应看第一行。 T 统计量的观察值为, P- 值为 , 。假如明显性水平为,则不该拒绝原假定,不可以以为两饲料残留有明显差别。6、两独立样本 T 查验剖析:1. 两整体方差能否相等用 F 查验: F 的统计量的察看值为 , 对应的 P 值为 , ;假如明显性水平为 , 因为概率 P 值大于 , 两种方式的方差无明显差别 . 看假定方差相等行。2. 两整体均值的查验: T 统计量的观察
23、值为 , 对应的双尾概率为 ,T 统计量对应的 P 值明显水平 , 故不可以拒绝原假定 , 不可以以为女生男生的课程均匀分有明显差别。7、利用配对样本 T 查验,逐对查验8、由第一个表知,培训前和培训后样本的均匀值( mean)有必定差别,培训后均匀值较大;表二表示,在明显性水平为时,培训前后的销售量有必定的线性关系;由表三知, t 查验统计量的观察值为, 对应的双尾概率 p- 值为, 小于明显水平 a= ,应拒绝原假定, 培训前后的销售均匀值存在明显差别。第六章练习题答案1、( 1)ANOVAVAR00002Sum ofdfMean SquareFSig.SquaresBetween Gro
24、ups4.000Within Groups30Total34概率 P-值靠近于 0,应拒绝原假定,以为 5 种销售方法有明显差别。( 2)均值图:Multiple ComparisonsDependent Variable: VAR00002LSD(I) VAR00001 (J) VAR00001MeanStd.Sig.95% Confidence IntervalDifferenceErrorLower Bound Upper Bound(I-J)2314513245123451243512534*. The mean difference is significant at the*.04
25、8.7286.653.066*.000*.048.027*.018.755*.000*.042.653*.018.157*.000.066.216*.000.157.945*.000*.000*.042.127*.000*.000level.可知, 1 和 2、1 和 5、2 和 3,2 和 4,2 和 5,3 和 5,4 和 5 有明显差别。2、;3、因 F 查验的概率 P 值小于明显性水平() ,拒绝原假定,方差不齐,不知足方差剖析的前提假定。; 67;各组均值存在明显差别。更适合第三组4、Between-Subjects FactorsValue LabelN地域一9地域地域二9地域三9周一至周三9日期周四至周五9周末9Tests of Between-Subjects EffectsDependent
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1