spss练习题及答案.docx
《spss练习题及答案.docx》由会员分享,可在线阅读,更多相关《spss练习题及答案.docx(14页珍藏版)》请在冰豆网上搜索。
spss练习题及答案
spss练习题及答案
精品文档
spss练习题及答案
一.某公司管理人员为了解某化妆品在一个城市的月销售量Y与该城市中适合使用该化妆品的人数X1以及他们人均月收入X2之间的关系,在某个月中对15个城市做调查,得上述各量的观测值如表A1所示.假设Y与X1,X2之间满足线性回归关系
yi?
?
0?
?
1xi1?
?
2xi2?
?
i,i?
1,2,?
1其中?
i独立同分布于N.
求回归系数?
0,?
1,?
2的最小二乘估计值和误差方差?
的估计值,写出回归方程并对回归系数作解释;
analyze-regression-linear,ytodependent,x1xto
indepents,statistics-confidence
2
2
回归系数?
0,?
1,?
2的最小二乘估计值和误差方差?
的估计值分别为:
3.453,0.496,0.009和
?
2=4.740.回归方程为y=0.496*x1+0.009*x2+3.453
回归系数解释:
3.453可理解为化妆品的月基本销售量,当人均月收入X2固定时,适合使
用该化妆品的人数X1每提高一个单位,月销售量Y将增加0.496个单位;当适合使用该化妆品的人数X1固定时,人均月收入X2每提高一个单位,月销售量Y将增加0.009
1/18
精品文档
个单位求出方差分析表,解释对线性回归关系显著性检验的结果.求复相关系数的平方R的值并
2
由于P值=0.000分别求?
1和?
2的置信度为0.95的置信区间;
coefficients的后面部分.?
1和?
2的置信度为0.95的置信区间分别为,
对?
?
0.05,分别检验人数X1及收入X2对销量Y的影响是否显著;
由于系数?
1,?
2对应的检验P值分别为0.000,0.000都小于0.05,所以适合使用该化妆品的人数X1和人均月收入X对月销售量Y的影响是显著的
该公司欲在一个适宜使用该化妆品的人数x01?
220,人均月收入x02?
2500的新城市中销售该化妆品,求其销量的预测值及置信为0.95的置信区间.
Y的预测值及置信度为0.95的置信区间分别为:
135.5741和在数据表中直接可以看见
2
二、某班42名男女学生全部参加大学英语四级水平考试,数据如下:
问男女生在英语学习水平上有无显著差异,
单击weightcases-weightcasesby-x,ok,
2/18
精品文档
analyze-descriptivestatistics-crosstabs,sextorows,scoretocolumn,exact-exact,statisticschi-square,ok.
原假设不显著,看这个。
PearsonChi-SquareandLikelihoodRatioall三、将一块耕地等分为24个小
区,今有3种不同的小麦品种和2种不同的肥料,现将各小
麦品种与各种肥料进行搭配,对每种搭配都在4个小区上试
验,测得每个小区产量的数据如表A3所示.
假设所给数据服从方差分析模型,建立方差分析表,
A与B的交互效应在?
?
0.05下是否显著,
3.0„Analyze-generallinearmodel-univariate,xtodependentvariable,aandbtofixedfactor,ok
由于交互效应检验P值=0.04
3.1„.Analyze-generallinearmodel-univariate,xtodependentvariable,atofixed
固定肥料的B1水平,
?
11,?
12,?
13的置信度为0.95的置信区间分别为
?
11?
?
12,?
11?
?
13,?
12?
?
13的置信度不小于
,;
0.95的Bonferroni同时置信区间分别为,,
2.Analyze-generallinearmodel-univariate,xto
dependentvariable,atofixed
3/18
精品文档
factor,posthoc-atoposthoctests
for,bonferroni,options-atodisplaymeansfor,.ok
固定肥料的B2水平,?
21,?
22,?
23的置信度为0.95的置信区间分别
SPSS课后作业
第一章
1-1、spss的运行方式有几种,分别是什么,
答:
SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。
1-2、SPSS中“DataView”所对应的表格与一般的电子处理软件有什么区别,答:
与一般电子表格处理软件相比,SPSS的“DataView”窗口还有以下一些特性:
一个列对应一个变量,即每一列代表一个变量或一个被观测量的特征;行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件;单元包含值,即每个单元包括一个观测中的单个变量值;数据文件是一张长方形的二维表。
第二章
2-1、在SPSS中可以使用那些方法输入数据,答:
SPSS中输入数据一般有以下三种方式:
通过手工录入数据;可以将其他电子表格软件中的数据整列的复制,然后粘贴到SPSS中;通过读入其他格式文件数据的方式输入数据。
2-2、对于缺失值,如何利用SPSS进行科学替代,答:
选择“Transform”菜单的ReplaceMissingValues命令,
4/18
精品文档
弹出ReplaceMissingValues对话框。
先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“NewVariable”框中,这时系统自动产生用于替代缺失值的新变量。
最后选择合适的替代方式即可。
-3、在计算数据的加权平均数时,如何对变量进行加权,
答:
选择“Data”菜单中的WeightCases命令,出现如图2-22所示的WeightCases对话框。
其中,Donotweightcases项表示不做加权,这可用于取消加权;Weightcasesby项表示选择1个变量做加权。
-4、如何对变量进行自动赋值,
答:
变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。
具体操作的过程如下:
选择“Transform”菜单中的AutomaticRecode
命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable->NewName框中,然后在下面NewName右边的文本框中输入新的变量名称,单击NewName按钮,将新的变量名添加到上面的框中。
从RecodeStartingfrom框中有两个选项中选择一个,然后单击OK按钮,即可完成自动赋值运算。
3-1、一组数据的分布特征可以从哪几个方面进行测度,
答:
一组数据的分布特征可以从平均数、中位数、众
5/18
精品文档
数、方差、百分位、频数、峰度、偏度等方面描述。
3-2、简述众数、中位数和均值的特点及应用场合。
答:
均值是总体各单位某一数量标志的平均数。
平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。
中位数的作用与算术平均数相近,也是作为所研究数据的代表值。
在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。
众数是指一组数据中出现次数最多的那个数据。
它主要用于定类数据的集中趋势,当然也适用于作为定序数据以及定距和定比数据集中趋势的测度值。
-3、
由题,用spss导出结果:
可知,该百货公司日销售额的均值为277.40万元,中位数为277万元,四分位数为256万元。
由题,用spss导出结果:
可知,日销售额的标准差为28.246万元。
-4、
答:
应采用方差、标准差来比较成年组和幼儿组的身高差异。
由题,用spss导出结果:
可知,成人组方差及标准差都大于幼儿组,故成人组
6/18
精品文档
的身高差异较大。
4-1、如何检验某个单一样本某变量的总体均值和指定值之间是否存在显著差异,
答:
通过单一样本T检验可以检验某个单一样本某变量的总体均值与指定值之间是否存在显著差异。
4-2、如何对两个独立样本进行均值差异检验,
答:
对两个独立样本进行均值差异检验需要通过两步来完成:
第一,利用F检验判断两总
体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。
4-3、对两配对样本进行T检验的前提要求是什么,答:
两配对样本T检验的前提要求是:
两个样本应是配对的且样本来自的两个总体应服从正态分布。
-4、
可知,治疗前这六名病人的均值为124.67,方差为175.467,用药后的均值为118.67,方差为331.867,可见治疗后均值降低,而方差变大。
用配对样本T检验方法进行检验,导出数据:
可知,伴随概率为0.337,大于显著性水平0.05,因而接受原假设,即治疗前后没有显著的变化。
4-5、用两独立样本T检验进行检验,导出数据:
可知,甲乙两个班级学生的数学成绩方差无显著性差异,而这两个班级的学生数学成绩均值之间有差异,甲班成
7/18
精品文档
绩要高于乙班同学的数学成绩。
5-1、如何检验两个及两个以上样本均数之间是否存在显著差异,
答:
方差分析可以用来检验两个及两个以上样本均数之间是否存在显著差异。
5-2、进行多因素方差分析时为什么要将观察变量总的离差平方和分解为3个部分,答:
因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。
因此,它需要将观察变量总的离差平方和分解为3个部分。
5-3、什么是协方差分析,什么情况适于使用协方差分析,
答:
协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。
当有一些很难控制的随机变量时,可以使用协方差分析将这些随机变量作为协变量。
-4、用单因素方差检验进行检验,导出结果:
SPSS练习题
1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。
先排序
8/18
精品文档
data---sortcases再合并data---mergefiles
2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。
转换Data---transpose,输题目
3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
选取数据data---selectcases
4、利用第2题数据,将其按常住地、收入水平存款金额进行多重排序。
排序data---sortcases一个一个选,加
5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算transform---count按个输,把所有课程选取,define设区间,再排序、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。
描述性统计,先转换Data---transpose学号放下面,全部课程放上面,ok,analyze---descriptive
statistics---descriptives,全选,options。
先拆分data---splitfile按性别拆分,analyze---descriptive
statistics---descriptives全选所有课程
9/18
精品文档
options---mean、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
数据分组Transform---recode---下面一个,输名字,change,old,range,newvalue---add挨个输,从小加到大,等距
8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
选取data---selectcases
9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
Analyze---descriptivestatistics---frequencies
10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。
AnDSdAnalyze---DescriptiveStatistics---Descriptives,选
择
存
款
金
额
到
10/18
精品文档
Variable
中
。
按
Option,
然
后
选
择
Mean,std.deviation,Minlmum,Variance,Maximum,Range,K
utosis,Skewness,Variable
list.然后按continue,ok
11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。
Transformcompute课程平均分=meananalyze->comparemeans->independent-samplesT;选择若干变量作为检验变量到testvariables框;选择代表不同总体的变量作为分组变量到groupingvariable框;.定义分组变量的分组情况DefineGroups...:
。
1.两总体方差是否相等F检验:
F的统计量的观察值为0.257,对应的P值
11/18
精品文档
为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaualvariances
assumend。
2.两总体均值的检验:
.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值,显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。
配对差异:
analyze->comparemeans->paired-samples
T„pairedvariables框中每科与不同科目配对很麻烦略
12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75,现从雇员中随机随出11人参加考试,得分如下:
80、81、72、60、78、65、56、79、77、87、76,请问该经理的宣称是否可信,
步骤:
采用单样本T检验;菜单选项:
Analyze->comparemeans->one-samplesTtest;指定检验值:
在test后的框中输入检验值,最后ok!
分析:
N=11人的平均值为73.7,标准差为9.55,均值标准误差为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值为0.668,六七列是总体均值与原假设值差的95%的置信区间,为,由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值为0.668,a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为,所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
13、利用促销方式数据,试分析这三种推销方式是
12/18
精品文档
否存在显著差异,绘制各组均值的对比图,并利用LSD方法进行多重比较检验。
单因素方差分析对比图为options中的descriptivesLSD为post„中的P值大于a接受所以无关
14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相差是否显著,
表1:
急性心肌梗塞患者治疗后24小时生死情况
?
提出假设
H0:
是否接受治疗的急性心肌梗塞患者的病死率相差不显著H1:
是否接受治疗的急性心肌梗塞患者的病死率相差显著
?
操作步骤:
1、打开数据文件:
file,open,data,example1.sav、对count变量进行weightcases处理:
data,weightcases
选中weightcasesby;在Frequenciesvariable
中加入变量count。
、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3,1:
用descriptive-crosstab过程,column填status,row填group。
在cell选项中,选中percentages,以计算频数百分比。
?
统计表格及分析:
表3,1是否接受治疗与生存状况的相关性检验成果
13/18
精品文档
表
Asymp.Sig.
PearsonChi-SquareLinear-by-Linear
Association有效个案数
Value.040.01240
df11
.01.014
表3,1是相关性卡方检验成果表。
表中依次列出了Pearson卡方系数、线性相关的值、自由度和双尾检验的显著水平。
表3,2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。
表3,急性心肌梗塞患者是否治疗与生死情况的列联表
分组)总数
用单参注射液
未用单参注射液
Count
%within分组Count
%within?
分组Count
%within?
分组
14/18
精品文档
状况
总数19100.0%100.0%40100.0%
生存
1894.9%84.4%292.9%
死亡
10.1%15.6%17.1%
?
结论:
根据表3,1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。
15、已知数据如表2所示,比较单用甘磷酰芥与复合使用光霉素、环磷酰胺等药对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别,
表2:
两化疗组的缓解率比较
同上小于拒绝显著
16、已知数据如表3所示,问我国南北方鼻咽癌患者的病理组织学分类的构成比有无差别,同上小于拒绝显著
表3:
我国南北方鼻咽癌患者病理组织学分类构成
17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
1、打开数
15/18
精品文档
据文件:
file,open,data,child.sav
2、均值比较与检验:
Analyze,Comparemeans,means、在independentVar.中选性别,dependentVar.中选体重和身高、在option子框中选择median/mean/Std.
Deviation
1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。
、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。
、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。
18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响,
?
提出假设:
1、H0:
身高与体重受到年龄的影响不显著H1:
身高与体重受到年龄的影响显著、H0:
身高与体重受到性别的影响不显著H1:
身高与体重受到性别的影响显著
?
操作步骤:
16/18
精品文档
1、打开数据文件:
file,open,data,child.sav、均值比较与检验:
analysis,comparemeans,means
3、在independentVar.中选性别和年龄,dependentVar.中选体重和身高、在option子框中选择median/mean/Std.Deviation
在statisticforfirstlayer区域内勾上ANOVAtableandeta复选框
?
统计表格及分析:
表7,1体重、身高与年龄的方差分析表
Mean
体重*年龄
身高*年龄
BetweenGroupsWithinGroupsTotal
BetweenGroupsWithinGroupsTotal
SumofSquares
286.21565.91852.131757.701554.855312.562
df9995
Square143.106.0878.8516.719
F3.51852.567
Sig..000
.000
在表7,1中,分别列出了平方和、自由度、均方差、
17/18
精品文档
F值以及F值的显著性水平。
F对应的概率值P,α;故拒绝原假设,接受备择假设,即身高与体重受到年龄的影响显著。
表7,体重、身高与性别的方差分析表
18/18