spss练习题及简答要点.docx
《spss练习题及简答要点.docx》由会员分享,可在线阅读,更多相关《spss练习题及简答要点.docx(29页珍藏版)》请在冰豆网上搜索。
![spss练习题及简答要点.docx](https://file1.bdocx.com/fileroot1/2022-10/17/627522c3-6c3a-4885-9504-b1a8dbe67a57/627522c3-6c3a-4885-9504-b1a8dbe67a571.gif)
spss练习题及简答要点
SPSS练习题
1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。
先排序data---sortcases再合并data---mergefiles
2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。
转换Data---transpose,输题目
3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
选取数据data---selectcases
4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。
排序data---sortcases一个一个选,加
5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算transform---count按个输,把所有课程选取,define设区间,再排序
6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。
描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptivestatistics---descriptives,全选,options。
先拆分data---splitfile按性别拆分,analyze---descriptivestatistics---descriptives全选所有课程options---mean
7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
数据分组Transform---recode---下面一个,输名字,change,old,range,newvalue---add挨个输,从小加到大,等距
8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
(计算transform---count或)选取data---selectcases
9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
Analyze---descriptivestatistics---frequencies
10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。
AnDSdAnalyze---DescriptiveStatistics---Descriptives,选择存款金额到Variable(s)中。
按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variablelist.然后按continue,ok
11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。
Transformcompute课程平均分=mean()analyze->comparemeans->independent-samplesT;选择若干变量作为检验变量到testvariables框(课程平均分);选择代表不同总体的变量(sex)作为分组变量到groupingvariable框;.定义分组变量的分组情况DefineGroups...:
(填1,2)。
1.两总体方差是否相等F检验:
F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaualvariancesassumend。
2.两总体均值的检验:
.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。
配对差异:
analyze->comparemeans->paired-samplesT…pairedvariables框中每科与不同科目配对很麻烦略
12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75,现从雇员中随机随出11人参加考试,得分如下:
80、81、72、60、78、65、56、79、77、87、76,请问该经理的宣称是否可信?
步骤:
采用单样本T检验(原假设H0:
u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:
Analyze->comparemeans->one-samplesTtest;指定检验值:
在test后的框中输入检验值(填75),最后ok!
分析:
N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(stderrormean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图,并利用LSD方法进行多重比较检验。
单因素方差分析对比图为options中的descriptivesLSD为post…中的P值大于a接受所以无关
14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相差是否显著?
(example1.sav)(显著性水平为5%)
表1:
急性心肌梗塞患者治疗后24小时生死情况
生存
死亡
用单参注射液
187
11
未用单参注射液
36
6
合计
223
17
·提出假设:
H0:
是否接受治疗的急性心肌梗塞患者的病死率相差不显著
H1:
是否接受治疗的急性心肌梗塞患者的病死率相差显著
·操作步骤:
1、打开数据文件:
-data-example1.sav
2、对count变量进行weightcases处理:
data-weightcases
选中weightcasesby;在Frequenciesvariable中加入变量count。
3、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3-1:
用descriptive-crosstab过程,column填status,row填group。
在cell选项中,选中percentages,以计算频数百分比。
·统计表格及分析:
表3-1是否接受治疗与生存状况的相关性检验成果表(Chi-SquareTests)
Value
df
Asymp.Sig.(2-sided)
PearsonChi-Square
6.040(b)
1
.014
Linear-by-LinearAssociation
6.015
1
.014
有效个案数
240
表3-1是相关性卡方检验成果表。
表中依次列出了Pearson卡方系数、线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp.Sig.(2-sided))。
表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。
表3-2急性心肌梗塞患者是否治疗与生死情况的列联表
状况(status)
总数
生存
死亡
分组(group))
用单参注射液
Count
185
10
195
%within分组(group)
94.9%
5.1%
100.0%
未用单参注射液
Count
38
7
45
%within·分组(group)
84.4%
15.6%
100.0%
总数
Count
223
17
240
%within·分组(group)
92.9%
7.1%
100.0%
·结论:
根据表3-1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。
15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?
(example2.sav)(显著性水平为5%)
表2:
两化疗组的缓解率比较
治疗组
缓解
未缓解
合计
单纯化疗
2
10
12
复合化疗
14
13
27
合计
16
23
39
同上小于拒绝显著
16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?
(example3.sav)(显著性水平为5%)同上小于拒绝显著
表3:
我国南北方鼻咽癌患者病理组织学分类构成
地域
淋巴上皮癌
未分化癌
磷癌
其他
合计
南方四省
71
6
16
18
111
东北三省
89
18
22
51
180
合计
160
24
38
69
291
17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
1、打开数据文件:
-data-child.sav
2、均值比较与检验:
Analyze-Comparemeans-means
3、在independentVar.中选性别,dependentVar.中选体重和身高
4、在option子框中选择median/mean/Std.Deviation
1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。
2、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。
3、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。
18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?
(显著性水平为5%)
·提出假设:
1、H0:
身高与体重受到年龄的影响不显著
H1:
身高与体重受到年龄的影响显著
2、H0:
身高与体重受到性别的影响不显著
H1:
身高与体重受到性别的影响显著
·操作步骤:
1、打开数据文件:
-data-child