spss实践题分析及答案.docx
《spss实践题分析及答案.docx》由会员分享,可在线阅读,更多相关《spss实践题分析及答案.docx(19页珍藏版)》请在冰豆网上搜索。
spss实践题分析及答案
Documentserialnumber【UU89WT-UU98YT-UU8CB-UUUT-UUT108】
spss实践题分析及答案
期末实践考查
一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。
在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。
研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。
试按照客户要求进行分析,给出分析报告(数据见附表)。
DescriptiveStatistics
Mean
Std.Deviation
N
消费金额(元)
50
年收入(元)
50
家庭人口(人)
50
Correlations
消费金额(元)
年收入(元)
家庭人口(人)
PearsonCorrelation
消费金额(元)
.631
.753
年收入(元)
.631
.173
家庭人口(人)
.753
.173
Sig.(1-tailed)
消费金额(元)
.
.000
.000
年收入(元)
.000
.
.115
家庭人口(人)
.000
.115
.
N
消费金额(元)
50
50
50
年收入(元)
50
50
50
家庭人口(人)
50
50
50
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
家庭人口(人),年收入(元)
.
Enter
a.Allrequestedvariablesentered.b.DependentVariable:
消费金额(元)
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.909a
.826
.818
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
.672
2
.836
.000a
Residual
47
Total
.820
49
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.000
年收入(元)
.033
.004
.516
.000
家庭人口(人)
.664
.000
结果分析:
由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口
看作两个自变量,每年信用卡支付金额看作因变量。
由分析得:
:
信用卡支付金额
:
年收入
:
家庭人口
拟合优度检验
为,回归方程能很好的代表样本数据。
回归方程F检验和回归系数T检验的相伴概率都小于显着性水平,拒绝零假设即回归方程和回归系数都具显着型。
二、下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析,并给出分析报告。
运动员
大学生
身高
肺活量
身高
肺活量
4300
3850
4100
4300
4800
4000
5400
4000
4800
4800
4500
4780
3700
5250
4250
4800
5000
3700
3600
4050
3450
4100
3800
3300
3450
3250
3600
3200
3950
4000
4150
3450
3250
4100
3650
3950
3500
3900
3450
3850
Between-SubjectsFactors
ValueLabel
N
类别
0
0
20
1
1
20
TestsofBetween-SubjectsEffects
DependentVariable:
肺活量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
2
.000
Intercept
1
.251
身高
1
.002
类别
1
.004
Error
37
Total
40
CorrectedTotal
.500
39
a.RSquared=.553(AdjustedRSquared=.529
结果分析:
控制变量的相伴概率值是,小于显着性水平,因此拒绝零假设,故在剔除身高对肺活量的影响前提下,是否经常进行体育锻炼对肺活量有显着影响;另外协变量相伴概率为,说明身高的不同水平对肺活量也有显着影响。
三、甲地区为大城市,乙地区为县城,丙地区为农村。
某地分别调查了上述三类地区8岁男生三项身体生长发育指标:
身高、体重和胸围,数据见下表,问:
三类地区之间男生三项身体生长发育指标的差异有无显着性试就此问题进行分析并给出分析报告。
结果分析:
由方差齐次性检验表可知,甲乙丙三个地区的的身高、体重和胸围的方差检验相伴概率都大于显着性水平,因此接受零假设,即三个地区的身高、体重和胸围方差相同没有显着性差异,即不同地区,身高、体总和胸围各总体均值服从方差相同的正态分布,因此可以用下面的单因素方差检验。
身高:
相伴概率为小于显着性水平,则各地区身高有显着性差异。
体重:
相伴概率为小于显着性水平,则各地区体重有显着性差异。
胸围:
相伴概率为小于显着性水平,则各地区胸围有显着性差异。
再由LSD,S-N-K和图表分析可知,甲地区(城市)8岁男孩身高和胸围与乙(县城)、丙(农村)地区有显着性差异,乙地区(县城)8岁男孩体重与甲(城市)、丙(农村)地区有显着性差异。
四、某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析,并给出分析报告。
编号
发硒
血硒
1
2
3
4
5
6
7
8
9
10
74
66
88
69
91
73
66
96
58
73
13
10
13
11
16
9
7
14
5
10
DescriptiveStatistics
Mean
Std.Deviation
N
发硒
10
血硒
10
Correlations
发硒
血硒
发硒
PearsonCorrelation
1
.872**
Sig.(2-tailed)
.001
N
10
10
血硒
PearsonCorrelation
.872**
1
Sig.(2-tailed)
.001
N
10
10
结果分析:
由分析可知,要进行发硒和血硒两个定距变量的相关分析。
由上图表可得发硒和血硒的pearson相关系数为,为高度相关。
假设检验得出的相伴概率小于显着水平,因此拒绝零假设,即可以用它们的样本相关系数r代替总体相关系数ρ。
五、某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表,试对该资料作控制体重影响作用的身高与肺活量相关分析,并给出分析报告。
编号
身高(cm)
体重(kg)
肺活量(ml)
编号
身高(cm)
体重(kg)
肺活量(ml)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1750
2000
2750
2500
2750
2000
2750
1500
2500
2250
3000
1250
2750
1750
2250
16
17
18
19
20
21
22
23
24
25
26
27
28
29
1750
2000
2250
2750
2000
1750
2250
2750
2500
2000
1750
2250
2500
1750
Correlations
ControlVariables
体重(kg)
肺活量(ml)
身高(cm)
-none-a
体重(kg)
Correlation
.613
.719
Significance(2-tailed)
.
.000
.000
df
0
27
27
肺活量(ml)
Correlation
.613
.588
Significance(2-tailed)
.000
.
.001
df
27
0
27
身高(cm)
Correlation
.719
.588
Significance(2-tailed)
.000
.001
.
df
27
27
0
身高(cm)
体重(kg)
Correlation
.337
Significance(2-tailed)
.
.079
df
0
26
肺活量(ml)
Correlation
.337
Significance(2-tailed)
.079
.
df
26
0
a.Cellscontainzero-order(Pearson)correlations.
结果分析:
由上表分析可知,体重和肺活量的相关系数为,身高和体重的相关系数为,身高和肺活量的相关系数为,三者之间为中度相关。
身高对体重和肺活量都有影响,剔除它的影响,采用偏相关分析,体重和肺活量相关系数为,为低度相关,相伴概率值为,大于显着性水平,因此接受原假设,即不可以用样本相关系数代替总体相关系数。
六、某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。
试分析“体表面积”可能满足的数学模型,并给出分析报告。
儿童编号
体表面积(Y)
身高(X1)
体重(X2)
1
2
3
4
5
6
7
8
9
10
Correlations
体表面积(Y)
身高(X1)
体重(X2)
PearsonCorrelation
体表面积(Y)
.869
.943
身高(X1)
.869
.863
体重(X2)
.943
.863
Sig.(1-tailed)
体表面积(Y)
.
.001
.000
身高(X1)
.001
.
.001
体重(X2)
.000
.001
.
N
体表面积(Y)
10
10
10
身高(X1)
10
10
10
体重(X2)
10
10
10
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
体重(X2),身高(X1)
.
Enter
a.Allrequestedvariablesentered.
b.DependentVariable:
体表面积(Y)
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.950a
.902
.874
.143346
a.Predictors:
(Constant),体重(X2),身高(X1)
b.DependentVariable:
体表面积(Y)
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2
.661
.000a
Residual
.144
7
.021
Total
9
a.Predictors:
(Constant),体重(X2),身高(X1)b.DependentVariable:
体表面积(Y)
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.649
身高(X1)
.069
.075
.215
.919
.389
体重(X2)
.184
.057
.758
.014
结果分析:
由题目要求可知,这是一个多元线性回归问题。
上述图表知,体表面积与身高体重的关系为
其中
:
体表面积
:
身高
:
体重
拟合优度检验
为,回归方程能很好的代表样本数据。
回归方程F检验和回归系数T检验的相伴概率都小于显着性水平,拒绝零假设即回归方程和回归系数都具显着型。
七、某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试分析锡克试验阴性率,并给出分析报告。
年龄(岁)
X
锡克试验阴性率(%)
Y
1
2
3
4
5
6
7
ModelDescription
ModelName
MOD_2
DependentVariable
1
锡克试验阴性率(%)
Equation
1
Inverse
2
Cubic
3
Sa
IndependentVariable
年龄
Constant
Included
VariableWhoseValuesLabelObservationsinPlots
Unspecified
ToleranceforEnteringTermsinEquations
.0001
ModelSummaryandParameterEstimates
DependentVariable:
锡克试验阴性率(%)
Equation
ModelSummary
ParameterEstimates
RSquare
F
df1
df2
Sig.
Constant
b1
b2
b3
Inverse
.975
1
5
.000
Cubic
.994
3
3
.001
.381
S
.983
1
5
.000
Theindependentvariableis年龄.
结果分析:
首先由散点图可知,锡克试验阴性率与年龄为非线性关系,因此采用曲线拟合。
由表格可知,最佳拟合曲线为三次曲线(cubic),拟合优度
为,最佳拟合曲线方程为:
:
:
锡克试验阴性率(%)
:
年龄
八、某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对,共8对,并将每对中的两头白鼠随机分到正常饲料组和维生素E缺乏组,过一定时期,测得其肝中维生素A含量。
试分析不同饲料的大白鼠肝中维生素A含量有无差别,给出分析报告(数据见附表)
结果分析:
同种属的大白鼠按性别相同,年龄、体重相近者配成对,该问题属于两配对样本t检验。
由分析得两配对样本t检验的相伴概率值为:
,小于显着性水平,因此拒绝零假设,即大白鼠食物中维生素E的不同含量与肝中维生素A的含量有显着性差异。
九、测得西北某城市1971~2007年1月份平均气温数据(见附表)。
分析该城市90年代前后的温度有无显着差异,给出分析报告。
结果分析:
由于90年代前后1月份平均气温之间相互独立,属于两独立样本t检验的问题。
由分析可得,方差齐次性性F检验的相伴概率是,大于显着性水平,因此接受零假设,即90年代前后方差相同。
t检验相伴概率值为,小于显着性水平,因此拒绝零假设,即该城市90年代前后的温度有显着差异。