spss考试.docx
《spss考试.docx》由会员分享,可在线阅读,更多相关《spss考试.docx(13页珍藏版)》请在冰豆网上搜索。
spss考试
Spss考试
11203609徐亚飞经济2
286页练习五
1-(a)
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.993a
.987
.985
992.03949
a.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷)
b.DependentVariable:
粮食总产量(y万吨)
表1-(a)中各列数据项(从第二列开始)的含义依次为:
被解释变量和解释变量的负相关系数、判定系数R的平方、调整的判定系数R拔得平方,回归方程的估计标准误差。
一句该表可进行拟合优度的检验。
由于该方程中有多个解释变量,因此,应参考调整的判定系数。
由于调整的判定系数(0.985)较接近1.因此,认为拟合优度高,被解释变量可以被模型解释的部分较多,不能被解释道额部分少。
1-(b)
ANOVAa
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2206253676.582
5
441250735.316
448.361
.000b
Residual
29524270.640
30
984142.355
Total
2235777947.222
35
a.DependentVariable:
粮食总产量(y万吨)
b.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷)
表9-1(b)中格列数据项(从第一列开始)的含义依次为:
被解释变量的变差来源、离差平方和、自由度、方差、回归方程显著性检验中F检验统计量的观测值和概率p-值,可以看到:
被解释变量的总离差平方和为回归平方和2235777947.22及方差分别为2206253676.58和,441250735.316剩余平方和29524270.640及方差分别为和984142.355,F检验统计量的观测值为448.361,对应的概率p-值近似于0.一句表格可进行回归方程的显著性检验,如果显著性水平α为0.05,由于概率p-值小于显著水平α,应拒绝回归方程显著性检验的原假设,认为各回归系数不同是为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模
1-(c)
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
-24425.357
6443.948
-3.790
.001
粮食播种面积(万公顷)
-.289
.762
-.020
-.379
.707
.152
6.587
总播种面积(万公顷)
2.567
.673
.142
3.813
.001
.318
3.144
施用化肥量(kg/公顷)
130.899
11.640
.716
11.246
.000
.109
9.202
风灾面积比例(%)
-240.271
46.725
-.135
-5.142
.000
.643
1.555
农业劳动者人数(百万人)
46.420
9.330
.345
4.975
.000
.092
10.918
a.DependentVariable:
粮食总产量(y万吨)
表9-1(c)中各列数据项(从第二列开始)的含义依次为:
偏回归系数,偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t检验统计量的观测值、对应的概率P-值、解释变量的容忍度和方差膨胀因子。
依据表可以进行回归系数的显著性检验,写出回归方程和检测多重共线性。
如果显著性水平位0.05,除年份以外,其他变量的回归系数显著性检验的概率都大于显著性水平a,因此不拒绝原假设,认为这些偏回归系数与0无显著差异,他们与被解释变量的线性关系是不显著的,不应该保留在方程中。
由于该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,赢重新建模。
同事,从容忍度和方差膨胀因子看·,投入粮食总播种面积的年数与其他解释变量的多重共线性很严重,在重新建模时可考虑剔除该变量。
1-(d)
CollinearityDiagnosticsa
Model
Dimension
Eigenvalue
ConditionIndex
VarianceProportions
(Constant)
粮食播种面积(万公顷)
总播种面积(万公顷)
施用化肥量(kg/公顷)
风灾面积比例(%)
农业劳动者人数(百万人)
1
1
5.403
1.000
.00
.00
.00
.00
.00
.00
2
.471
3.385
.00
.00
.00
.10
.00
.00
3
.119
6.727
.00
.00
.00
.02
.78
.00
4
.005
32.885
.00
.01
.00
.84
.15
.60
5
.000
106.176
.98
.07
.10
.03
.02
.11
6
.000
182.145
.02
.92
.90
.01
.05
.29
a.DependentVariable:
粮食总产量(y万吨)
表9-1(d)中各列格列数据项(从第二列开始)的含义依次为:
特征值、条件指数、各项特征解各解释变量的方差比(各比例之和等于1)。
依据该表可进行多重共线性检测。
从方差比来看,第七个特征值既能解释投入粮食播种面积方差的92%,也可解释投入高级职称的人年数方差的90%,同时还可解释使用风灾面积的5%,因此有理由认为这些变量存在多重共线性;从条件指数来看,第5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。
总之,通过上述分析知道上面的回归方程中存在一些不容忽视的问题,应重新建立回归方程。
2-(a)
ModelSummaryc
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
Durbin-Watson
RSquareChange
FChange
df1
df2
Sig.FChange
1
.993a
.987
.985
992.03949
.987
448.361
5
30
.000
2
.993b
.987
.985
978.24472
.000
.144
1
30
.707
1.219
a.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷)
b.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),施用化肥量(kg/公顷)
c.DependentVariable:
粮食总产量(y万吨)
由表9-2(a)知,利用向后筛选策略共经过六步完成回归方程的建立,最终模型为第六个模型。
从方程建立的过程看,随着解释变量的不断减少,方程的拟合优度下降了。
这说明判定系数的自身特性,同时也说明建立回归方程并不是以一味追求高的拟合优度为唯一目标的,还要重点考察解释变量是否对被解释变量有所贡献。
依次剔除出方程的变量是风灾面积,粮食播种面积、总播种面积、施用化肥量、农业劳动量。
如果显著水平α为0.05。
可以看到这些被剔除变量的偏F检验的概率P-值均大于显著水平,因此均不能拒绝检验的原假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。
最终保留在方程中的变量是年数。
方程的DW检验值为1.219,残值存在一定程度的正自相关
2-(b)
ANOVAa
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2206253676.582
5
441250735.316
448.361
.000b
Residual
29524270.640
30
984142.355
Total
2235777947.222
35
2
Regression
2206112102.225
4
551528025.556
576.332
.000c
Residual
29665844.998
31
956962.742
Total
2235777947.222
35
a.DependentVariable:
粮食总产量(y万吨)
b.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷)
c.Predictors:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),施用化肥量(kg/公顷)
表9-2(b)中的第六个模型是最终的方程。
如果显著性水a为0.05,由于回归方程显著性检验的概率P-值小于显著性水平a,因此该解释变量与解释变量间的线性关系显著,建立线性模型是恰当的
2-(c)
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
-24425.357
6443.948
-3.790
.001
粮食播种面积(万公顷)
-.289
.762
-.020
-.379
.707
.152
6.587
总播种面积(万公顷)
2.567
.673
.142
3.813
.001
.318
3.144
施用化肥量(kg/公顷)
130.899
11.640
.716
11.246
.000
.109
9.202
风灾面积比例(%)
-240.271
46.725
-.135
-5.142
.000
.643
1.555
农业劳动者人数(百万人)
46.420
9.330
.345
4.975
.000
.092
10.918
2
(Constant)
-25376.413
5853.521
-4.335
.000
总播种面积(万公顷)
2.357
.380
.130
6.208
.000
.972
1.029
施用化肥量(kg/公顷)
130.616
11.454
.714
11.403
.000
.109
9.164
风灾面积比例(%)
-236.694
45.127
-.133
-5.245
.000
.670
1.492
农业劳动者人数(百万人)
48.295
7.801
.359
6.191
.000
.127
7.850
a.DependentVariable:
粮食总产量(y万吨)
表2(c)展示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。
如果显著性水平为0.05,则前五个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。
第六个模型是最终的方程,其回归系数显著性检验的概率值小于显著性水平,因此投入人年数与被解释变量间的线性关系显著,它保留在模型中是合理的。
最终的回归方程为:
该方程意味着投入年数每增加一个单位,会使立项课题数平均增加0.492个单位
2-(d
ExcludedVariablesa
Model
BetaIn
t
Sig.
PartialCorrelation
CollinearityStatistics
Tolerance
VIF
MinimumTolerance
2
粮食播种面积(万公顷)
-.020b
-.379
.707
-.069
.152
6.587
.092
a.DependentVariable:
粮食总产量(y万吨)
b.PredictorsintheModel:
(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),施用化肥量(kg/公顷)
表2-(d)展示了变量剔除方差的过程。
第2列~第4列各数据项的含义依次是:
在剔除其他变量的情况下,如果该变量保留在模型中,其标准化回归系数、t检验值和概率P-值将是什么。
例如,在模型三中,剔除风灾面积的情况下,如果保留投入高级职称的入年数,那么它的标准化回归系数将为-0.439,但回归系数的检验不显著(概率P-值为0.707)。
剔除风灾面积的入年数的情况下,如果保留风灾面积,那么它的标准化回归系数将为-0.103,但回归系数的检验不显著(概率P-值为0.669)。
)
3
One-SampleKolmogorov-SmirnovTest
StandardizedResidual
N
36
NormalParametersa,b
Mean
0E-7
Std.Deviation
.94112395
MostExtremeDifferences
Absolute
.100
Positive
.100
Negative
-.070
Kolmogorov-SmirnovZ
.600
Asymp.Sig.(2-tailed)
.865
a.TestdistributionisNormal.
b.Calculatedfromdata.
随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大趋势。
计算残差与预测值的等级相关系数为-0.106,且检验并不显著,认为异方差现象并不明显。
,
4
Correlations
StandardizedPredictedValue
StandardizedResidual
Spearman'srho
StandardizedPredictedValue
CorrelationCoefficient
1.000
-.106
Sig.(2-tailed)
.
.538
N
36
36
StandardizedResidual
CorrelationCoefficient
-.106
1.000
Sig.(2-tailed)
.538
.
N
36
36
另外,通过观察数据编辑窗口中的库克距离和杠杆值变量的值,发现没有明显的异常点。
179页
1
ANOVA
销售额
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
405.534
4
101.384
11.276
.000
WithinGroups
269.737
30
8.991
Total
675.271
34
表一是促销方式对销售额的单因素方差分析结果。
可以看到:
观测变量销售额的离差平方总额为405.534;如果仅考虑广告形式单个因素的影响,则销售额总变差中,不同广告形式可解释的变差为,405.534抽样误差引起的变差为269.737,它们的方差分别为101.384和8.991,相除所得的F统计量的观测值为11.276,对应的概率P-值近似为0.如果显著性水平a为0.05,由于概率P-值小于显著性水平a,因此应拒绝原假设,认为不同广告形式对销售额产生了显著影响,不同广告形式对销售额的影响效应不会为0.
2
ANOVA
销售额
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
405.534
4
101.384
11.276
.000
WithinGroups
269.737
30
8.991
Total
675.271
34
MultipleComparisons
DependentVariable:
销售额
LSD
(I)组数
(J)组数
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
第一组
第二组
-3.3000*
1.6028
.048
-6.573
-.027
第三组
.7286
1.6028
.653
-2.545
4.002
第四组
3.0571
1.6028
.066
-.216
6.330
第五组
-6.7000*
1.6028
.000
-9.973
-3.427
第二组
第一组
3.3000*
1.6028
.048
.027
6.573
第三组
4.0286*
1.6028
.018
.755
7.302
第四组
6.3571*
1.6028
.000
3.084
9.630
第五组
-3.4000*
1.6028
.042
-6.673
-.127
第三组
第一组
-.7286
1.6028
.653
-4.002
2.545
第二组
-4.0286*
1.6028
.018
-7.302
-.755
第四组
2.3286
1.6028
.157
-.945
5.602
第五组
-7.4286*
1.6028
.000
-10.702
-4.155
第四组
第一组
-3.0571
1.6028
.066
-6.330
.216
第二组
-6.3571*
1.6028
.000
-9.630
-3.084
第三组
-2.3286
1.6028
.157
-5.602
.945
第五组
-9.7571*
1.6028
.000
-13.030
-6.484
第五组
第一组
6.7000*
1.6028
.000
3.427
9.973
第二组
3.4000*
1.6028
.042
.127
6.673
第三组
7.4286*
1.6028
.000
4.155
10.702
第四组
9.7571*
1.6028
.000
6.484
13.030
*.Themeandifferenceissignificantatthe0.05level.