应用统计学课程设计报告书Word文件下载.docx
《应用统计学课程设计报告书Word文件下载.docx》由会员分享,可在线阅读,更多相关《应用统计学课程设计报告书Word文件下载.docx(23页珍藏版)》请在冰豆网上搜索。
Std.Deviation
10.20097
Variance
104.060
Skewness
-.403
Std.ErrorofSkewness
.536
Kurtosis
-.462
Std.ErrorofKurtosis
1.038
Range
34.55
Minimum
44.00
Maximum
78.55
Sum
1142.98
aMultiplemodesexist.Thesmallestvalueisshown
第一产业
Frequency
Percent
ValidPercent
CumulativePercent
1
5.6
44.76
11.1
53.61
16.7
55.70
22.2
56.99
27.8
58.17
33.3
58.86
38.9
62.00
44.4
64.12
50.0
65.24
55.6
65.80
61.1
68.83
66.7
69.30
72.2
70.72
77.8
73.28
83.3
76.41
88.9
76.64
94.4
100.0
Total
12.2.2描述性分析
利用SPSS求第一产业的Z分数,在数据窗口中,新变量“Z第一产业”表示“第一产业”Z分数。
如图所示DescriptiveStatistics
第一产业
ValidN(listwise)
12.3均值比较和t检验
12.3.1Means(均值)过程
Means过程的结果输出较简单,在结果输出窗口中包含以下输出表。
Cases
Included
Excluded
100.0%
.0%
Report
生活消费
世纪
20
238.3300
10
41.42102
1715.701
21
418.5950
8
80.12879
6420.624
318.4478
109.76177
12047.646
ANOVATable
SumofSquares
df
MeanSquare
F
Sig.
生活消费*世纪
BetweenGroups
(Combined)
144424.312
38.267
.000
WithinGroups
60385.676
16
3774.105
204809.988
17
MeasuresofAssociation
Eta
EtaSquared
.840
.705
(1)处理样本数统计,如图所示。
其中Ilude栏表示参加分析计算的样本数,从表中可知全部样本共有18个参考分析,占到全部样本的100%,即分析计算中没有因数据缺测或其他原因等导致的exclued。
(2)变量分组统计结果,如图所示,可以看出生活消费20世纪的平均值为238.3300,标准差41.42102,,21世准差纪平均值为418.5950,标准差为80.12879。
结果表明生活消费两个世纪里有很大差异,21世纪比20世纪的生活消费明显高
12.3.2单一样本t检验
One-sampleTTest过程的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表。
(1)输出结果第一个表,基本描述性统计量表,从表中可知,参与分析的样品为18,平均消费量为2784.616。
标准差为816.63712,均值误差为192.48321。
(2)输出结果第二个表,单一样本t检验表,从表中可知,自由度df=17,根据公式计算的t值等于4.076。
对应的临界置信水平为0.001。
95%的置信区间为(378.5120,1190.7202)。
计算的t值对应的临界置信水平远远小于的设置的0.05,因此拒绝原假设Ho,表明生活消费与原设想水平存在明显差异。
如图
One-SampleStatistics
Std.ErrorMean
能源终端消费
2784.6161
816.63712
192.48321
One-SampleTest
TestValue=2000
t
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
4.076
.001
784.61611
378.5120
1190.7202
12.3.3双样本t检验
Independent-SamplesTTest的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表两个输出结果如图所示
,
(1)描述性统计表。
给出了一些基本描述性统计量。
由输出结果可以看出,连个世纪生活消费的平均值分别为238.33,418.5950,标准差分别为41.42102,80.12879,均值误差分别为13.09848,28.32981。
(2)T检验表,表示双样本T检验结果,F的相伴概率为3.986,大于显著性水平0.05.,接受方差相等的零假设,可疑认为两个世纪里的生活消费方差无显著性差异,然后看方差相等时的t检验结果。
也就是第一行方差相等的t检验结果,t统计量的相伴概率为0.000小于0.05,不接受t检验的零假设,也就是说领个世纪的生活消费平均值存在差异。
Descriptives
能源终端消费量
Std.Error
95%ConfidenceIntervalforMean
LowerBound
UpperBound
186.83
2250.8500
2250.85
212.33
1961.5800
1961.58
214.55
2233.0600
2233.06
218.73
2539.4600
2539.46
219.09
2062.3500
2062.35
221.61
1920.6100
1920.61
241.47
2312.7900
2312.79
256.52
2374.0700
2374.07
283.82
2353.7100
2353.71
290.12
2553.6000
2553.60
328.35
2352.2100
2352.21
352.66
2724.3200
2724.32
378.04
2966.5600
2966.56
399.80
3084.4900
3084.49
426.41
3522.1500
3522.15
473.99
3901.2800
3901.28
493.76
4294.9300
4294.93
533.98
4715.0700
4715.07
2378.5120
3190.7202
[DataSet1]
ANOVA
11337235.100
666896.182
LinearTerm
Contrast
10139187.127
Deviation
1198047.973
74877.998
Correlations
12.4方差分析
结果解读:
我重点解读描述性统计表.方差分析表.各族均值折线图
(1)输出结果文件中的第一个表格为描述性统计量表。
从表中可知,输出的统计量表包括各组样本均值,标准差,标准误差,均值95%置信度区间,最小值和最大值,如各组参与分析的样本数都为1,总样本数为18。
(2)输出结果文件中的第二个表格方差分析表。
总离差平方和为11337235.100,组间离差平方和为11337235.100,组内离差平方和为0,组间离差平方和中能被线性解释的部分为10139187.127,方差检验0,对应的相伴概率为0,小于显著性水平0.05,以此认为18组中至少有一组能与另外一组差异显著。
(3)输出结果图,各组均值折线图,可以看出91和95年的均值相对较少。
Correlations
能源终端消费量
第三产业
PearsonCorrelation
.934(**)
SumofSquaresandCross-products
2239987.573
Covariance
131763.975
506884.345
29816.726
**Correlationissignificantatthe0.01level(2-tailed).
DescriptiveStatistics
547.6189
172.67520
12.5相关分析
12.5.1相关分析的原理及应用
从表中看出,两个变量的样本数都为18,能源终端消费量的均值为2784.6161,标准差为816.63712,;
第三产业的均值为547.6189,标准差为172.6752。
相关系数极显著性统计表。
能源终端消费量和第三产业的相关系数r=0.934显著性水平为0.000,因此可见能源终端消费量和第三
(2)产业的相关性十分显著。
DescriptiveStatistics
第二产业
1855.0511
551.63183
ControlVariables
-none-(a)
Correlation
1.000
.989
.934
Significance(2-tailed)
.875
.993
15
(3)aCellscontainzero-order(Pearson)correlations
12.5.2偏相关分析
结果解读:
从表中可知,参与分析的能源终端消费量和第三产业,第二产业3个变量的样本数都为18,其中能源终端消费量的均值为2784.6161,标准差为816.63712,。
第三产业的均值为1855.0511,标准差为551.63283,。
第二产业的均值为547.6189,标准差为172.67520。
变量间的相关系数,偏相关系数和显著性检验结果。
能源终端消费量和第二产业的相关系数为0.989,显著性水平为0.000,即能源终端消费量和第二产业是相关的;
以第三产业为控制变量,能源终端消费量和第二产业的相关系数为0.993,显著性水平为0.000,可知在扣除第三产业的基础上能源终端消费量和第二产业仍然相关性显著。
ModelSummary(b)
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
.934(a)
.873
.865
299.83744
aPredictors:
(Constant),第三产业
bDependentVariable:
能源终端消费量
ANOVA(b)
Regression
9898795.212
110.106
.000(a)
Residual
1438439.888
89902.493
Coefficients(a)
UnstandardizedCoefficients
StandardizedCoefficients
B
Beta
(Constant)
364.617
241.212
1.512
.150
4.419
.421
10.493
aDependentVariable:
能源终端消费量12
12.6回归分析
12.6.1一元线性回归分析
(1)常用统计量。
相关系数R=0.934,决定系数R2=0.873,而调整绝对系数R2=0.865,回归估计的标准差S=299.83744,模型拟合效果很理想。
(2)方差分析表。
从表中知离差平方和=11337235.100,残差平方和=1438439.888,回归平方和=9898795.212。
回归的显著性检验中,统计量为F=110.106,,对应的置信水平为0.000,小于0.05,因此可认为方程是极显著的。
(3)回归系数分析表。
从表中可以看出,常数项为364.617,回归系数=4.419,回归系数检验统计量t=10.493,相伴概率值为0.000小于0.001。
由此可知回归方程为y=364.617+4.419x
Sig.(1-tailed)
VariablesEntered/Removed(b)
VariablesEntered
VariablesRemoved
Method
第三产业,第二产业(a)
Enter
aAllrequestedvariablesentered.
ModelSummary
.999(a)
.998
37.00117
(Constant),第三产业,第二产业
11316698.799
2
5658349.399
4132.937
20536.302
1369.087
12.6.2多元线性回归分析
(1)描述统计表。
参与分析的能源终端消费量,第二产业,第三产业的样本数均为18,其对应的均值分别为2784.6161,1855.0511,547.6189,其对应的标准差分别为816.63712,551.63183,172..67520。
(2)相关系数表。
第一栏给出了三个变量两两相关的系数表,因变量能源终端消费量和自变量第二产业的相关系数最大,