spass回归分析实验报告.docx
《spass回归分析实验报告.docx》由会员分享,可在线阅读,更多相关《spass回归分析实验报告.docx(10页珍藏版)》请在冰豆网上搜索。
spass回归分析实验报告
实验主题
专业统计软件应用
实验题目
回归分析
实训时间
2011学年2学期15周(2011年6月1日—2日)
学生姓名
官其虎
学号
2009211467
班级
0360901
实训地点
信息管理实验室
设备号
B25
指导教师
刘进
一实验目的
回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程,这一数学表达式通常称为经验公式。
我们不仅可以利用概率统计知识,对这个经验公式的有效性进行判定,同时还可以利用这个经验公式,根据自变量的取值预测因变量的取值。
如果是多个因素作为自变量的时候,还可以通过因素分析,找出哪些自变量对因变量的影响是显著的,哪些是不显著的。
理解和学会使用回归分析方法解决问题。
二实验内容
第一题:
合金钢的强度y与钢材中碳的含量x有密切的关系,为了冶炼出符合要求强度的钢,常常通过控制钢水中的碳含量来达到目的,因此需要了解y与x之间的关系,数据如表9.27所示,现对x和y进行一元线性回归分析。
(数据文件为:
data9-5.sav)
表9.27碳含量与钢强度数据
碳含量
0.03
0.04
0.05
0.07
0.09
0
1
0.12
0.15
0.17
0.2
钢强度
40.5
39.5
41
41.5
43
42
45
47.5
53
56
1、实验原理:
一元线性回归分析
2、实验步骤:
按Analyze|Regression|LinearRegression的顺序打开LinearRegression对话框,打
开Statistics对话框,选择Confidenceinterval和Estimates运行
3、实验结果:
VariablesEntered/Removedb
Model
VariablesE
tered
VariablesRemoved
Method
1
xa
.
Enter
a.Allrequestedvariablesentered.
b.DependentVariable:
Y
ModelSummary
Model
R
RSquare
AdjustedR
Square
Std.ErroroftheEstimate
1
.983a
.966
.962
77.3073
a.Predictors:
(Constant),x
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
1517083.637
1
1517083.637
253.845
.000a
Residual
53787.772
9
5976.419
Total
1570871.409
10
a.Predictors:
(Constant),x
b.DependentVariable:
Y
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
95%ConfidenceIntervalforB
B
Std.Error
Beta
LowerBound
UpperBound
1
(Constant)
-94.575
28.417
-3.328
.009
-158.858
-30.292
x
1410.210
88.511
.983
15.933
.000
1209.983
1610.437
a.DependentVariable:
Y
分析:
一个是方差分析表,是对回归方程进行显著性检验的情况。
从结果看,相伴概率Sig.<0.05,说明自变量x与因变量y之间确有线性关系。
一个是是对回归系数的分析。
从两系数的相伴概率来看均<0.05,说明均具有显著性意义,说明回归系数是显著的,则回归方程为:
y=-94.575+1410.210x。
第二题:
某公司太阳镜销售情况如表8.17,销售量与平均价格、广告费用和日照时间之间的关系作多元线性回归分析。
(数据文件:
data8-8.sav)
1、实验原理:
多元线性回归分析
2、实验步骤:
第1步分析:
显然是采用多重线性回归分析方法;
第2步建立数据文件,变量名销售量与平均价格、广告费用和日照时间第3步按Analyze|Regression|linear…的顺序打开LinearRegression主对话框,,并将销售量设为因变量,其余变量设为自变量。
我们可选择其中任一种方法进行回归分析(这里选Stepwise,逐步
回归法),无论选哪种方法,进入方程的变量必须符合容许偏差,默认的容许偏差是0.0001。
同样一个变量若使模型中变量的容许偏差低于默认的容许偏差,则不进入方程;
第4步单击Statistics按钮,打开LinearRegression:
Statistics对话框,并选择Modelfit和
Estimates;
第5步打开LinearRegression:
Option框,其中StepwiseMethodCriteria(逐步回归方法准测),应用于Stepwise,Backward,Forward方法,变量根据指定的F值或F值的显著性水平被引入或剔除模型。
UseprobabilityofF,当F值的显著性水平小于Entry值时,该变量将进入回归方程;若大于Removeal值时,则被剔除。
Entry值必须小于Removal值,且均为正
数。
若想更多的变量进入模型,可增大Entry值,若想在模型中剔除更多的变量,可以降低Removal值。
而UseFvalue是使用的F的值。
运行即可
3、实验结果:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
95%ConfidenceIntervalforB
B
Std.Er
or
Beta
LowerBound
UpperBound
1
(Constant)
119.594
29.373
4.072
.004
51.859
187.328
价格
-12.163
4.399
-.235
-2.765
.024
-22.306
-2.0
0
广告费用
2.319
.920
.292
2.522
.036
.199
4.440
日照时间
13.231
2.698
.504
4.905
.001
7.010
19.452
a.DependentVariable:
销量
分析:
表示有两种回归方程表达式:
销售量=119.594-12.163*价格;销售量=119.594+13.231*广告费用+2.698*日照时间
第三题:
研究青春发育阶段的年龄与远视率的变化关系,测得数据如表9.28所示,请对x与y的关系进行曲线估计。
(数据来源:
《统计学(第二版)》袁卫,高等教育出版社;数据文件:
data9-6.sav)
表9.28青春发育阶段年龄与远视率的变化关系
年龄(x)
6
7
8
9
10
11
12
13
14
15
16
17
18
远视率
y)
63.64
61.06
38.84
13.75
14.5
8.07
4.41
4.27
2.09
1.02
2.51
3.12
2.98
1、实验原理:
曲线估计
2、实验步骤:
第一步先用散点图的形式进行分析,看究竟是否具有线性相关性;按Graph|Scatter顺序打开Scatterplot对话框,并选择Simple,点击Define;
第2步现在进行曲线估计。
Analyze|Regression|CurveEstimation,将里面的模型全选上,看哪种模型拟合效果更好从拟合优度(Rsq即R2)来看,QUA,CUB,POW效果较好(因为其Rsq值较大),于是就选QUA,CUB,POW来进行。
重新进行上面的过程,只选以上三种模型。
3、实验结果:
ModelSummaryandParameterEstimates
DependentVariable:
远视率
Equation
ModelSummary
ParameterEstimates
RSquare
F
df1
df2
Sig.
Constant
b1
b2
b3
Linear
.674
22.710
1
11
.001
74.006
-4.768
Logarithmic
.793
42.251
1
11
.000
156.773
-57.574
Inverse
.883
83.244
1
11
.000
-40.567
615.321
Quadratic
.943
82.114
2
10
.000
192.085
-26.567
.908
Cubic
.959
69.538
3
9
.000
290.851
-54.717
3.398
-.069
Compound
.794
42.445
1
11
.000
308.120
.731
Power
.861
68.413
1
11
.000
49462.724
-3.638
S
.877
78.119
1
11
.000
-1.502
37.175
Growth
.794
42.445
1
11
.000
5.730
-.314
Exponential
.794
42.445
1
11
.000
308.120
-.314
Logistic
.794
42.445
1
11
.000
.003
1.369
Theindependentvariableis年龄.
分析:
可以用Cubic拟合曲线图的拟合效果最好。
第四题:
棉花单株在不同时期的成铃数(y)与初花后天数(x)存在非线性的关系,假设这一非线性关系可用Gompertz模型表示:
y=b1*exp(-b2*exp(-b3*x))。
某一棉花品种7月5日至9月3日每隔5天的单株成铃数观测值如表9.29所示。
试根据观测值拟合模型中的参数。
(数据来源:
《线性模型分析原理》朱军,科学出版社;数据文件为:
data9-7.sav)
表9.29棉花成铃数观测数据表
天数
5
10
15
20
25
30
35
40
45
50
55
60
65
成铃数
0.75
2
4
4.75
4.25
5.5
7.75
10.13
14.26
13.14
13.52
14.15
14.53
1、实验原理:
非线性回归分析
2、实验步骤:
第一步分析:
这显然是一个非线性回归的问题
第二步数据组织
第三步进行非线性回归分析
第四步主要结果及分析
3、实验结果:
IterationHistoryb
IterationNumbera
ResidualSumofSquares
Parameter
b1
b2
b3
1.0
1177.718
2.000
-4.000
65.000
1.1
1180.718
2.000
-4.000
65.000
Derivativesarecalculatednumerically.
a.Majoriterationnumberisdisplayedtotheleftofthedecimal,andminoriterationnumberistotherightofthedecimal.
b.Runstoppedafter2modelevaluationsand1derivativeevaluationsbecausetherelativereductionbetweensuccessiveparameterestimatesisatmostPCON=1.00E-008.
ParameterEstimates
Parameter
Estimate
Std.Error
95%ConfidenceInterval
LowerBound
UpperBound
b1
2.000
.000
2.000
2.000
b2
-4.000
.000
-4.000
-4.000
b3
65.000
.000
65.000
65.000
CorrelationsofParameterEstimates
b1
b2
b3
b1
1.000
.
.
b2
.
.
.
b3
.
.
.
ANOVAa
Source
SumofSquares
df
MeanSquares
Regression
3.000
3
1.000
Residual
1177.718
10
117.772
UncorrectedTotal
1180.718
13
CorrectedTotal
287.968
12
Dependentvariable:
Y
a.Rsquared=1-(ResidualSumofSquares)/(CorrectedSumofSquares)=..
分析:
可以建立回归方程:
y=2*exp(4*exp(-65*x))
实训的心得与体会
通过本次实验用spass统计分析软件来进行回归分析后,感觉统计学中的很多问题不再像以前那么陌生了,同时也感觉统计学不再是想象中那么困难,之前学习统计学最怕的就是对数据进行求解与分析,现在使用这款软件后,让我从之前对统计学的陌生转变为熟悉,从此,在解决统计方面的问题又多了一项解决的工具:
spss。