回归分析练习题有答案Word格式.docx
《回归分析练习题有答案Word格式.docx》由会员分享,可在线阅读,更多相关《回归分析练习题有答案Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据
(2)的结果估计当房屋面积为时的销售价格.
(4)求第2个点的残差。
二、填空题
16.甲
17.列联表、三维柱形图、二维条形图
18.随机误差
19.解析:
ei恒为0,说明随机误差对yi贡献为0.
答案:
1.
20.解析:
(1)列表如下:
i
1
22
38
55
65
70
44
114
220
325
420
9
16
25
36
,,,
于是,
∴线性回归方程为:
(2)当x=10时,(万元)
即估计使用10年时维修费用是1238万元回归方程为:
(2)预计第10年需要支出维修费用12.38万元.
21.解析:
(1)数据对应的散点图如图所示:
(2),,
设所求回归直线方程为,
则
故所求回归直线方程为
(3)据
(2),当时,销售价格的估计值为:
(万元)
1、对于一元线性回归,,,
,下列说法错误的是
(A),的最小二乘估计,都是无偏估计;
(B),的最小二乘估计,对,,...,是线性的;
(C),的最小二乘估计,之间是相关的;
(D)若误差服从正态分布,,的最小二乘估计和极大似然估计是不一样的.
2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换.如果误差方差与因变量的期望成正比,则可通过下列哪种变换将方差常数化
(A);
(B);
(C);
(D).
3、下列说法错误的是
(A)强影响点不一定是异常值;
(B)在多元回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的;
(C)一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量;
(D)异常值的识别与特定的模型有关.
4、下面给出了4个残差图,哪个图形表示误差序列是自相关的
(A)(B)
(C)(D)
5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的
(A)(B)
二、填空题(每空2分,共20分)
1、考虑模型,,其中,秩为,不一定
已知,则__________________,___________,若服从正态分布,则
___________,其中是的无偏估计.
2、下表给出了四变量模型的回归结果:
来源
平方和
自由度
均方
回归
残差
总的
65965
---
66042
14
则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________.
3、已知因变量与自变量,,,,下表给出了所有可能回归模型的AIC值,则最优子集是_____________________.
模型中的变量
AIC
,
,,
202.55
2.68
142.49
62.44
3.04
198.10
315.16
,,,
3.50
5.00
7.34
138.23
2.12
5.50
138.73
4、在诊断自相关现象时,若,则误差序列的自相关系数的估计值=_____,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法.
5、设因变量与自变量的观察值分别为和,则以为折点的折线模型可表示为_____________________.
三、(共45分)研究货运总量(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的线性回归关系.观察数据及残差值、学生化残差、删除学生化残差、库克距离、杠杆值见表一
表一
编号
160
35
1.0
-15.474
-0.894
-0.876
0.166
0.454
260
75
40
2.4
12.825
0.628
0.593
0.031
0.240
210
2.0
5.344
0.265
0.243
0.006
0.261
265
74
42
3.0
-0.091
-0.004
1.168E-6
0.199
240
72
1.2
33.225
1.754
2.294
0.409
0.347
68
45
1.5
-25.198
-2.116
-3.832
3.216
0.742
7
275
78
4.0
-17.554
-1.173
-1.220
0.501
8
66
-20.007
-1.163
-1.206
0.289
0.461
3.2
8.234
0.379
0.015
0.264
10
250
18.695
1.065
1.079
0.222
0.439
表二参数估计表
变量
系数
标准误
Intercept
-348.280
3.754
7.101
12.447
176.459
1.933
2.880
10.569
总平方和SST=16953残差平方和SSE=3297
已知,,,,根据上述结果,解答如下问题:
1、计算误差方差的无偏估计及判定系数.(8分)
2、对,,的回归系数进行显著性检验.(显著性水平)(12分)
3、对回归方程进行显著性检验.(显著性水平)(8分)
4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?
(10分)
5、写出关于,,的回归方程,并结合实际对问题作一些基本分析(7分)
四、(共8分)某种合金中的主要成分为金属A与金属B,研究者经过13次试验,发现这两种金属成分之和与膨胀系数之间有一定的数量关系,但对这两种金属成分之和是否对膨胀系数有二次效应没有把握,经计算得与的回归的残差平方和为3.7,与、的回归的残差平方和为0.252,试在0.05的显著性水平下检验对是否有二次效应?
(参考数据)
五、(共12分)
(1)简单描述一下自变量之间存在多重共线性的定义;
(2分)
(2)多重共线性的诊断方法主要有哪两种?
(4分)
(3)消除多重共线性的方法主要有哪几种?
(6分)
应用回归分析试题
(二)
16.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数的值分别约为0.96和0.85,则拟合效果好的模型是 甲 .
17.在回归分析中残差的计算公式为列联表、三维柱形图、二维条形图.
18.线性回归模型(和为模型的未知参数)中,称为 随机误差 .
19.若一组观测值(x1,y1)(x2,y2)…(xn,yn)之间满足yi=bxi+a+ei(i=1、2.…n)若ei恒为0,则R2为___ei恒为0,说明随机误差对yi贡献为0.
必看经典例题
1.从20的样本中得到的有关回归结果是:
SSR=60,SSE=40。
要检验x与y之间的线性关系是否显著,即检验假设:
。
(1)线性关系检验的统计量F值是多少?
(2)给定显著性水平a=0.05,Fa是多少?
(3)是拒绝原假设还是不拒绝原假设?
(4)假定x与y之间是负相关,计算相关系数r。
(5)检验x与y之间的线性关系是否显著?
解:
(1)SSR的自由度为k=1;
SSE的自由度为n-k-1=18;
因此:
F===27
(2)==4.41
(3)拒绝原假设,线性关系显著。
(4)r===0.7746,由于是负相关,因此r=-0.7746
(5)从F检验看线性关系显著。
2.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源
df
SS
MS
F
Significance