线性回归习题Word格式.docx
《线性回归习题Word格式.docx》由会员分享,可在线阅读,更多相关《线性回归习题Word格式.docx(9页珍藏版)》请在冰豆网上搜索。
A.相关程度很低B.不存在任何关系
C.不存在线性相关关系D.存在非线性关系
7.下列不属于相关关系的现象是()
A.银行的年利息率与贷款总额B.居民收入与储蓄存款
C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格
8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()
A.高度相关B.中度相关C.低度相关D.极弱相关
9.在回归分析中,被预测或被解释的变量称为()
A.自变量B.因变量C.随机变量D.非随机变量
10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()
A.
B.
C.
D.
11.下列哪个不属于一元回归中的基本假定()
A.误差项
服从正态分布B.对于所有的X,方差都相同
C.误差项
相互独立D.
12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误()
A.
C.
13.对不同年份的产品成本拟合的直线方程为
y表示产品成本,x表示不同年份,则可知()
A.时间每增加一个单位,产品成本平均增加1.75个单位
B.时间每增加一个单位,产品成本平均下降1.75个单位
C.产品成本每变动一个单位,平均需要1.75年时间
D.产品成本每减少一个单位,平均需要1.75年时间
14.在回归分析中,F检验主要是用来检验()
A.相关关系的显著性B.回归系数的显著性C.线性关系的显著性D.估计标准误差的显著性
15.说明回归方程拟合优度的统计量是()
A.相关系数B.回归系数C.判定系数D.估计标准误差
16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=()
A.97.08%B.2.92%C.3.01%D.33.25%
17.判定系数R2值越大,则回归方程()
A拟合程度越低B拟合程度越高
C拟合程度有可能高,也有可能低D用回归方程进行预测越不准确
18.居民收入与储蓄额之间的相关系数可能是()
A-0.9247B0.9247C-1.5362D1.5362
19.在对一元回归方程进行显著性检验时,得到判定系数R2=0.80,关于该系数的说法正确的是()
A.该系数越大,则方程的预测效果越好
B.该系数越大,则由回归方程所解释的因变量的变差越多
C.该系数越大,则自变量的回归对因变量的相关关系越显著
D.该回归方程中自变量与因变量之间的相关系数可能小于0.8
20.下列方程中肯定错误的是()
,r=0.65B.
r=-0.81
C.
r=0.42D.
r=-0.96
21.若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R2的取值范围是()
A.【0,1】B.【-1,0】C.【-1,1】D.小于0的任意数
二.填空题
1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能),理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验)。
若不能判断,则我们需要进行(t检验)检验,构造的检验统计量为(),它服从()分布。
在=α0.05水平下,该相关关系是否显著()。
2.如下两图中,图(图1)的相关系数会大一些。
我们能否用相关系数判断哪个图中数据间的相关性会强一些(不能),理由是(因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。
)
三.计算题
1.从n=20的样本中得到的有关回归结果如下:
SSR=80,SSE=60。
现要检验x与y之间的线性关系是否显著。
(1)SSR的自由度是多少?
SSE的自由度是多少?
.
(1)SSR的自由度是1,SSE的自由度是18。
(2)线性关系检验的统计量F值是多少?
(2)
(3)判定系数为多少?
其含义是什么?
判定系数
在y的总变差中,由57.14%的变差是由于x的变动说引起的。
(4)假定x与y之间是负相关,计算相关系数。
(
相关系数为-0.7559。
(5)给定显著性水平
,临界值
为4.414,检验x与y之间的线性关系是否显著。
因为
,所以拒绝原假设,x与y之间的线性关系显著。
2.从某一行业中随机抽区17家企业,为了解所得产量和生产费用的关系,现对有关数据进行了回归分析,其中所得产量为x(台),生产费用为y(万元),得到如下分析结果:
方差分析表
df
SS
MS
F
SignificanceF
回归分析
0.017
残差
75
-
总计
16
500
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
6.388
2.076
2.856
XVariable1
1.248
0.182
6.862
0.000
(1)完成上面的方差分析表。
(1)
1
425
85
15
5
(2)在生产费用的总方差中,有多少可以由产量来解释?
表明在维护费用的变差中,有85%的变差可由使用年限来解释。
(3)生产费用与产量的相关系数是多少?
(保留四位小数)
二者相关系数为0.9220,属于高度相关
(4)写出估计的回归方程并解释回归系数的实际意义。
回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。
(5)检验方程线性的显著性(
)。
线性关系显著性检验:
因为SignificanceF=0.017<
所以线性关系显著。
(6)当使用年限为20时,预测生产费用是多少?
当产量为10时,生产费用为31.348万元。
3.
下限95.0%
上限95.0%
-1.02
0.78
-1.31
0.21
-2.65
0.61
x1
0.24
0.01
4.84
0.00
0.02
0.36
x2
0.35
0.08
1.68
0.09
-0.22
0.51
x3
0.11
0.17
0.46
-0.06
0.29
上表是含有三个自变量的多元线性回归模型的Excel部分输出结果:
(1)这些数据对应的回归方程是什么?
(2)因变量变差中有多少能被模型解释?
因变量总体变差中有75.1%可以用模型中的四个自变量解释
(3)模型整体在统计上显著吗(显著性水平为0.05)?
说明理由。
因为sig.F=1.056E-06<
a=0.05,因此模型整体在统计上显著。
(4)模型中所有的自变量都是显著的吗(显著性水平为0.05)?
如果不是,哪些
不显著?
从哪里可以看出来?
不是所有自变量都显著。
其中,x2和x3变量不显著。
因为x1对应的P值=0.00<
0.05,拒绝原假设,即x1显著。
x2对应的P值=0.09>
0.05,不拒绝原假设,即x2不显著
x3对应的P值=0.46>
0.05,不拒绝原假设,即x3不显著
(5)在其他变量保持不变的情况下,自变量x1每变化一个单位,对应的因变量会
发生多大变化?
在其他变量保持不变的情况下,当自变量x1每变化一个单位时,对应的因变量会平均增加0.24个单位,对应的变化区间为(0.02,0.36)
(6)多重共线性什么含义,衡量多重共线性的方法是什么?
可以利用相关系数矩阵进行简单判断,在此基础上,通过方差膨胀因子VIF来检验。
多重共线性越严重,VIF值越大。
如果VIF>
5时,认为自变量间的相关性高,存在多重共线性问题。