回归分析试题Word文档格式.docx
《回归分析试题Word文档格式.docx》由会员分享,可在线阅读,更多相关《回归分析试题Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
39
54
根据上表可得回归方程
x+
a
中的
b
为9.4,据此模型预报广告费用为6万元时销售额为(
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
D.直线I过点(x,y)
广告费用x(万元)4235
销售额y(万元)49263954
y
为9.4,据此模型预报广告费用为6万元时销售额为()
1.下列关于残差的叙述正确的是()
A.
.残差就是方差
•残差可用来判断模型拟合的效果
残差就是随机误差B
C.残差都是正数D
解析:
选D.由残差的相关知识可知.
2.(2010年高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()
A.=-10x+200B.=10x+200C.=-10x—200D.=10x—200
选A.由于销售量y与销售价格x成负相关,故排除B、D.又当x=10时,A中y=100,而C中y=—300,C不符合题意,故选A.
3•如图四个散点图中,适合用线性回归模型拟合其中两个变量的是()
A.B.
C.D.
选B.图是正相关线性最强,图是负相关线性最强,散点图的点较分散.
4.(2011年高考辽宁卷)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:
万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调
查数据得到y对x的回归直线方程:
y=0.354X+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元.
由题意知[0.254(x+1)+0.321]—(0.254X+0.321)=0.254.
答案:
0.254一、选择题
1.下列各关系中是相关关系的是()路程与时间、速度的关系;
加速度与力的关系;
产品成本与产量的关系;
圆周长与圆面积的关系;
广告费支出与销售额的关系.
A.B.
选C.都是确定的函数关系.
2.能表示n个点与相应直线在整体上的接近程度的是()
A.(yi-i)B.(i-yi)
C.(yi-i)2D.(yi-)2
选C.残差平方和表示接近程度.
3.对两个变量y和x进行回归分析,得到一组样本数据:
(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()
A.由样本数据得到的回归方程=x+必过样本点的中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系
选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.
4•某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577X-0.448(x为人的年龄,y(单位:
%)为人体脂肪含量)•对
年龄为37岁的人来说,下面说法正确的是()
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.50%
选C.当x=37时,=0.577X37-0.448=20.901沁20.90,由此估计:
年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
5.在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x间的线性回归方程为()
A.=x+1B.=x+2
C.=2x+1D.=x—1
选A.由题意可知变量y与x成线性相关关系,且斜率=1,代入点(1,2),即可得出线性回归方程=x+1.
6.有下列数据
x123y35.9912.01
下列四个函数中,模拟效果最好的为()
A.y=3X2x—1B.y=Iog2x
C.y=3xD.y=x2
选A.当x=1,2,3,代入求y值,求最接近y的值.
二、填空题
7.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为.
由题意知=2,=3,=6.5,所以=一=3—6.5X2=—10,即回归直线的方程为=一10+6.5x.
=—10+6.5x
8•如图是x和y的一组样本数据的散点图,去掉一组数据后,剩下的4组数据的相关指数最大.
经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.
D(3,10)
9•为了考察两个变量y与x的线性相关性,测得x,y的13对数据,若y与x具有线性相关关系,则相关指数R2的取值范围是.
相关指数R2=1—.R2的取值范围是[0,1]•当R2=0时,即残差平方和等于总偏差平方和,解释变量效应为0,x与y没有任何关系;
当R2=1时,即残差平方
和为0,x与y之间是确定的函数关系;
其他情形,即当x与y是不确定的相关关系时,R2(0,1).
(0,1)
三、解答题
10.对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:
甲y=0.1x+1,乙y=—0.05x2+0.35x+0.7,
丙y=—0.8•0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.
解:
对甲模型:
残差平方和(yi—i)2=0.0109;
对乙模型:
残差平方和(yi—i)2=0.0049;
对丙模型:
残差平方和(yi—i)2=0.0004.
显然丙的残差平方和最小,故丙模型更接近于客观实际.
11•关于x与y有如下数据:
x24568y3040605070有如下的两个线性模型:
=6.5x+17.5;
=7x+17.
试比较哪一个拟合效果更好.
由可得yi—i与yi—的关系如下表:
yi—i—0.5—3.510—6.50.5yi——20—1010020所以(yi—i)2=(—0.5)2+(—3.5)2+102+(—6.5)2+0.52=155,
所以r=1-=1-=0.845.
由可得yi—i与yi—的关系如下表:
yi-i-1-58-9-3yi--20-1010020所以(yi-i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,
(yi-)2=(-20)2+(-10)2+102+02+202=1000.
所以R=1-=1—
=0.82.
由于R=0.845,R=0.82,0.845>
0.82,
所以R>
R.
故的拟合效果好于的拟合效果.
12.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下
时间x/天123456繁殖个数y612254995190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程;
(3)计算残差,相关指数R2,并描述解释变量与预报变量之间的关系.
(1)散点图如图所示:
⑵由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=Iny,贝U
x123456z1.792.483.223.894.555.25由计数器算得,相关系数r疋0.9999>
0.75,所以z与x有很强的线性相关关系.因此得=0.69x+1.112,则有=
e0.69x+1.112.
⑶
6.0612.0924.0948.0495.77190.9y612254995190=(yi-i)2=3.1643,
(yi-)2=-62~24642.83,
R2=1-~0.9999.
即解释变量时间对预报变量繁殖细菌的个数解释了99.99%.
所以r=1—=1—=0.845.
yi—i—1—58—9—3yi——20—1010020所以(yi—i)2=(—1)2+(—5)2+82+(—9)2+(—3)2=180,
(yi—)2=(—20)2+(—10)2+102+02+202=1000.
所以R=1—=1—
由于R=0.845,R=0.82,0.845>
0.82,
所以R>
故的拟合效果好于的拟合效果.
12.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下
时间x/天123456繁殖个数y612254995190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程;
(1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则
(3)
6.0612.0924.0948.0495.77190.9y6122549951