高考数学变量间的相关关系与独立性检验一轮专练.docx
《高考数学变量间的相关关系与独立性检验一轮专练.docx》由会员分享,可在线阅读,更多相关《高考数学变量间的相关关系与独立性检验一轮专练.docx(9页珍藏版)》请在冰豆网上搜索。
高考数学变量间的相关关系与独立性检验一轮专练
2015高考数学变量间的相关关系与独立性检验一轮专练
201高考数学变量间的相关关系与独立性检验一轮专练
时训练练题感提知能
【选题明细表】
知识点、方法题号
相关关系的判定1、14
回归直线2、3、6、9、10、12
独立性检验、8、13
综合应用4、、7、11、14
一、选择题
1(2013衡水中学模拟)对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( A )
(A)r2<r4<0<r3<r1(B)r4<r2<0<r1<r3
()r4<r2<0<r3<r1(D)r2<r4<0<r1<r3
解析:
由题图知
(1)(3)为正相关,
(1)中的点大致集中在一条直线附近,(3)较分散,所以r1>r3>0,又
(2)(4)为负相关且
(2)较集中在直线附近,(4)较分散,所以r2<r4<0综上得r2<r4<0<r3<r1故选A
2某产品的广告费用x与销售额的统计数据如表:
广告费用x(万元)423
销售额(万元)4926394
根据表可得回归方程=x+中的为94,据此模型预报广告费用为6万元时销售额为( B )
(A)636万元(B)6万元
()677万元(D)720万元
解析:
样本中心点是(3,42),
则=-=42-94×3=91,
所以回归方程是=94x+91,
把x=6代入得=6
故选B
3(2013青岛市模拟)某商品销售量()与销售价格x(元/)负相关,则其回归方程可能是( A )
(A)=-10x+200(B)=10x+200
()=-10x-200(D)=10x-200
解析:
由于销售量与销售价格x负相关,因此回归方程中的系数<0,故排除选项B,D选项中,当x=0时,=-200,与实际问题不符合,排除选项故选A
4
设(x1,1),(x2,2),…,(xn,n)是变量x和的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( A )(A)直线l过点(,)
(B)x和的相关系数为直线l的斜率
()x和的相关系数在0到1之间
(D)当n为偶数时,分布在l两侧的样本点的个数一定相同
解析:
样本点的中心(,)必在回归直线上故选A
(2013东北三校联考)下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程=3-x,变量x增加一个单位时,平均增加个单位;
③回归方程=x+必过(,);
④有一个2×2列联表中,由计算得2=13079,则有99%的把握确认这两个变量间有关系其中错误的个数是( B )
(A)0(B)1()2(D)3
本题可以参考独立性检验临界值表:
P(2≥0)000400201010000020010
00407081323207227063841024663
解析:
一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程=3-x,当x增加一个单位时,平均减少个单位,②错误;由线性回归方程的定义知,线性回归方程=x+必过点(,),③正确;因为2=13079>663,故有99%的把握确认这两个变量间有关系,④正确故选B
6(2013年高考福建卷)已知x与之间的几组数据如表:
x12346
021334
假设根据如表数据所得线性回归直线方程为=x+,若某同学根据表中的前两组数据(1,0)和(2,2)求得的直线方程为=b′x+a′,则以下结论正确的是( )
(A)>b′,>a′(B)>b′,<a′
()<b′,>a′(D)<b′,<a′
解析:
由两组数据(1,0)和(2,2)可求b′==2,
a′=0-2×1=-2
利用线性回归方程的公式与已知表格中的数据,可求得
===,
=-=-×=-,
所以<b′,>a′故选
二、填空题
7(2013济南三模)某市居民2009~2013年家庭年平均收入x(单位:
万元)与年平均支出(单位:
万元)的统计资料如表所示:
年份20092010201120122013
年平均收入x11121131331
年平均支出6888981012
根据统计资料,居民家庭年平均收入的中位数是 ,家庭年平均收入与年平均支出有 线性相关关系
解析:
个x值是按从小到大的顺序排列的,因此居民家庭年平均收入的中位数是13万元
以家庭年平均收入x作为x轴,年平均支出作为轴,描点得到散点图如图所示:
观察散点图可知,这些点大致分布在一条直线的附近,且总体呈上升趋势,因此家庭年平均收入与年平均支出有正线性相关关系
答案:
13万元 正
8为了判断高中三年级学生选修科是否与性别有关,现随机抽取0名学生,得到2×2列联表:
理科科合计
男131023
女72027
合计20300
已知P(2≥3841)≈00,P(2≥024)≈002
根据表中数据,得到2=≈4844,
则认为选修科与性别有关系出错的可能性约为
解析:
由2=4844>3841
故认为选修科与性别有关系出错的可能性约为%
答案:
%
9某车间为了规定工时定额,需要确定加工零所花费的时间,为此进行了次试验根据收集到的数据(如表),由最小二乘法求得回归方程=067x+49现发现表中有一个数据模糊看不清,请你推断出该数据的值为
解析:
依题意,=×(10+20+30+40+0)
=30
由于直线=067x+49必过点(,),
于是有=067×30+49=7,
因此表中的模糊数据是
7×-(62+7+81+89)=68
答案:
68
10已知x,之间的一组数据如表:
x2346
34689
对于表中数据,现给出如下拟合直线:
①=x+1;②=2x-1;③=x-;④=x则根据最小二乘法的思想求得拟合程度最好的直线是 (填序号)
解析:
由题意知=4,=6,
∴==,
∴=-=-,
∴=x-,
∴填③
答案:
③
11某工厂经过技术改造后,降低了能消耗,经统计该厂某种产品的产量x(单位:
吨)与相应的生产能耗(单位:
吨)有如下几组样本数据:
x346
2344
根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为07已知该产品的年产量为10吨,则该工厂每年的生产能耗大约为 吨
解析:
由题知,==4,==3,故样本数据的中心点为A(4,3)设回归方程为=07x+,将中心点坐标代入得:
3=07×4+,解得=03,故回归方程为=07x+03,所以当x=10时,=07×10+03=73,即该工厂每年的生产能耗大约为73吨
答案:
73
【教师备用】有甲、乙两个班级进行数学考试,按照大于等于8分为优秀,8分以下为非优秀统计成绩,得到列联表:
优秀非优秀总计
甲班10b
乙班30
总计10
已知在全部10人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是
①列联表中的值为30,b的值为3
②列联表中的值为1,b的值为0
③根据列联表中的数据,若按9%的可靠性要求,能认为“成绩与班级有关系”
④根据列联表中数据,若按9%的可靠性要求,不能认为“成绩与班级有关系”
解析:
由题意知,成绩优秀的学生人数是10×=30,成绩非优秀的学生数是10-30=7,所以=20,b=4,①和②错误根据列联表中的数据,得到2的观测值为=≈6109>3841,因此有9%的把握认为“成绩与班级有关系”,③正确,而④错误
答案:
③
三、解答题
12(2013年高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:
千元)与月储蓄i(单位:
千元)的数据资料,算得xi=80,i=20,xii=184,=720
(1)求家庭的月储蓄对月收入x的线性回归方程=bx+a;
(2)判断变量x与之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄
附:
线性回归方程=bx+a中,
b=,a=-b,
其中,为样本平均值,线性回归方程也可写为=x+
解:
(1)由题意知n=10,=8,
=2,
又-n=720-10×82=80,
xii-n=184-10×8×2=24,
由此得b===03,
a=-b=2-03×8=-04,
故所求回归方程为=03x-04
(2)由于变量的值随x值的增加而增加(b=03>0),故x与之间是正相关
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=03×7-04=17(千元)
13为调查某社区居民的业余生活状况,研究这一社区居民在20:
00~22:
00时间段的休闲方式与性别的关系,随机调查了该社区80人,得到数据表:
休闲方式
性别 看电视看书合计
男10060
女101020
合计206080
(1)根据表中数据估计该社区居民在这一时间段以看书为休闲方式的概率和女性以看电视为休闲方式的概率;
(2)根据以上数据,能否有99%的把握认为“在20:
00~22:
00时间段居民的休闲方式与性别有关系”?
参考公式:
2=,
其中n=a+b++d
参考数据:
)010*********
020*********
解:
(1)由表可知该社区居民以看书为休闲方式的概率为
=,
女性以看电视为休闲方式的概率为=
(2)根据样本提供的2×2列联表得
2=
=
≈8889>663
所以我们有99%的把握认为“在20:
00~22:
00时间段居民的休闲方式与性别有关”
14(2013大连一模)某工厂用甲、乙两种不同工艺生产一大批同一种零,零尺寸均在[217,223](单位:
)之间,把零尺寸在[219,221)的记为一等品,尺寸在[218,219)∪[221,222)的记为二等品,尺寸在[217,218)∪[222,223]的记为三等品,现从甲、乙工艺生产的零中各随机抽取100产品,所得零尺寸的频率分布直方图如图所示:
(1)根据上述数据完成下列2×2列联表,根据此数据你是否有9%的把握认为选择不同的工艺与生产出一等品有关?
甲工艺乙工艺合计
一等品
非一等品
合计
P(2≥0)00001
03841663
(2)若一等品、二等品、三等品的单利润分别为30元、20元、1元,求出上述甲工艺所抽取的100产品的单利润的平均数
解:
(1)2×2列联表如表:
甲工艺乙工艺合计
一等品060110
非一等品04090
合计100100200
2=≈202<3841,
所以没有9%的把握认为选择不同的工艺与生产出一等品有关
(2)甲工艺抽取的100产品中,一等品有0,二等品有30,三等品有20,
所以这100产品单利润的平均数为
(0×30+30×20+20×1)=24