高中数学全套讲义 选修12 统计案例 中等学生版Word格式.docx
《高中数学全套讲义 选修12 统计案例 中等学生版Word格式.docx》由会员分享,可在线阅读,更多相关《高中数学全套讲义 选修12 统计案例 中等学生版Word格式.docx(16页珍藏版)》请在冰豆网上搜索。
以为基数,x每增加一个单位,y相应地平均变化个单位.
求回归直线方程的一般步骤:
①作出散点图
由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步。
②求回归系数、
计算,,
,,
利用公式求出,
再由求出的值;
③写出回归直线方程;
④利用回归直线方程预报在x取某一个值时y的估计值。
相关性检验
(1)相关系数r的定义
对于变量x与y随机抽取到的n对数据,,……,,称为x与y的样本相关系数。
(2)相关系数r的作用
样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:
①
越接近1,表明两个变量之间的线性相关程度越强;
越接近0,表明两个变量之间的线性相关程度越弱。
②当r>0时,表明两个变量正相关,即x增加,y随之相应地增加,若x减少,y随之相应地减少.
当r<0时,表明两个变量负相关,即x增加,y随之相应地减少;
若x减少,y随之相应地增加.
若r=0,则称x与y不相关。
③当,认为x与y之间具有很强的线性相关关系。
④当大于时,表明有95%的把握认为x与y之间具有线性相关关系,这时求回归直线方程有必要也有意义,当时,寻找回归直线方程就没有意义。
(3)利用相关系数r检验的一般步骤:
法一:
①作统计假设:
x与y不具有线性相关关系。
②根据样本相关系数计算公式算出r的值。
③比较与0.75的大小关系,得出统计结论。
如果,认为x与y之间具有很强的线性相关关系。
法二:
③根据小概率0.05与n-2在相关性检验的临界值表中查出r的一个临界值(n未数据的对数)。
④比较与,作统计推断,如果,表明有95%的把握认为x与y之间具有线性相关关系。
如果,我们没有理由拒绝原来的假设,即不认为x与y之间具有线性相关关系。
这时寻找回归直线方程是毫无意义的。
线性回归分析与非线性回归分析
线性回归分析
对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x与y是否具有线性相关关系,如果线性相关,才能求解后面的问题.否则求线性回归方程没有实际意义,它不能反映变量x与y,之间的变化规律.只有在x与y之间具有相关关系时,求线性回归方程才有实际意义.
相关性检验的依据:
主要利用检验统计量
(其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r的性质确定x和y是否具有线性相关关系,r具有的性质为:
|r|≤1且|r|越接近于1,线性相关程度越强;
|r|越接近于0,线性相关程度越弱.
分析的一般步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)判断两变量是否具有线性相关关系
①作散点图
由样本点是否呈条状分布来判断两个量是否具有线性相关关系。
②求相关系数r
当,认为x与y之间具有很强的线性相关关系。
(3)若两变量存在线性相关关系,设所求的线性回归方程为,求回归系数、。
(4)写出回归直线方程;
(5)利用回归直线方程预报在x取某一个值时y的估计值。
非线性回归分析
(1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y具有线性相关关系,进一步求出,,对新元的线性回归方程,换回x即可得y对x的回归曲线方程.
(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:
①画出已知数据的散点图,看是否是线性回归分析问题,如果不是,把它与必修数学中学过的函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题.
②作相关性检验,即判断寻找线性回归方程是否有意义.
③当寻找线性回归方程有意义时,计算系数,,得到线性回归方程.
④代回x得y对x的回归曲线方程.
题型一、判断变量的线性相关性及求回归方程
1.(2019•湖北模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5细数据:
,,,,,,根据收集到的数据可知,由最小二乘法求得回归直线方程为,则的值为
A.68.2B.341C.355D.366.2
2.(2018秋•泸州期末)某市为调查某社区居民的家庭收入与年支出的关系,现随机调查了该社区5户家庭,得到如下统计数据:
收入(万元)
8.5
9
10
11
11.5
支出(万元)
6.2
7.5
8.0
9.8
若该社区居民家庭收入与年支出存在线性相关关系,且根据上表得到的回归直线方程是,其中,据此估计,该社区一户年收入为15万元的家庭的年支出约为
A.11.4万元B.11.8万元C.12.0万元D.12.2万元
3.(2018秋•丰台区期末)若直线的回归方程为,当变量增加一个单位时,则下列说法中正确的是
A.变量平均增加2个单位B.变量平均增加1个单位
C.变量平均减少2个单位D.变量平均减少1个单位
题型二、运用样本相关系数检验相关性及判断实际问题
4.(2018秋•上饶月考)已知具有线性相关的两个变量,之间的一组数据如表所示:
1
2
3
4
2.2
4.3
4.5
4.8
6.7
若,满足回归方程,则以下为真命题的是
A.每增加1个单位长度,则一定增加1.5个单位长度
B.每增加1个单位长度,就减少1.5个单位长度
C.所有样本点的中心为
D.当时,的预测值为13.5
5.(2014春•东莞期末)有一散点图如图所示,在5个数据中去掉后,下列说法正确的是
A.残差平方和变小
B.相关系数变小
C.相关指数变小
D.解释变量与预报变量的相关性变弱
6.(2014春•福建月考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到数据如表.预计在今后的销售中,销量与单价仍然服从,的关系,且该产品的成本是4元件,为使工厂获得最大利润(利润销售收入成本),该产品的单价应定为 元.
单价(元
8
8.2
8.4
8.6
8.8
销量(件
90
84
83
80
75
68
A.B.8C.D.
7.(2012春•黄冈校级期中)对两个变量和进行回归分析,得到一组样本数据:
,,,,,,,则下列说法中不正确的是
A.由样本数据得到的回归方程必过样本中心,
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,越小,说明模型的拟合效果越好
D.直线和各点,,,,,,的偏差是该坐标平面上所有直线与这些点的偏差中最小的
考点二:
独立性检验
分类变量
有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。
2×
2列联表
1.列联表
用表格列出的分类变量的频数表,叫做列联表。
2.2×
对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:
事件B
事件
合计
事件A
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d
这样的表格称为2×
2列联表。
卡方统计量公式
为了研究分类变量X与Y的关系,经调查得到一张2×
2列联表,如下表所示
Y1
Y2
X1
X2
b+d
n=a+b+c+d
统计中有一个有用的(读做“卡方”)统计量,它的表达式是:
(为样本容量)。
通过2×
2列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
变量独立性的判断
通过对统计量分布的研究,已经得到两个临界值:
3.841和6.635。
当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:
①如果≤3.841时,认为事件A与B是无关的。
②如果>3.841时,有95%的把握说事件A与事件B有关;
③如果>6.635时,有99%的把握说事件A与事件B有关;
独立性检验的基本步骤及简单应用
独立性检验的步骤:
要推断“A与B是否有关”,可按下面步骤进行:
(1)提出统计假设H0:
事件A与B无关(相互独立);
(2)抽取样本(样本容量不要太小,每个数据都要大于5);
(3)列出2×
2列联表;
(4)根据2×
2列联表,利用公式:
,计算出的值;
(5)统计推断:
当>3.841时,有95%的把握说事件A与B有关;
当>6.635时,有99%的把握说事件A与B有关;
当>10.828时,有99.9%的把握说事件A与B有关;
当≤3.841时,认为事件A与B是无关的.
题型三、K值计算与独立性试验
8.(2019春•龙岩期末)为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的列联表:
及格
不及格
很少使用手机
20
5
25
经常使用手机
15
30
50
则有 的把握认为经常使用手机对数学学习成绩有影响.
(参考公式:
,其中,
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.B.C.D.
9.(2019•湛江二模)有人认为在机动车驾驶技术上,男性优于女性.这是真的么?
某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:
男
女
无
40
35
有
55
45
100