高中数学全套讲义 选修12 统计案例 中等学生版.docx

上传人:b****1 文档编号:558789 上传时间:2022-10-11 格式:DOCX 页数:16 大小:228.02KB
下载 相关 举报
高中数学全套讲义 选修12 统计案例 中等学生版.docx_第1页
第1页 / 共16页
高中数学全套讲义 选修12 统计案例 中等学生版.docx_第2页
第2页 / 共16页
高中数学全套讲义 选修12 统计案例 中等学生版.docx_第3页
第3页 / 共16页
高中数学全套讲义 选修12 统计案例 中等学生版.docx_第4页
第4页 / 共16页
高中数学全套讲义 选修12 统计案例 中等学生版.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

高中数学全套讲义 选修12 统计案例 中等学生版.docx

《高中数学全套讲义 选修12 统计案例 中等学生版.docx》由会员分享,可在线阅读,更多相关《高中数学全套讲义 选修12 统计案例 中等学生版.docx(16页珍藏版)》请在冰豆网上搜索。

高中数学全套讲义 选修12 统计案例 中等学生版.docx

高中数学全套讲义选修12统计案例中等学生版

考点一:

回归分析

变量间的相关关系

变量与变量间的两种关系:

(1)函数关系:

这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定.例如圆的面积.S与半径r之间的关系S=πr2为函数关系.

(2)相关关系:

这是一种非确定性关系.当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。

例如人的身高不能确定体重,但一般来说“身高者,体重也重”,我们说身高与体重这两个变量具有相关关系.

相关关系的分类:

(1)在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量;

(2)两个变量均为随机变量,如某学生的语文成绩与化学成绩.

散点图:

将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图.它直观地描述了两个变量之间有没有相关关系.这是我们判断的一种依据.

回归分析:

与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

线性回归方程:

回归直线

如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。

回归直线方程

对于一组具有线性相关关系的数据,,……,,其回归直线的截距和斜率的最小二乘法估计公式分别为:

其中表示数据xi(i=1,2,…,n)的均值,表示数据yi(i=1,2,…,n)的均值,表示数据xiyi(i=1,2,…,n)的均值.

、的意义是:

以为基数,x每增加一个单位,y相应地平均变化个单位.

求回归直线方程的一般步骤:

①作出散点图

由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步。

②求回归系数、

计算,,

,,

利用公式求出,

再由求出的值;

③写出回归直线方程;

④利用回归直线方程预报在x取某一个值时y的估计值。

相关性检验

(1)相关系数r的定义

对于变量x与y随机抽取到的n对数据,,……,,称为x与y的样本相关系数。

(2)相关系数r的作用

样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:

越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱。

②当r>0时,表明两个变量正相关,即x增加,y随之相应地增加,若x减少,y随之相应地减少.

当r<0时,表明两个变量负相关,即x增加,y随之相应地减少;若x减少,y随之相应地增加.

若r=0,则称x与y不相关。

③当,认为x与y之间具有很强的线性相关关系。

④当大于时,表明有95%的把握认为x与y之间具有线性相关关系,这时求回归直线方程有必要也有意义,当时,寻找回归直线方程就没有意义。

(3)利用相关系数r检验的一般步骤:

法一:

①作统计假设:

x与y不具有线性相关关系。

②根据样本相关系数计算公式算出r的值。

③比较与0.75的大小关系,得出统计结论。

如果,认为x与y之间具有很强的线性相关关系。

法二:

①作统计假设:

x与y不具有线性相关关系。

②根据样本相关系数计算公式算出r的值。

③根据小概率0.05与n-2在相关性检验的临界值表中查出r的一个临界值(n未数据的对数)。

④比较与,作统计推断,如果,表明有95%的把握认为x与y之间具有线性相关关系。

如果,我们没有理由拒绝原来的假设,即不认为x与y之间具有线性相关关系。

这时寻找回归直线方程是毫无意义的。

线性回归分析与非线性回归分析

线性回归分析

对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x与y是否具有线性相关关系,如果线性相关,才能求解后面的问题.否则求线性回归方程没有实际意义,它不能反映变量x与y,之间的变化规律.只有在x与y之间具有相关关系时,求线性回归方程才有实际意义.

相关性检验的依据:

主要利用检验统计量

(其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r的性质确定x和y是否具有线性相关关系,r具有的性质为:

|r|≤1且|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关程度越弱.

分析的一般步骤

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;

(2)判断两变量是否具有线性相关关系

①作散点图

由样本点是否呈条状分布来判断两个量是否具有线性相关关系。

②求相关系数r

当,认为x与y之间具有很强的线性相关关系。

(3)若两变量存在线性相关关系,设所求的线性回归方程为,求回归系数、。

(4)写出回归直线方程;

(5)利用回归直线方程预报在x取某一个值时y的估计值。

非线性回归分析

(1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y具有线性相关关系,进一步求出,,对新元的线性回归方程,换回x即可得y对x的回归曲线方程.

(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:

①画出已知数据的散点图,看是否是线性回归分析问题,如果不是,把它与必修数学中学过的函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题.

②作相关性检验,即判断寻找线性回归方程是否有意义.

③当寻找线性回归方程有意义时,计算系数,,得到线性回归方程.

④代回x得y对x的回归曲线方程.

题型一、判断变量的线性相关性及求回归方程

1.(2019•湖北模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5细数据:

,,,,,,根据收集到的数据可知,由最小二乘法求得回归直线方程为,则的值为  

A.68.2B.341C.355D.366.2

2.(2018秋•泸州期末)某市为调查某社区居民的家庭收入与年支出的关系,现随机调查了该社区5户家庭,得到如下统计数据:

收入(万元)

8.5

9

10

11

11.5

支出(万元)

6.2

7.5

8.0

8.5

9.8

若该社区居民家庭收入与年支出存在线性相关关系,且根据上表得到的回归直线方程是,其中,据此估计,该社区一户年收入为15万元的家庭的年支出约为  

A.11.4万元B.11.8万元C.12.0万元D.12.2万元

3.(2018秋•丰台区期末)若直线的回归方程为,当变量增加一个单位时,则下列说法中正确的是  

A.变量平均增加2个单位B.变量平均增加1个单位

C.变量平均减少2个单位D.变量平均减少1个单位

题型二、运用样本相关系数检验相关性及判断实际问题

4.(2018秋•上饶月考)已知具有线性相关的两个变量,之间的一组数据如表所示:

0

1

2

3

4

2.2

4.3

4.5

4.8

6.7

若,满足回归方程,则以下为真命题的是  

A.每增加1个单位长度,则一定增加1.5个单位长度

B.每增加1个单位长度,就减少1.5个单位长度

C.所有样本点的中心为

D.当时,的预测值为13.5

5.(2014春•东莞期末)有一散点图如图所示,在5个数据中去掉后,下列说法正确的是  

A.残差平方和变小

B.相关系数变小

C.相关指数变小

D.解释变量与预报变量的相关性变弱

6.(2014春•福建月考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到数据如表.预计在今后的销售中,销量与单价仍然服从,的关系,且该产品的成本是4元件,为使工厂获得最大利润(利润销售收入成本),该产品的单价应定为  元.

单价(元

8

8.2

8.4

8.6

8.8

9

销量(件

90

84

83

80

75

68

A.B.8C.D.

7.(2012春•黄冈校级期中)对两个变量和进行回归分析,得到一组样本数据:

,,,,,,,则下列说法中不正确的是  

A.由样本数据得到的回归方程必过样本中心,

B.残差平方和越小的模型,拟合的效果越好

C.用相关指数来刻画回归效果,越小,说明模型的拟合效果越好

D.直线和各点,,,,,,的偏差是该坐标平面上所有直线与这些点的偏差中最小的

考点二:

独立性检验

分类变量

有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。

2×2列联表

1.列联表

用表格列出的分类变量的频数表,叫做列联表。

2.2×2列联表

对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

事件B

事件

合计

事件A

a

b

a+b

事件

c

d

c+d

合计

a+c

b+d

a+b+c+d

这样的表格称为2×2列联表。

卡方统计量公式

为了研究分类变量X与Y的关系,经调查得到一张2×2列联表,如下表所示

Y1

Y2

合计

X1

a

b

a+b

X2

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

统计中有一个有用的(读做“卡方”)统计量,它的表达式是:

(为样本容量)。

独立性检验

通过2×2列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。

变量独立性的判断

通过对统计量分布的研究,已经得到两个临界值:

3.841和6.635。

当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:

①如果≤3.841时,认为事件A与B是无关的。

②如果>3.841时,有95%的把握说事件A与事件B有关;

③如果>6.635时,有99%的把握说事件A与事件B有关;

独立性检验的基本步骤及简单应用

独立性检验的步骤:

要推断“A与B是否有关”,可按下面步骤进行:

(1)提出统计假设H0:

事件A与B无关(相互独立);

(2)抽取样本(样本容量不要太小,每个数据都要大于5);

(3)列出2×2列联表;

(4)根据2×2列联表,利用公式:

,计算出的值;

(5)统计推断:

当>3.841时,有95%的把握说事件A与B有关;

当>6.635时,有99%的把握说事件A与B有关;

当>10.828时,有99.9%的把握说事件A与B有关;

当≤3.841时,认为事件A与B是无关的.

题型三、K值计算与独立性试验

8.(2019春•龙岩期末)为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的列联表:

及格

不及格

合计

很少使用手机

20

5

25

经常使用手机

10

15

25

合计

30

20

50

则有  的把握认为经常使用手机对数学学习成绩有影响.

(参考公式:

,其中,

0.15

0.10

0.05

0.025

0.010

0.005

0.001

2.072

2.706

3.841

5.024

6.635

7.879

10.828

A.B.C.D.

9.(2019•湛江二模)有人认为在机动车驾驶技术上,男性优于女性.这是真的么?

某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:

合计

40

35

75

15

10

25

合计

55

45

100

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1