高中数学线性回归分析集锦Word文档格式.docx
《高中数学线性回归分析集锦Word文档格式.docx》由会员分享,可在线阅读,更多相关《高中数学线性回归分析集锦Word文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
〔2〕粮食产量与施肥量;
〔3〕人体内的脂肪含量与年龄.
这些问题中两个变量之间的关系是函数关系吗?
思索2:
名师出高徒'
可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成果与教师的教学水平之间的关系是函数关系吗?
你能举出类似的描述生活中两个变量之间的这种关系的成语吗?
思索3:
上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?
自变量取值肯定时,因变量的取值带有肯定随机性的两个变量之间的关系,叫做相关关系.
1、球的体积和球的半径具有〔〕
A函数关系B相关关系
C不确定关系D无任何关系
2、以下两个变量之间的关系不是
函数关系的是〔〕
A角的度数和正弦值
B速度肯定时,距离和时间的关系
C正方体的棱长和体积
D日照时间和水稻的亩产量AD练:
学问探究〔二〕:
散点图
【问题】在一次对人体脂肪含量和年龄关系的讨论中,讨论人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.
对某一个人来说,他的体内脂肪含量不肯定随年龄增长而增加或削减,但是假如把许多个体放在一起,就可能表现出肯定的规律性.观看上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样改变?
思索2:
为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
思索3:
上图叫做散点图,你能描述一下散点图的含义吗?
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
思索4:
观看散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?
思索5:
在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,假如两个变量成正相关,那么这两个变量的改变趋势如何?
思索6:
假如两个变量成负相关,从整体上看这两个变量的改变趋势如何?
其散点图有什么特点?
一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.
一般状况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.
回来直线
一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?
它肯定是散点图中的点吗?
在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有肯定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
这些点大致分布在一条直线附近.
假如散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回来直线.对具有线性相关关系的两个变量,其回来直线肯定通过样本点的中心吗?
对一组具有线性相关关系的样本数据,你认为其回来直线是一条还是几条?
思索5:
在样本数据的散点图中,能否用直尺精确画出回来直线?
借助计算机怎样画出回来直线?
学问探究〔二〕:
回来方程
在直角坐标系中,任何一条直线都有相应的方程,回来直线的方程称为回来方程.对一组具有线性相关关系的样本数据,假如能够求出它的回来方程,那么我们就可以比较具体、清晰地了解两个相关变量的内在联系,并依据回来方程对总体进行估量.
思索1:
回来直线与散点图中各点的位置应具有怎样的关系?
整体上最接近
对于求回来直线方程,你有哪些想法?
思索4:
为了从整体上反映n个样本数据与回来直线的接近程度,你认为选用哪个数量关系来刻画比较合适?
20.9%某小卖部为了了解热茶销售量与气温
之间的关系,随机统计并制作了某6天
卖出热茶的杯数与当天气温的对比表:
假如某天的气温是-50C,你能依据这些
数据预报这天小卖部卖出热茶的杯数吗?
实例探究
为了了解热茶销量与
气温的大致关系,我们
以横坐标x表示气温,
纵坐标y表示热茶销量,
建立直角坐标系.将表
中数据构成的6个数对
表示的点在坐标系内
标出,得到下列图。
你发觉这些点有什么规律?
今后我们称这样的图为散点图〔scatterplot〕.
建构数学
所以,我们用类似于估量平均数时的
思想,考虑离差的平方和
当x=-5时,热茶销量约为66杯
线性回来方程:
一般地,设有n个观看数据如下:
当a,b使2.三点〔3,10〕,〔7,20〕,〔11,24〕的
线性回来方程是〔〕D11.69
二、求线性回来方程
例2:
观看两相关变量得如下表:
求两变量间的回来方程解1:
列表:
阅读课本P73例1
EXCEL作散点图
利用线性回来方程解题步骤:
1、先画出所给数据对应的散点图;
2、观看散点,假如在一条直线附近,则说明所给量具有线性相关关系
3、依据公式求出线性回来方程,并解决其他问题。
〔1〕假如x=3,e=1,分别求两个模型中y的值;
〔2〕分别说明以上两个模型是确定性
模型还是随机模型.
模型1:
y=6+4x;
模型2:
y=6+4x+e.
解〔1〕模型1:
y=6+4x=6+43=18;
模型2:
y=6+4x+e=6+43+1=19.C线性相关与线性回来方程小结1、变量间相关关系的散点图
2、如何利用"
最小二乘法'
思想求直线的回来方程
3、学会用回来思想考察现实生活中变量之间的相关关系
【高一数学必修四线性回来分析学问点二】
重点难点讲解:
1.回来分析:
就是对具有相关关系的两个变量之间的关系形式进行测定,确定一个相关的数学表达式,以便进行估量预报的统计分析方法。
依据回来分析方法得出的数学表达式称为回来方程,它可能是直线,也可能是曲线。
2.线性回来方程
设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点〔xi,yi〕〔i=1,......,n〕大致分布在一条直线的附近,则回来直线的方程为。
其中。
3.线性相关性检验
线性相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性相关与否的方法。
①在课本附表3中查出与显著性水平0.05与自由度n-2〔n为观测值组数〕相应的相关系数临界值r0.05。
②由公式,计算r的值。
③检验所得结果
假如|r|r0.05,可以认为y与x之间的线性相关关系不显著,接受统计假设。
假如|r|r0.05,可以认为y与x之间不具有线性相关关系的假设是不成立的,即y与x之间具有线性相关关系。
典型例题讲解:
例1.从某班50名学生中随机抽取10名,测得其数学考试成果与物理考试成果资料如表:
序号12345678910数学成果54666876788285879094,物理成果61806286847685828896试建立该10名学生的物理成果对数学成果的线性回来模型。
解:
设数学成果为x,物理成果为,则可设所求线性回来模型为,
计算,代入公式得所求线性回来模型为=0.74x+22.28。
说明:
将自变量x的值分别代入上述回来模型中,即可得到相应的因变量的估量值,由回来模型知:
数学成果每增加1分,物理成果平均增加0.74分。
大家可以在老师的关心下对自己班的数学、化学成果进行分析。
例2.假设关于某设备的使用年限x和所支出的修理费用y〔万元〕,有如下的统计资料:
x23456y2.23.85.56.57.0
若由资料可知y对x成线性相关关系。
试求:
〔1〕线性回来方程;
〔2〕估量使用年限为10年时,修理费用是多少?
分析:
此题为了降低难度,告知了y与x间成线性相关关系,目的是训练公式的使用。
〔1〕列表如下:
i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.049162536于是b=,。
线性回来方程为:
=bx+a=1.23x+0.08。
〔2〕当x=10时,=1.2310+0.08=12.38〔万元〕即估量使用10年时修理费用是12.38万元。
此题若没有告知我们y与x间是线性相关的,应首先进行相关性检验。
假如本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回来方程也是没有意义的,而且其估量与预报也是不行信的。
例3.某省七年的国民生产总值及社会商品零售总额如下表所示:
已知国民生产总值与社会商品的零售总额之间存在线性关系,请建立回来模型。
年份国民生产总值〔亿元〕
社会商品零售总额〔亿元〕1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.54375.111991858.47413.18合计4333.012194.24
设国民生产总值为x,社会商品零售总额为y,设线性回来模型为。
依上表计算有关数据后代入的表达式得:
所求线性回来模型为y=0.445957x+37.4148,说明国民生产总值每增加1亿元,社会商品零售总额将平均增加4459.57万元。
例4.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜每年平均产量yt之间的关系有如下数据:
年份19851986198719881989199019911992x〔kg〕7074807885929095y〔t〕5.16.06.87.89.010.210.012.0年份19931994199519961997199871999x〔kg〕92108115123130138145y〔t〕11.511.011.812.212.512.813.0〔1〕求x与y之间的相关系数,并检验是否线性相关;
〔2〕若线性相关,求蔬菜产量y与使用氮肥量之间的回来直线方程,并估量每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。
〔1〕使用样本相关系数计算公式来完成;
〔2〕查表得出显著水平0.05与自由度15-2相应的相关系数临界值r0.05比较,若rr0.05,则线性相关,否则不线性相关。
〔1〕列出下表,并用科学计算器进行有关计算:
i123456789101112131415xi707480788592909592108115123130138145yi5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0xiyi357444544608.4765938.490011401058118813571500.616251766.41885,.故蔬菜产量与施用氮肥量的相关系数:
r=由于n=15,故自由度15-2=13。
由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值r0.05=0.514,则rr0.05,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。
〔2〕设所求的回来直线方程为=bx+a,则回来直线方程为=0.0931x+0.7102。
当x=150时,y的估值=0.0931150+0.7102=14.675〔t〕。
求解两个变量的相关系数及它们的回来直线方程的计算量较大,需要细心慎重计算,假如会使用含统计的科学计算器,能简洁得到,这些量,也就无需有制表这一步,直接算出结果就行了。
另外,利用计算机中有关应用程序也可以对这些数据进行处理。