材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT推荐.pptx
《材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT推荐.pptx》由会员分享,可在线阅读,更多相关《材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT推荐.pptx(76页珍藏版)》请在冰豆网上搜索。
DataProcessing)第5章回归分析与相关分析,5.1回归与相关基本知识,一、变量间的关系,相关关系:
在实际问题中,变量之间常常存在着既密切而又不是完全确定的关系,即一个变量确定后,另一个变量并不是唯一地确定,而是按一定的概率分布取各种可能值。
6,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,既有区别又有联系,并在一定条件下可以相互转化。
在实际问题中,由于人们认识水平、控制手段、测量误差等方面的原因,确定性关系也往往通过相关关系表现出来。
因此,研究相关关系是十分重要的。
回归分析方法是研究相关关系的一种有力的数学工具,它是建立在对客观事物进行大量试验和观测的基础上寻找变量之间统计规律性的数理统计方法。
确定性关系和相关关系之间区别与联系:
试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,二、变量的分类,7,6/17/2019,两个相互制约的变量,按其确定性或随机性,可分为:
1、两个量都是确定性变量;
2、两个量都是随机性变量;
3、一个是确定性变量;
另一个是随机性变量。
8,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,三、回归分析所研究的主要内容,1、特定变量间是否存在相关关系?
找出变量间的定量关系式;
2、对所建立的关系式的可信程度进行统计检验。
3、判断哪些自变量的影响显著,哪些影响不显著。
4、利用所建立的经验公式,制定合理的生产工艺参数和产品的配方。
5、利用所求得的关系式和误差估计,进行生产中的预报和控制。
DataProcessing),第5章回归分析与相关分析,四、回归分析的基本思路,例1:
在研究管内液体传热问题时,根据因次分析,可设其“准数”数学模型为:
分析:
将上式等号两边取对数,并令,9,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,求回归系数所遵循的原则:
将所求出的回归系数代入经验公式后计算出的数值,应与实测数据呈最佳近似。
10,6/17/2019,问题关键:
回归问题就是根据实验数据确定多项式系数即回归系数b0,b1,b2,b3的问题(幂指数或系数)。
DataProcessing)第5章回归分析与相关分析,5.2一元线性回归方程的建立,实验值:
(xi,yi)(i1,2,n)。
数据具有直线趋向时,曲线结构式可设为:
用一个确定函数关系式近似表达时,便得到回归方程:
-变量y的理论估计值或回归值问题关键:
怎样根据实测数据,确定回归系数a,b,11,6/17/2019,第5章回归分析与相关分析,最小二乘法:
最小二乘法就是使含有随机误差的各实测值与回归值的偏差平方和q达到最小,从而确定回归系数a、b的方法。
如何衡量实测值与回归值的总偏差?
偏差平方和q:
DataProcessing)分析:
实测值yi与回归值的偏差i为:
12,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,要使q取最小值,即有,经简单推导,可求得,其中,13,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,回归直线通过实验观测值的平均值(,)组成的点!
因此,回归方程可写为或,14,6/17/2019,15,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,例:
为了研究氮含量对铁合金溶液初生奥氏体析出温度的影响,测定了不同氮含量时铁合金溶液初生奥氏体析出温度,得到下表给出的5组数据。
表1氮含量与灰铸铁初生奥氏体析出温度测试数据,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,如果把氮含量作为横坐标,把初生奥氏体析出温度作为纵坐标,将这些数据标在平面直角坐标上,则得图1,这个图称为散点图。
16,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,得出:
a=1231.65b=-2236.63因此,在例1中灰铸铁初生奥氏体析出温度(y)与氮含量(x)的回归关系式为:
现在我们来建立关于例1的回归关系式。
将表中的结果代入,17,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,求回归方程的列表算法,将求b的关系式中分子、分母等单项参数分别计算,令,采用这些符号,回归系数的计算公式便十分简单,这时,18,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章,回归分析与相关分析,一、回归平方和与剩余平方和影响实测值yi变动的有两方面因素:
当x取不同的xi时,引起了yi的变化。
试验误差及其它随机因素对yi的影响。
由于两方因素的综合作用,使n个yi与其平均值产生差异,为总变差平方和SST为:
19,6/17/2019,希望:
第
(1)个因素是主要因素,第
(2)个因素是次要因素。
5.3一元线性回归方程的检验方法,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,令,(回归平方和),20,6/17/2019,回归平方和SSR:
是由自变量x的变化所引起的y值的变差。
它反映了总变差SST中由于x和y的线性关系所引起的变差部分。
DataProcessing),第5章回归分析与相关分析,(剩余平方和)剩余平方和SS:
是试验误差及其它随机因素对变量yi观测结果的影响。
它反映了总变差SST中去掉回归平方和SSR后的剩余部分。
则,21,6/17/2019,或,偏差平方和q:
DataProcessing)第5章回归分析与相关分析,二、相关系数rxy,用回归平方和SSR在总变差SST中所占的比例来表示x与y两个变量间线性关系的相关程度。
22,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,所以,rxy与q的关系:
23,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,相关系数的意义:
当|rxy|等于1时,q=0,所有观测点都落在回归直线上,x和y完全线性相关(精确的线性关系);
当|rxy|=0时,q最大,x和y线性无关;
|rxy|越大,越靠近于1时,则q越小,表明x与y间线性关系越密切。
24,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,
(2),y,x,y,x,
(1),r,xy,rxy,y,x,rxy,(5),y,xx,y,(4),xy,r,-,rxy,(6),y,x,(3)rxy-,正相关:
rxy0,y随x的增加而增加负相关:
rxy,y随x的增加而减少,25,6/17/2019,26,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,相关性检验一般利用相关系数检验表(见附录)进行。
该表中给出的rxy值为相关系数的起码值。
只有当求出的相关系数大于表上相应的数值时,才能考虑用直线来描述x和y之间的相关关系。
查表时要遇到三个参数:
变量总数、自由度和置信水平。
对于一元回归分析,变量只有两个(x,y)。
自由度等于数据组数与变量个数之差。
显著性水平(5%和1%)表示线性相关的程度。
如果|rxy|小于表上相应的值时,称为x与y没有明显的线性关系,即回归方程没有实际意义。
通常当|rxy|大于表上,相应的值时,,相应的值,但小于表上,称为x与y有显著的线性关系;
如果|rxy|大于表上,相应的值时,称x与y有十分显著的线性关系;
DataProcessing)第5章回归分析与相关分析,三、r检验法,问题:
rxy的绝对值多大,才能表明变量间线性相关是密切的,所建立的回归方程才有实际意义呢?
思路:
根据风险度,变量x和y成对观察的次数n和自由度f查相关系数检验表,得到的r值为相关系数的起码值。
只有当计算出的rxy大于r时才能考虑用直线来描述x和y之间的相关关系。
步骤:
计算相关系数rxy值。
确定风险度和自由度f(f为变量x和y成对观察的次数n与变量数目2之差,即f=n-2),查表确定相关系数临界值r。
27,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,(3)比较rxy与r。
rxy,如r,则认为在(1-)置信度下,变量x与y之间,线性相关显著,此时所建立的回归方程有应用价值;
反之,,rxy,当r时,变量x与y之间不存在线性相关关系,此时,SSR在SST中占的比例越大,SS(即q)在SST中所占的比例就越小。
用SSR和SS的比值大小来判断回归效果的好坏。
所建立的回归方程无实际意义。
三、F检验法(方差检验法)分析:
28,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,