相关分析和回归分析.ppt
《相关分析和回归分析.ppt》由会员分享,可在线阅读,更多相关《相关分析和回归分析.ppt(27页珍藏版)》请在冰豆网上搜索。
![相关分析和回归分析.ppt](https://file1.bdocx.com/fileroot1/2022-11/1/85ced73c-e68d-4800-894f-5ffb7fc6ab95/85ced73c-e68d-4800-894f-5ffb7fc6ab951.gif)
第八章第八章相关分析和回归分析相关分析和回归分析第一节:
相关的意义、概念和种类第一节:
相关的意义、概念和种类第二节:
相关图表和相关系数第二节:
相关图表和相关系数第三节:
回归分析第三节:
回归分析第四节:
相关分析和回归分析中第四节:
相关分析和回归分析中应注意的问题应注意的问题第一节:
相关的意义、概念和种类第一节:
相关的意义、概念和种类一、相关分析的意义:
一、相关分析的意义:
11、统计分析的重要课题、统计分析的重要课题.22、在总体中,如果对变量、在总体中,如果对变量xx的每一个数值,相应的每一个数值,相应还有第二个变量还有第二个变量yy的数值,则各对变量的变量的数值,则各对变量的变量值所组成的总体称为二元总体;由二个以上相值所组成的总体称为二元总体;由二个以上相互对应的变量组成的总体,称为多元总体。
互对应的变量组成的总体,称为多元总体。
33、对二元总体应了解的问题、对二元总体应了解的问题w两变量是不是存在关系,关系的密切程度如何两变量是不是存在关系,关系的密切程度如何w如果存在关系,那么关系的具体形式是什么如果存在关系,那么关系的具体形式是什么w怎样根据一个变量的变动来估计另一变量的变怎样根据一个变量的变动来估计另一变量的变动动二、相关分析的概念二、相关分析的概念11、相关分析就是对总体中确实具有联系的标志、相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标进行分析,其主体是对总体中具有因果关系标志的分析。
志的分析。
22、现象总体的依存关系类型:
、现象总体的依存关系类型:
w因素标志是决定结果标志发展的条件,根据结因素标志是决定结果标志发展的条件,根据结果标志对因素标志的不同反应,可分两种类型。
果标志对因素标志的不同反应,可分两种类型。
w函数关系是当因素标志的数量确定之后,结果函数关系是当因素标志的数量确定之后,结果标志的数量也随之完全确定,以标志的数量也随之完全确定,以y=f(x)y=f(x)表现表现w相关关系是不完全确定的随机关系。
因素标志相关关系是不完全确定的随机关系。
因素标志的数值,可能有若干结果标志的数值。
的数值,可能有若干结果标志的数值。
33、函数关系与相关关系的联系、函数关系与相关关系的联系1、对具有相关关系的现象进行分析时,则必须、对具有相关关系的现象进行分析时,则必须利用响应的函数关系数学表达式,来表明现象利用响应的函数关系数学表达式,来表明现象之间的相关方程式。
之间的相关方程式。
2、相关关系是相关分析的研究对象,函数关系、相关关系是相关分析的研究对象,函数关系是相关分析的工具。
是相关分析的工具。
例:
圆的面积与半径的关系;计件工资总额与零例:
圆的面积与半径的关系;计件工资总额与零件数量;看书时间和学习成绩。
件数量;看书时间和学习成绩。
三、相关的种类三、相关的种类11、按相关的程度分为完全相关、不完全相关和、按相关的程度分为完全相关、不完全相关和不相关。
不相关。
w两种依存关系的标志,其中一个标志的数量变两种依存关系的标志,其中一个标志的数量变化由另一个标志的数量变化所确定,则称完全化由另一个标志的数量变化所确定,则称完全相关,也称函数关系。
相关,也称函数关系。
w两个标志彼此互不影响,其数量变化各自独立,两个标志彼此互不影响,其数量变化各自独立,称为不相关。
称为不相关。
w两个现象之间的关系,介乎完全相关与不相关两个现象之间的关系,介乎完全相关与不相关之间称不完全相关。
之间称不完全相关。
22、按相关的方向分为正相关和负相关、按相关的方向分为正相关和负相关w正正相关指相关关系表现为因素标志和结果标志相关指相关关系表现为因素标志和结果标志的数量变动方向一致。
的数量变动方向一致。
w负相关指相关关系表现为因素标志和结果标志负相关指相关关系表现为因素标志和结果标志的数量变动方向是相反的。
的数量变动方向是相反的。
33、按影响因素的多少分为单相关和复相关、按影响因素的多少分为单相关和复相关w如果研究的是一个结果标志同某一因素标志如果研究的是一个结果标志同某一因素标志相关,就称单相关。
相关,就称单相关。
w如果分析若干因素标志对结果标志的影响,如果分析若干因素标志对结果标志的影响,称为复相关或多元相关。
称为复相关或多元相关。
44、按相关的形式分为线性相关和非线性相关、按相关的形式分为线性相关和非线性相关w一种现象的一个数值和另一现象相应的数值一种现象的一个数值和另一现象相应的数值在直角坐标系中确定为一个点,称为线性相在直角坐标系中确定为一个点,称为线性相关。
关。
四、相关分析的主要内容四、相关分析的主要内容11、确定相关关系的存在,相关关系呈现的形态、确定相关关系的存在,相关关系呈现的形态和方向,相关关系的密切程度(主要方法是绘和方向,相关关系的密切程度(主要方法是绘制相关图表和计算相关系数)制相关图表和计算相关系数)22、确定相关关系的数学表达式、确定相关关系的数学表达式33、确定因变量估计值误差的程度。
、确定因变量估计值误差的程度。
第二节:
相关图表和相关系数第二节:
相关图表和相关系数一、相关表的编制一、相关表的编制11、编制相关表前首先要通过实际调查取得一系、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。
列成对的标志值资料作为相关分析的原始数据。
22、相关表的分类:
、相关表的分类:
w简单相关表是资料未经分组的相关表,它是把简单相关表是资料未经分组的相关表,它是把因素标志值按照从小到大的顺序并配合结果标因素标志值按照从小到大的顺序并配合结果标志值一一对应而平行排列起来的统计表。
志值一一对应而平行排列起来的统计表。
w分组相关表是在简单相关表的基础上,将原始分组相关表是在简单相关表的基础上,将原始数据进行分组而编成的统计表。
数据进行分组而编成的统计表。
单变量分组相关表单变量分组相关表自变量分组并计算次数,而对应的因变量不自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。
分组,只计算其平均值。
单变量分组相关表的特点:
使冗长的资料简单变量分组相关表的特点:
使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。
化,能够更清晰地反映出两变量之间相关关系。
双变量分组相关表:
双变量分组相关表:
自变量和因变量都进行分组而制成的相关表,自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。
这种表形似棋盘,故又称棋盘式相关表。
二、相关图的编制二、相关图的编制11、相关图:
利用直角坐标系第一象限,把自变、相关图:
利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。
以表明相关点分布状况的图形。
22、相关图被形象地称为相关散点图、相关图被形象地称为相关散点图33、因素标志分了组,结果标志表现为组平均数,、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫所绘制的相关图就是一条折线,这种折线又叫相关曲线。
相关曲线。
三、相关系数的计算:
三、相关系数的计算:
11、符号系数:
把两个同平均值的离差数列做对称、符号系数:
把两个同平均值的离差数列做对称比较。
比较。
w如果一个数列的离差与另一个数列的离差有很如果一个数列的离差与另一个数列的离差有很多同号,就可以认为这两标志之间存在正相关。
多同号,就可以认为这两标志之间存在正相关。
如果大多数为异号,就可以认为他们之间存在如果大多数为异号,就可以认为他们之间存在负相关。
负相关。
如果同号与异号大体一样,显然不存在相关。
如果同号与异号大体一样,显然不存在相关。
w符号系数符号系数KK分析分析K=-1K=-1时,标志间的相关是负相关时,标志间的相关是负相关K=+1K=+1时,标志间的相关是正相关时,标志间的相关是正相关K=0K=0时,时,标志间不存在相关标志间不存在相关w符号系数的优点在于意义明了,计算方便,其符号系数的优点在于意义明了,计算方便,其缺点在于掩盖了离差绝对值上的不同,指标只缺点在于掩盖了离差绝对值上的不同,指标只能反映相关的一般趋势。
能反映相关的一般趋势。
22、相关系数、相关系数w定义:
是按积差方法计算,同样以两变量与各定义:
是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。
反映两变量之间相关程度。
w公式:
公式:
协方差的意义协方差的意义显示显示xx与与yy是正相关还是负相关是正相关还是负相关协方差为负,是负相关,协方差为负,是负相关,协方差为正,是正相关。
协方差为正,是正相关。
协方差显示协方差显示xx与与yy相关程度的大小相关程度的大小当相关点在四个象限呈散乱的分布,相关程度很低当相关点在四个象限呈散乱的分布,相关程度很低当相关点分布在当相关点分布在xx与与yy的平均值线上时,表示不相关的平均值线上时,表示不相关当相关点靠近一直线,表示相关关系密切当相关点靠近一直线,表示相关关系密切当相关点全部落在一直线,表示完全相关当相关点全部落在一直线,表示完全相关相关系数相关系数rr的性质:
的性质:
、当、当时,时,xx与与yy为完全线性相关,它们之为完全线性相关,它们之间存在确定的函数关系。
间存在确定的函数关系。
、当、当时,表示时,表示xx与与yy存在着一定的线存在着一定的线性相关,性相关,rr的绝对值越大,越接近于的绝对值越大,越接近于11,表示,表示xx与与yy直线相关程度越高,反之越低。
直线相关程度越高,反之越低。
相关系数的相关系数的rr的推导公式:
的推导公式:
第三节:
回归分析第三节:
回归分析一、回归分析的意义:
一、回归分析的意义:
11、回归分析就是对具有相关关系的两个或两个、回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,以上变量之间数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个一直确立一个相应的数学表达式,以便从一个一直量来推测另一个未知量,为估算预测提供一个量来推测另一个未知量,为估算预测提供一个重要的方法。
重要的方法。
22、回归分析和相关分析是互相补充、密切联系、回归分析和相关分析是互相补充、密切联系的,相关分析需要回归分析来表明现象数量关的,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应该建立在相关系的具体形式,而回归分析则应该建立在相关分析的基础上。
分析的基础上。
33、回归的种类、回归的种类w按按自变量的个数分:
自变量的个数分:
一元回归:
只有一个自变量,又称简单回归一元回归:
只有一个自变量,又称简单回归多元回归:
有两个或两个以上自变量,又称复回归多元回归:
有两个或两个以上自变量,又称复回归w按回归线的形状分:
按回归线的形状分:
线性回归线性回归直线回归直线回归非线性回归非线性回归曲线回归曲线回归二、简单线性回归方程:
二、简单线性回归方程:
11、简单线性方程式:
、简单线性方程式:
y=y=a+bxa+bx22、变量变量yy不仅受不仅受xx的的影响,还受其他随机因素的影响,影响,还受其他随机因素的影响,因此通过相关图,可以直观地发现各个相关点并因此通过相关图,可以直观地发现各个相关点并不都落在一条直线上,而是在直线上下波动,只不都落在一条直线上,而是在直线上下波动,只呈现线性相关的趋势。
呈现线性相关的趋势。
33、我们试图在相关图的散点中引出一条模拟的回归、我们试图在相关图的散点中引出一条模拟的回归直线,以表明两变量直线,以表明两变量xx与与yy的关系,称为估计回归的关系,称为估计回归线,回归方程:
线,回归方程:
yycc=a+bxa+bxycycyy的估计值的估计值aa纵轴截距纵轴截距bb回归系数回归系数,代表自变量增加一个单位时因变量的代表自变量增加一个单位时因变量的平均增加值。
平均增加值。
44、计算、计算aa、bb值值当实际值当实际值yy与