怎样分析报告变量间地关系文档格式.docx
《怎样分析报告变量间地关系文档格式.docx》由会员分享,可在线阅读,更多相关《怎样分析报告变量间地关系文档格式.docx(6页珍藏版)》请在冰豆网上搜索。
做散点图
四、测度变量间的关系强度----计算相关系数
1.相关系数的概念
是在线性相关的情况下,用来说明相关关系密切程度的统计分析指标。
2.相关系数的计算:
3.
根据相关系数判断相关的程度
相关系数的取值是在+1和-1之间,即
。
若
,表示X与Y之间存在正的相关关系,若
,表示X与Y之间存在负的相关关系;
若r-+1,,表示X、Y之间为完全正相关关系,若r=-1,表示X与Y之间为完全负相关关系,当r=0时,表示Y的取值与X无关,即二者之间不存在线性相关关系,但不能说明两者之间没有任何关系。
它们可能会存在非线性相关关系。
五、总体中也存在这样的关系吗?
----假设检验
1.为什么要对相关系数进行显著性检验?
因为两个变量之间存在相关关系是根据样本计算出来得出的结论,这一结论是否正确还吸引仅仅系检验,相关系数是一个随机变量,由于是随机的,所以具有一定的偶然性,两个不相关的变量,其相关系数也可能较高,要从样本相关系数判断总体中是否也有这样的关系,则需要对相关系数进行显著性检验后才能下结论。
2.显著性检验的步骤:
第一步,提出假设
第二步,计算检验的统计量
第三步,进行决策。
六、建立变量间的数学关系式
1.回归模型:
2.回归方程:
3.估计回归方程:
用最小平方法求参数
用Excel计算统计量的方法。
见教材。
七、回归效果的度量
SST—总平方和,反映因变量取值的总的波动状况。
SSR---回归平方和,反映有自变量X的变化引起Y的变化。
SSE—残差平方和,反映除了X对Y的影响之外的其它因素的影响。
三者的关系:
SST=SSR+SSE
回归平方和占总平方和的比例称为判定系数:
其实际意义是:
在因变量取值的总变差中可以由自变量X取值所解释的比例。
八、检验数学关系式的可信程度
1.为什么要对回归方程进行显著性检验?
回归方程通常是根据样本数据建立,建立回归方程有很多假定,如假定因变量与自变量之间有线性关系,对回归模型中的误差项也有许多假定。
这些假定是否成立,只有在方程通过显著性检验后才能回答,所以要对回归方程进行显著性检验。
2.回归方程显著性检验包括哪些内容?
包括两方面的内容:
一是线性关系的检验,也称为总体的显著性检验,用于检验因变量与自变量之间是否存在线性关系;
二是回归系数的检验,检验自变量对因变量的影响是否显著。
在一元回归分析中,两种检验是等价的。
3.进行线性关系显著性检验的步骤:
第二步,计算统计量F
第三步,作出统计决策。
当
时,拒绝原假设。
更简单的办法:
见教材144页。
九、用自变量来估计因变量
1.点估计---是根据建立的回归方程
,对于自变量的一个特定值X求出因变量Y的一个估计值。
2.区间估计---利用估计的回归方程,对于x的与个特定值
求出Y的一个估计值的区间就是区间估计。
置信区间估计:
它是对x的一个给定值,求出y的平均值的估计区间。
预测区间估计:
它是对x的一个给定值,求出y的个别值的估计区间。
名词解释
1.相关系数:
2.总变差平方和:
3.回归平方和:
4.残差平方和:
5.判定系数:
6.点估计:
是根据建立的回归方程
7.区间估计:
利用估计的回归方程,对于x的与个特定值
思考题
1.解释相关关系的含义
⑴变量之间确实存在着数量上的依存关系;
⑵变量之间数量上的关系是不确定、不严格的依存关系。
2.相关分析主要解决哪些问题?
⑴变量之间是否存在关系?
⑵如果存在关系,它们之间是什么样的关系?
⑶变量之间的关系强度如何?
⑷样本所反映的变量之间的关系能否代表总体变量之间的关系?
3.相关分析中有哪些基本假定?
在进行相关分析时,对总体主要有以下两个假定:
⑴两个变量之间是线性关系;
⑵两个变量都是随机变量。
4.简述相关系数的性质。
相关系数的性质:
⑴r的取值范围是[-1,1],r为正表示正相关,r为负表示负相关,r绝对值的大小表示相关程度的高低;
⑵对称性:
X与Y的相关系数xyr和Y与X之间的相关系数yxr相等;
⑶相关系数与原点和尺度无关;
⑷相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;
⑸相关系数只是两个变量之间线性关联的一个度量,却不一定意味两个变量之间有因果关系;
⑹若X与Y统计上独立,则它们之间的相关系数为零;
但r=0不等于说两个变量是独立的。
即零相关并不一定意味着独立性。
5.为什么要对相关系数进行显著性检验?
在实际的客观现象分析研究中,相关系数一般都是利用样本数据计算的,因而带有一定的随机性。
样本容量越小,其可信程度就越差,抽取的样本不同,r的取值也会不同,因此r是一个随机变量。
能否用样本相关系数来反映总体的相关程度,需要考察样本相关系数的可靠性,因此要进行显著性检验。
6.简述相关系数显著性检验的步骤。
相关系数显著性检验的步骤:
⑴提出假设;
⑵计算检验统计量t值;
⑶在给定的显著性水平和自由度,查t分布表中相应的临界值,作出决策。
7.解释回归模型、回归方程、估计的回归方程的含义。
回归模型是对统计关系进行定量描述的一种数学模型,例如:
对于具有线性关系的两个变量,可以有一元线性方程来描述它们之间的关系,描述因变量y如何依赖自变量x和误差项的方程称为回归模型。
8.一元线性回归模型中有哪些基本假定?
一元线性回归模型通常有以下几条基本的假定:
⑴变量之间存在线性关系;
⑵在重复抽样中,自变量x的取值是固定的;
⑶误差项ε是一个期望为零的随机变量;
⑷)对于所有的x值,误差项的方差2
都相同;
⑸误差项是一个服从正态分布的随机变量,且相互独立。
即2
(0,)N。
9.简述参数最小二乘孤寂的基本原理。
参数最小二乘法的基本原理是:
因变量的观测值与估计值之间的离差平方和最小。
10.解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
总平方和指n次观测值的的离差平方和,衡量的是被解释变量y波动的程度或不确定性的程度。
回归平方和反映y的总变差中由于x与y之间的线性关系引起的y的变化部分,这是可以由回归直线来解释的部分,衡量的是被解释变量y不确定性程度中能被解释变量x解释的部分。
残差平方和是除了x对y的线性影响之外的其他因素引起的y的变化部分,是不能由回归直线来解释的部分。
它们之间的关系是:
总平方和=回归平方和+残差平方和。
11.简述判定系数的含义和作用。
回归平方和占总平方和的比例称为判定系数。
判定系数测量了回归直线对观测数据的拟合程度。
12.在回归分析中,f检验和t检验各有什么作用?
在回归分析中,F检验是为检验自变量和因变量之间的线性关系是否显著,通过均方回归与均方残差之比,构造F检验统计量,提出假设,根据显著性水平,作出判断。
t检验是回归系数的显著性检验,要检验自变量对因变量的影响是否显著,通过构造t检验统计量,提出假设,根据显著性水平,作出判断。
13.简述线性关系检验和回归系数检验的具体步骤。
14.怎样评价回归分析的结果
回归分析结果的评价可以从以下几个方面:
⑴回归系数的符号是否与理论或事先预期相一致;
⑵自变量与因变量之间的线性关系,在统计上是否显著;
⑶根据判定系数的大小,判断回归模型解释因变量取值差异的程度;
⑷误差项的正态假定是否成立。
15.什么是置信区间估计和预测区间估计?
二者有何区别
置信区间估计是对x的一个给定值0x,求出y的平均值的区间估计。
预测区间估计是对x的一个给定值0x,求出y的一个个别值的区间估计。
二者的区别是:
置信区间估计的区间长度通常较短,而预测区间估计的区间长度要长,也就是说,估计y的平均值比预测y的一个特定值或个别值更精确。
16.简要说明残差分析在回归分析中的作用。
残差分析在回归分析中的作用:
回归分析是确定两种或两种以上变量间的定量关系的一种统计分析方法.判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判断回归模型的拟合效果,并判定关于误差项的正态假设是否成立。