相关分析实验报告.docx
《相关分析实验报告.docx》由会员分享,可在线阅读,更多相关《相关分析实验报告.docx(17页珍藏版)》请在冰豆网上搜索。
相关分析实验报告
评分
实验报告
课程名称
实验名称相关分析
专业班级
姓名
学号
实验日期
实验地点
2015—2016学年度第_2_学期
一、实验目的
学会利用两个变量间的线性相关分析法、两个等级(秩)变量间的相关分析法及偏关分析法对数据进行相关分析。
二、实验环境
1、硬件配置:
处理器:
Intel(R)Core(TM)i7-3770CPU@3.40GHz3.40GHz安装内存(RAM):
4.00GB系统类型:
64位操作系统
2、软件环境:
IBMSPSSStatistics19.0软件
三、实验内容
(包括本实验要完成的实验问题及需要的相关知识简单概述)
(1)课本第七章的例7.1-7.5运行一遍,注意理解结果;
(2)然后将实验指导书上的例1-2运行一遍,注意理解结果。
三、实验结果与分析
例7.1
输出结果:
表1摄食量与耗氧率的描述性统计量
均值
标准差
N
摄食量
45.00
18.708
6
耗氧量
621.650
68.4752
6
表2摄食量与耗氧率的相关分析结果表
摄食量
耗氧量
摄食量
Pearson相关性
1
.990**
显著性(双侧)
.000
N
6
6
耗氧量
Pearson相关性
.990**
1
显著性(双侧)
.000
N
6
6
**.在.01
水平(双侧)上显著相关
分析:
1)本实验主要是为了研究摄食量与耗氧率之间的关系,而我们所研究的摄食量这一自变
量只存在等数量间隔的差异,并不强调顺序,是定距变量,因此我们选用定距分析;
2)表1为是分析变量的基本统计量,包括两变量的均数、标准差和观测样本数。
摄食量:
x45.00,S18.70&耗氧量:
x621.650,S68.4752。
3)表2给出的是相关系数及其检验结果。
其中r0.990,P0.0000.01说明两变量
间存在极显著的高度正相关关系,即耗氧率随着摄食量的增加而增加;
4)定距变量可以转化为定序变量,因此在本实验中计算相关系数r时所选取的Pearson方法
也可以换成Kendall的tau-b和Spearman两种方法;
5)“按对排除个案”选项表示在计算某个统计量时,从这个变量中排除有缺省值的观测,
因此本实验选择该选项进行计算两变量间的基本统计量;
6)在SPSS输出的结果中,相关系数肩标“*”为P0.05,表明在两变量差异显著的情
况下所得出的值;肩标“**”为P0.01,表明在两变量差异极显著的情况下所显示
的值;
7)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。
例7.2
输出结果:
表3甲、乙的相关分析结果表
甲
乙
Kendall的
甲相关系数
1.000
.732*
au_b
Sig.(双侧)
.010
N
10
10
乙相关系数
.732*
1.000
Sig.(双侧)
.010
N
10
10
Spearman的rho
甲相关系数
1.000
.799**
Sig.(双侧)
.006
N
10
10
乙相关系数
.799**
1.000
Sig.(双侧)
.00
N
10
10
*.在置信度(双测)为0.05
时,相关性是显著的。
**.在置信度(双测)为0.01
时,相关性是显著的。
分析:
1)本实验主要是为了研究甲、乙评委在对奶牛外貌的评分上是否具有一致性,且研究的甲、乙两个变量均属于有序分类,因此我们选用秩序分析;
2)表3是甲、乙两个评委对奶牛等级评定的Kendall秩相关分析与Spearman秩相关分析结
果。
其中Kendall秩相关系数r0.732,P0.010.05,说明该秩分数间具有显著
的正相关关系;Spearma啪关系数r0799,P0.0060.01,说明该秩分数间具有
极显著的正相关关系。
因此由两种方法所得出的结论可知两个评委的评定等级具有显著的一致性;
3)定序变量不可以转化为定距变量,因此在本实验中计算相关系数r时所选取的Kendall的tau-b和Spearman两种方法不能换成Pearson方法。
4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。
例7.3
输出结果:
表4肉色评分和PH直得相关分析结果
肉色评分
PH
Spearman的rho
肉色评分
相关系数
1.000
.848**
Sig.(双侧)
.008
N
8
8
PH
相关系数
.848**
.000
Sig.(双侧)
.008
N
8
8
**.在置信度(双测)为0.01时,相关性是显著的
分析:
1)本实验主要研究肉色与PH值的大小顺序是否相关,由于所研究的PH值这一变量为连续
型变量,即定距变量,且肉色评分为定序变量,因此我们选用秩序分析中的Spearman
方法进行相关分析;
2)表4为肉色评分与PH值的Spearman秩相关分析结果。
其r0.848,P0.0080.01,
说明金华猪肉色与PH值的大小顺序存在极显著的高度正相关关系,即金华猪的肉色随
着PH值的大小顺序的增加而增加;
3)本实验由于掺入了定距变量,因此不能选用Kendall方法,因为Kendall的tau-b方法只适用于研究的两个变量均属于定序变量。
4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。
例7.4输出结果:
表5描述性统计量
均值
标准差
N
穗数x1
31.600
2.6093
13
粒数x2
63.438
4.9658
13
产量y
512.77
24.280
13
表6三变量的两两相关系数
穗数x1
粒数x2
产量y
穗数x1
Pearson相关性
1
-.717**
.627*
显著性(双侧)
.006
.022
N
13
13
13
粒数x2
Pearson相关性
-.717**
1
.013
显著性(双侧)
.006
.96
N
13
13
13
产量y
Pearson相关性
.627*
.013
1
显著性(双侧)
.022
.967
N
13
13
13
**.在.01水平(双侧)上显著相关。
*.在0.05水平(双侧)上显著相关。
分析:
1)本实验主要是研究每667m2穗数、每穗粒数和每667m2稻谷产量间的关系,由于含有3
个变量,因此我们进行的是多个变量间的相关分析,但由于多个变量间的两两相关分析
类似于两个变量间的分析,因此我们还是选择双变量间的定距分析;
2)表5为三变量的基本统计量。
包括样本的均数、标准差和样本例数。
穗数xi:
x31.600s2.6093,粒数X2:
x63.438,S4.9658,产量y:
x512.77,s24.280。
3)表6为三变量的两两相关分析结果。
其中穗数X1与粒数X2的相关系数r0.717,
P0.0060.01,说明穗数X1与粒数X2存在极显著的中度线性负相关关系,即粒数
随着穗数的增加而减少;穗数X1与产量y相关系数r0.627,P0.0220.05,
说明穗数X1与产量y存在显著的中度线性正相关关系,即产量随着穗数的增加而增加;
粒数X2与产量y的相关系数r0.013,P0.9670.05,说明粒数x?
与产量y之
间的相关性并不显著;
4)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选
择双侧检验。
例7.5
输出结果:
表7三变量的描述性统计量
均值
标准差
N
鱼产量y
8.744
1.8533
16
投饵量x1
9.919
2.0766
16
放养量x2
2.463
.5123
16
表8控制放养量X2的偏相关分析结果
控制变量
鱼产量
投饵量x1
放养量x2
-无-a
鱼产量y
相关性
1.000
.3
.561
2
显著性(双侧)
.209
.024
df
0
14
14
投饵量x1
相关性
.332
1.000
-.394
显著性(双侧)
.209
.131
df
14
0
14
放养量x2
相关性
.561
-.394
1.000
显著性(双侧)
.024
.131
df
14
14
0
放养量x2
鱼产量y
相关性
1.000
.727
显著性(双侧)
.0
2
df
0
13
投饵量x1
相关性
.727
1.0
0
显著性(双侧)
.002
df
13
0
a.单元格包含零阶(Pearson)相关
表9控制投饵量x1的偏相关分析结果
控制变量
鱼产量y
放养量x2
投饵量x1
鱼产量y
相关性
1.000
.798
显著性(双侧)
.000
df
0
13
放养量x2
相关性
.798
1.000
显著性(双侧)
.000
df
13
0
表10控制鱼产量y的偏相关分析结果
控制变量
投饵量x1
放养量x2
鱼产量y
投饵量x1
相关性
1.000
-.743
显著性(双侧)
.001
df
0
13
放养量x2
相关性
-.743
1.000
显著性(双侧)
.001
df
13
0
表11简单相关系数和偏相关系数的比较
简单相关系数
偏相关系数
r12
0.394
r12.y
**
0.743
r1y
0.332
r1y.2
**
0.727
*
**
r2y
0.561
r2y.1
0.798
分析:
1)本实验主要是研究鱼产量和投饵量、放养量之间的相关关系,而投饵量和放养量都有可能与鱼产量存在相关关系,因此我们选择偏相关分析方法控制其中一个变量以消除该变量的影响,以此来找出其他两变量之间单纯的相关关系;
2)表7为三变量的基本分析统计量。
包括样本的均数、标准差和例数;
3)表8的上方给出的是三个变量间的简单相关分析,其中鱼产量y与放养量X2的相关系
数r2y0.561*,P0.0240.05,说明鱼产量与放养量间存在显著的线性正相关
关系;而鱼产量y与投饵量xi的相关系数riy0.332,P0.2090.05,说明鱼
产量与投饵量之间不存在线性相关关系;而从表8的下方给出的偏相关系数可知,当控
■,■,■,**制了放养量X2影响后所得出的鱼产量y和投饵量Xi的偏相关系数riy.20.727,
P0.0020.01,说明鱼产量与投饵量之间存在极显著的中度线性正相关关系,即
鱼产量会随着投饵量的增加而增加;
4)表9为控制投饵量Xi影响后的偏相关分析结果。
其中鱼产量y与放养量X2的相关系数
r2yr2y.i0.798**,p0.0000.0i,说明鱼产量与放养量之间存在极显著
的中度线性正相关关系;而未控制前两者的相关系数r2y0.56i*,P0.05,两
者只达到显著水平;
5)表I0为控制鱼产量的影响后投饵量与放养量的偏相关分析结果。
其中ri2.y0.743**
P0.00i0.0i,说明投饵量与放养量之间存在极显著的线性负相关关系,而为控制
前两者的相关系数ri20.394,P0.I3I0.05,说明两者不存在线性相关关系;
6)表II为简单相关分析和偏相关分析的比较数据,从中我们可以看出:
在涉及多个变量的相关分析中,简单相关系数与偏相关系数数据可能会相差很多,实际上有时也可能存在正负差异。
这是因为:
在多个变量的资料中,两个变量之间的简单相关系数没有消除其他变量的影响,往往混有其他变量的效应。
当其他变量与它呈正相关时,便混入正效应,简单系数会高于偏相关系数;当其他变量与它呈负相关时,便混入负效应,简单相关系数会低于偏相关系数。
因此,简单相关系数往往不能反映两个变量之间真实的线性相关关系。
而偏相关系数消除了其他变量取值的影响,能排除假象,反映两个变量间的真实关系;
7)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。
例I
输出结果:
表I2
描述性统计量
均值
标准差
N
发硒
75.40
I2.295
I0
血硒
I0.80
3.327
I0
表I3发硒和血硒的相关分析结果
发硒
血硒
发硒
Pearson相关性
1
.872**
显著性(双侧)
.001
平方与叉积的和
1360.400
320.800
协方差
151.156
35.644
N
10
10
血硒
Pearson相关性
.872**
1
显著性(双侧)
.001
平方与叉积的和
320.800
99.600
协方差
35.644
11.067
N
10
10
**.在.01水平(双侧)上显著相关。
分析:
1)本实验主要研究发硒与血硒之间的相关关系,且两变量都属于连续型变量,因此我们选用定距分析法来研究它们之间的相关关系;
2)表12为发硒和血硒两变量的基本分析统计量。
包括样本的例数、均数和标准差;
3)表13为发硒和血硒的相关分析结果。
包括了发硒和血硒的平方与叉积的和、协方差和
样本例数,且其中发硒与血硒的相关系数r0.872,P0.0010.01,说明发
硒与血硒间存在极显著的线性高度正相关关系,即头发中的硒含量会随着全血中的硒
含量的增加而增加,因此若是在体检时我们可以利用检验头发中的硒含量来推测出血液中的硒含量;
4)定距变量可以转化为定序变量,因此在本实验中计算相关系数r时所选取的Pearson方法也可以换成Kendall的tau-b和Spearman两种方法。
例2
输出结果:
表14描述性统计量
均值
标准差
N
肺活量
2206.897
448.5541
29
身高
152.576
8.3622
29
体重
37.652
5.7455
29
表15控制体重的偏相关分析结果
控制变量
肺活量
身高
体重
-无-a
肺活量
相关性
1.000
.588
.613
显著性(双侧)
.001
.000
df
0
27
27
身高
相关性
.588
1.000
.719
显著性(双侧)
.001
.000
df
27
0
27
体重
相关性
.613
.719
1.000
显著性(双侧)
.000
.000
df
27
27
0
体重
肺活量
相关性
1.000
.269
显著性(双侧)
df
0
.167
26
身高
相关性
.269
1.000
显著性(双侧)
.167
df
26
0
a.单元格包含零阶(Pearson)
相关。
表16
控制身高影响后体重和肺活量的偏相关分析结果
控制变量
肺活量
体重
身高
肺活量
相关性
1.000
.337
显著性(双侧)
.079
df
0
26
体重
相关性
.337
1.000
显著性(双侧)
.079
df
26
0
分析:
1)本实验主要研究肺活量与体重、身高之间的相关关系,而身高和体重都有可能与鱼产量存在相关关系,因此我们选择偏相关分析方法控制其中一个变量以消除该变量的影响,以此来找出其他两变量之间单纯的相关关系;
2)表14为三变量的基本分析统计量输出结果。
包括样本的例数、均数和标准差;
3)表15的上方给出的是三个变量间的简单相关分析,其中如果不控制体重的影响,则身
高和肺活量的相关系数r0.588,P0.0010.01,说明肺活量与身高之间存在
极显著的线性正相关关系,且其决定系数r20.345744;而表15的下方给出的是控制体重影响后肺活量与身高的相关系数r0.269,P0.1670.05,说明肺活量和身高之间并不存在线性相关关系,且其决定系数r20.072361。
经过计算,我们
可以得出肺活量与身高的相关有27.3383%是由体重协同作用而产生的。
4)表16是控制身高影响后体重和肺活量的偏相关分析结果。
其中体重和肺活量的相关系
数r0.337,P0.0790.05,说明体重与肺活量之间不存在线性相关关系,
且其决定系数r20.113569;而从表15我们可知在不控制身高影响的体重和肺活量
的相关系数r0.613,P0.000,说明体重和肺活量之间存在极显著的线性正相
关关系,且其决定系数r20.375769。
经计算,我们可以得知体重与肺活量的相关
有26.22%是由身高协同作用而产生的;
5)根据表15和表16中的数据分析结果,我们可以看出:
尽管肺活量与身高和体重均有关
系,但如果仅仅研究其中一个变量与肺活量的相关关系时,肺活量与身高的相关有27.3383%是由体重协同作用而产生的;体重与肺活量的相关有26.22%是由身高协同作
用而产生的。
两者相比较下,研究体重的意义会更大点;
6)实验中应注意由于我们事先并不知道所研究的变量间是否存在相关关系,因此我们需选择双侧检验。
五、实验小结:
(包括主要实验问题的最终结果描述、详细的收获体会,待解决的问题等)
在此次实验中,由于实验内容更贴近生活应用,因此比起上学期,我们更容易领悟该程序的表达,只是在细节方面还是很容易出错,甚至不容易拐过弯来。
但经过此次实验,我们懂得要学着从复杂的程序中剥茧抽丝,把程序尽可能的简单化。
在实验中应注意的点:
1、如果我们事先并不知道所研究的变量间是否存在相关关系,我们就需要选择双侧检验;
2、定距变量可以转化为定序变量,定序变量不可以转化为定距变量,因此在选择分析的方法上应注意其不可逆性;
3、对于多变量的相关分析,如果需要考虑其中两个变量间真实的相关关系时,必须采用偏相关分析才能得出正确的结论。
手写签名: