1、*1相关与回归分析相关与回归分析*2相关与回归分析相关与回归分析n双双变量相关分析量相关分析n线性回性回归n曲曲线估估计n两条回两条回归直直线的比的比较*3第一节第一节 双变量相关分析双变量相关分析一、一、Pearson相关分析相关分析 二、二、Spearman等级相关等级相关*4n例例1 表表1为一项关于儿童健康和发展的研究中为一项关于儿童健康和发展的研究中10名学龄儿童名学龄儿童的身高和体重资料。的身高和体重资料。表表1 101 10名学龄儿童的身高和体重名学龄儿童的身高和体重一、一、Pearson相关分析相关分析*5n建立数据文件:身高体重的相关分析建立数据文件:身高体重的相关分析.sa
2、v.n定定义变量量*6n建立数据文件:身高体重的相关分析建立数据文件:身高体重的相关分析.sav.n定定义变量量n输入数据入数据*7n建立数据文件:身高体重的建立数据文件:身高体重的相关分析相关分析.sav.n定定义变量量n输入数据入数据n开始分析:开始分析:n绘制散点制散点图:Graphs Scatter Simple Scatter Definen定定义变量:身高量:身高Y Axis,体重,体重 X Axis*8n建立数据文件:身高体重建立数据文件:身高体重的相关分析的相关分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图n假定假定满足双足双变量正量正态分分布
3、:布:analyze Correlate Bivariaten定定义变量:身高,量:身高,体重体重Variables*9n建立数据文件:身高体重的建立数据文件:身高体重的相关分析相关分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图n假定假定满足双足双变量正量正态分分布:布:analyze Correlate Bivariaten定定义变量:身高,量:身高,体重体重Variablesn选择统计量:量:Correlation Coefficients Pearson*10n主要主要结果果散点散点图*11n主要主要结果果总体相关系总体相关系数数=0的假设的假设检验的检
4、验的P值值Pearson相相关系数关系数*12n练习练习1 某医生测得某医生测得10名正常成年男性的血浆清蛋白含量(名正常成年男性的血浆清蛋白含量(g/L)及血红蛋白含量(及血红蛋白含量(g/L)数据如下,试问两者有无相关关系?)数据如下,试问两者有无相关关系?*13n例例2 某研究者研究某研究者研究10例例6个月个月7岁的贫血患儿的血红蛋白岁的贫血患儿的血红蛋白含量与贫血体征之间的相关性,结果见表含量与贫血体征之间的相关性,结果见表3,请问贫血患,请问贫血患儿的血红蛋白含量与贫血体征之间是否相关儿的血红蛋白含量与贫血体征之间是否相关?二、二、Spearman等级相关等级相关*14n建立数据文
5、件:血建立数据文件:血红蛋白的等蛋白的等级相关分析相关分析.sav.n定定义变量量*15n建立数据文件:血建立数据文件:血红蛋白的等蛋白的等级相关分析相关分析.sav.n定定义变量量n输入数据入数据*16n建立数据文件:血建立数据文件:血红蛋白的等蛋白的等级相关分析相关分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析nanalyze Correlate Bivariaten定定义变量:血量:血红蛋白,蛋白,贫血体征血体征Variables*17n建立数据文件:血建立数据文件:血红蛋蛋白的等白的等级相关分析相关分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析nanal
6、yze Correlate Bivariaten定定义变量:血量:血红蛋白,蛋白,贫血血体征体征Variablesn选择统计量:量:Correlation Coefficients Spearman*18n主要主要结果果总体相关系总体相关系数数=0的假设的假设检验的检验的P值值Spearman相关系数相关系数*19n练习练习2 将例将例2的数据进行秩变换,对变换后的变量进行的数据进行秩变换,对变换后的变量进行Pearson相关分析。相关分析。*20n练习练习3 某医院用复方猪胆胶囊治疗某医院用复方猪胆胶囊治疗219例慢性支气管炎,例慢性支气管炎,结果见下表。问患者疗效与年龄间有无关联结果见下表
7、。问患者疗效与年龄间有无关联?*21第二节第二节 线性回归分析线性回归分析一、简单线性回归分析一、简单线性回归分析二、多重线性回归分析二、多重线性回归分析*22n例例3 表表1为一项关于儿童健康和发展的研究中为一项关于儿童健康和发展的研究中10名学龄儿童名学龄儿童的身高和体重资料。的身高和体重资料。表表1 101 10名学龄儿童的身高和体重名学龄儿童的身高和体重一、简单线性回归分析一、简单线性回归分析*23n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量*24n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量
8、n输入数据入数据*25n建立数据文件:建立数据文件:身高与体身高与体重的回重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析:开始分析:n绘制散点制散点图:Graphs Scatter Simple Scatter Definen定定义变量:体重量:体重Y Axis,身高,身高 X Axis*26n建立数据文件:建立数据文件:身高与体身高与体重的回重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze RegressionLinearn定定义变量:体重量:体重Dependent,身高身高Independent(s)*27n建
9、立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze RegressionLinearn定定义变量:体重量:体重Dependent,身高身高Independent(s)n选择统计量:量:Statistics Estimates,Confidence intervals,Model fit,Descriptives*28n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze Regress
10、ionLinearn定定义变量:体重量:体重Dependent,身高身高Independent(s)n选择统计量:量:Statistics Estimates,Confidence intervals,Model fit,Descriptivesn绘制残差制残差图:Plots DEPENDNT X:,*ZRESID(标准化残差)准化残差)Y:*29n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze RegressionLinearn定定义变量:体重量:体重Dependent,身高身高I
11、ndependent(s)n选择统计量:量:n绘制残差制残差图:n计算算总体均数的估体均数的估计值和和预测值:Save Predicted Values Unstandardize,Prediction Intervals Mean,Individual*30n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze RegressionLinearn定定义变量:体重量:体重Dependent,身高身高Independent(s)n选择统计量:量:n绘制残差制残差图:n计算算总体均数的估体均数
12、的估计值和和预测值:n在散点在散点图中添加置信中添加置信带和和预测带:双:双击散点散点图进行添加,行添加,Element Fit Line at total*31n建立数据文件:建立数据文件:身高与体重的回身高与体重的回归分析分析.sav.n定定义变量量n输入数据入数据n开始分析开始分析n绘制散点制散点图nAnalyze RegressionLinearn定定义变量:体重量:体重Dependent,身高身高Independent(s)n选择统计量:量:n绘制残差制残差图:n计算算总体均数的估体均数的估计值和和预测值:n在散点在散点图中添加置信中添加置信带和和预测带:双:双击散点散点图进行添加,
13、行添加,Element Fit Line at total Confidence Intervals Mean(Individual)*32n主要主要结果果散点散点图*33n主要主要结果果*34n主要主要结果果*35n主要主要结果果确定系数确定系数调整确调整确定系数定系数*36n主要主要结果果对总体回归对总体回归模型检验的模型检验的F值值对总体回归对总体回归模型检验的模型检验的P值值*37n主要主要结果果回归系数(第一回归系数(第一行为截距,第二行为截距,第二行为斜率)行为斜率)总体回归总体回归系数系数=0的的假设检验假设检验的的t值值回归系数的回归系数的标准误标准误标准化回标准化回归系数归系
14、数总体回归系总体回归系数数=0的假设的假设检验的检验的P值值总体回归总体回归系数的系数的95%置信置信区间区间*38n主要主要结果果残差图残差图*39*40n练习练习4 某研究者测量了某研究者测量了16名成年男子的体重和臀围数据,名成年男子的体重和臀围数据,如下表所示。如下表所示。(1)请判断是否可以用线性回归来表达臀围和体重的关系,请判断是否可以用线性回归来表达臀围和体重的关系,若可以,请用该数据建立用体重预测臀围的线性回归模型。若可以,请用该数据建立用体重预测臀围的线性回归模型。(2)今有今有2名成年男子的体重分别为名成年男子的体重分别为62kg和和88kg,是否可以利,是否可以利用上述回
15、归模型估计二人的臀围数据?若可以,请计算臀用上述回归模型估计二人的臀围数据?若可以,请计算臀围总体均数的围总体均数的95%置信区间和臀围的置信区间和臀围的95%预测区间。预测区间。*41n练习练习5 Frank Anscombe(1973)给出了下列四组双变量给出了下列四组双变量X和和Y的的样本数据,其中样本数据,其中Y1、Y2、Y3共用共用X,如下表所示。请对这四组,如下表所示。请对这四组数据分别进行线性回归分析,并加以讨论。数据分别进行线性回归分析,并加以讨论。*42n例例4 为了研究有关糖尿病患者体内脂联素水平的影响因素,某为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定了医师
16、测定了30名患者的体重指数名患者的体重指数BMI(kg/m2)、病程)、病程DY(年)(年)、瘦素、瘦素LEP(ng/mL)、空腹血糖)、空腹血糖FPG(mmol/L)及脂联素)及脂联素ADI(ng/mL)水平,数据如表)水平,数据如表6 所示,能否用多重线性回归表所示,能否用多重线性回归表达他们的关系,若可以,建立多重线性回归方程。达他们的关系,若可以,建立多重线性回归方程。二、多重线性回归分析二、多重线性回归分析*43*44n建立数据文件:脂建立数据文件:脂联素水平数据素水平数据.sav.n定定义变量量*45n建立数据文件:脂建立数据文件:脂联素水平数据素水平数据.sav.n定定义变量量n输入数据入数据*46n建立数据文件:建立数据文件:脂脂联素水平素水平数据数据.sav.n定定义变量量n输入数据入数据n开始分析:开始分析:n绘制散点制散点图:Graphs Scatter Matrix Scatter Definen定定义变量:体重指数、量:体重指数、病程、瘦素、孔府血病程、瘦素、孔府血糖、脂糖、脂联素素Matrix Variables*47n建立数据文件:脂建立数据文件:脂联素水
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1