医学统计学第五章线性回归PPT文件格式下载.ppt
《医学统计学第五章线性回归PPT文件格式下载.ppt》由会员分享,可在线阅读,更多相关《医学统计学第五章线性回归PPT文件格式下载.ppt(42页珍藏版)》请在冰豆网上搜索。
等级相关来分析。
Spearman等级相关等级相关Kendall等级相关等级相关注:
列联表可用注:
列联表可用“Crosstabs过程过程”中的中的“ContingencyCoefficient”计算计算Pearson列联相关系数列联相关系数2.曲线相关:
两变量存在相关趋势,但非线性,而是呈某种可能的曲线相关:
两变量存在相关趋势,但非线性,而是呈某种可能的曲线趋势。
一般都先将变量变换,再将趋势变换为直曲线趋势。
一般都先将变量变换,再将趋势变换为直线来分析,或者采用曲线回归方法来分析。
线来分析,或者采用曲线回归方法来分析。
5.2Bivariate过程过程例例某次体检中抽取某次体检中抽取12名学生的体重和血压,现通过相名学生的体重和血压,现通过相关分析过程来观测学生的体重与血压是否相关?
关分析过程来观测学生的体重与血压是否相关?
体体重重6868484856566060838356566262595977775858血血压压9595989887879696110110155155135135128128113113168168目的目的:
检验:
检验问题:
问题:
两变量数据是否服从正态分布两变量数据是否服从正态分布?
(需提前进行需提前进行)是是Pearson相关分析相关分析否否数据转换或进行等级相关分析数据转换或进行等级相关分析实现步骤:
实现步骤:
1.将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量输入数据输入数据保存保存weight:
体重体重;
pressure:
血压;
保存为:
“体重与血压体重与血压.sav”2.正态性检验正态性检验:
Analyze|DescriptiveStatistics|Explore(探索性)探索性)可以认为体重值、血压值服从正态分布。
可以认为体重值、血压值服从正态分布。
【Variables框框】用于选用于选入需要进行相关分析的入需要进行相关分析的变量,至少需要选入两个。
变量,至少需要选入两个。
【CorrelationCoefficients复选框组复选框组】用于选择需要用于选择需要计算的相关分析指标。
计算的相关分析指标。
【Flagsignificantcorrelations】用于确定是否在结果中用星号用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。
此时标记有统计学意义的相关系数,一般选中。
此时P0.05的系数的系数值旁会标记一个星号,值旁会标记一个星号,P0.9R2r2一元线性回归方程中:
一元线性回归方程中:
越接近于越接近于1,回归效果越好。
,回归效果越好。
校正决定系数校正决定系数1MS剩剩/MS总总例例测某地测某地10名三岁儿童的体重名三岁儿童的体重X(kg)与体表面积)与体表面积Y(101m2),),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做体表做体表Y关于体重关于体重X的回归方程。
的回归方程。
做散点图做散点图建立回归方程并检验建立回归方程并检验实现步骤:
“体重与体表体重与体表.sav”x:
y:
体表;
1.将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量输入数据输入数据保存保存2.利用利用Scatter/Dot命令做散点图菜单“Graphs”|“LegacyDialogs”|“Scatter/Dot”点击“simplescatter”命令,点击命令,点击“Define”按钮。
按钮。
将将“体重体重x”变量变量选入选入“XAxis”框,框,将将“体表体表y”选入选入“YAxis”框中,点击框中,点击“OK”按钮输出结果。
按钮输出结果。
(2)正态性检验正态性检验:
Analyze|DescriptiveStatistics|Explore(探索性)探索性)3.Regression过程过程菜单“Analyze”|“Regression”|“linear”命令将将“体表体表y”选入选入【Dependent框框】;
将将“体重体重x”选入选入【Independent(s)框框】中中,点击点击“Statistics”按按钮钮nEnter强迫进入nStepwise逐步回归nRemove只出不进nBackward向后剔除,只出不进nForward向前选择,只进不出【Modelfit】输出复相关系数输出复相关系数R,其平方其平方,校正决定系数,校正决定系数和标准差,以及方差分析表。
和标准差,以及方差分析表。
选择选择“Estimates”、“Confidenceinterval”、“Modelfit”、“Descriptives”,点击,点击“continue”返回。
返回。
【Estimates】输出有关回归输出有关回归系数和相关测量系数和相关测量【Confidenceinterval】输输出回归系数出回归系数95%的置信区间的置信区间【Descriptives】描述性统计量描述性统计量点击点击“OK”按钮输出结果按钮输出结果分析:
给出了体表和体重的均数和标准差情况。
分析:
此表给出了体重和体表的相关系数阵和分析:
此表给出了体重和体表的相关系数阵和P值。
值。
结果输出和讨论:
R=0.918(即相关系数即相关系数r),决定系数,决定系数校正的决定系数为校正的决定系数为0.823,估计值的标准误差为,估计值的标准误差为0.17434分析:
可见回归平方和分析:
可见回归平方和为为1.301,剩余平方和,剩余平方和为为0.243,F=42.798,P=0.0000.05,拒绝原假设,认拒绝原假设,认为是线性相关的,即回归方程有意义。
为是线性相关的,即回归方程有意义。
非标准化系数分析:
非标准化系数,t统计量分别为统计量分别为5.616和和6.542,其,其P值分别为值分别为0.001和和0.000,均小于,均小于0.005,有显著性意义。
,有显著性意义。
其回归方程为其回归方程为多元线性回归分析多元线性回归分析研究在线性相关条件下,两个或两个以上自研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线变量对一个因变量的数量变化关系,称为多元线性回归分析。
性回归分析。
多元线性回归模型是一元线性回归模型的扩展,多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,在计算上其基本原理与一元线性回归模型类似,在计算上更为复杂,一般需借助计算机来完成。
更为复杂,一般需借助计算机来完成。
是偏回归系数是偏回归系数编号载脂蛋白AI(mg/dl)载脂蛋白B(mg/dl)载脂蛋白E(mg/dl)载脂蛋白C(mg/dl)高密度脂蛋白(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究认为血清中高密度脂蛋白降低是引起动脉硬化的一个重要原因,现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。
91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.762291731238.719.0853013213113.829.238实现步骤:
x1:
载脂蛋白载脂蛋白AI;
X2:
载脂蛋白:
载脂蛋白B;
X3:
载脂蛋白EX4:
载脂蛋白C;
胆固醇含量。
1.将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量输入数据输入数据保存保存2.正态性检验:
正态性检验:
Analyze|DescriptiveStatistics|Explore(探索性)探索性)3.Regression过程过程菜单“Analyze”|“Regression”|“linear”命令将将“y”选入选入【Dependent框框】;
将将“x1、x2、x3、x4选入选入【Independent(s)框框】中中在在methods中选择中选择“stepwise”。
点击点击“Statistics”按按钮钮选择选择“Estimates”、“Confideceinterval”、“Modelfit”、“Descriptives”,点击,点击“continue”返回。
【Options钮】选择进入或排除变量的显著水平此处因为是此处因为是stepwise(逐步回归),所以(逐步回归),所以entry填填0.10Removal填填0.15.点击点击continue回到主对话框。
回到主对话框。
点击点击“OK”按钮按钮结果输出和讨论:
其回归方程为其回归方程为分析:
非标准化系数,标准化回归方程为标准化回归方程为作业作业测某地测某地10名三岁儿童的体重名三岁儿童的体重X(kg)与体表面积)与体表面积Y(101m2),),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判断判断X和和Y是否是线性相关的(要求检验正态性)。
是否是线性相关的(要求检验正态性)。