ImageVerifierCode 换一换
格式:PPT , 页数:21 ,大小:265KB ,
资源ID:14326645      下载积分:15 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14326645.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS回归分析过程详解pptPPT文件格式下载.ppt)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS回归分析过程详解pptPPT文件格式下载.ppt

1、多分变量逻辑回归Ordinal 序回归Probit:概率单位回归Nonlinear:非线性回归Weight Estimation:加权估计2-Stage Least squares:二段最小平方法Optimal Scaling 最优编码回归我们只讲前面3个简单的(一般教科书的讲法),10.1 线性回归(Liner),一元线性回归方程:y=a+bxa称为截距b为回归直线的斜率用R2判定系数判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)多元线性回归方程:y=b0+b1x1+b2x2+bnxnb0为常数项b1、b2、bn称为y对应于x1、x2、xn的偏回归系数用Ad

2、justed R2调整判定系数判定一个多元线性回归方程的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)一元线性回归模型的确定:一般先做散点图(Graphs-Scatter-Simple),以便进行简单地观测(如:Salary与Salbegin的关系)若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较R2(-1)来确定一种最佳方程式(曲线估计)多元线性回归一般采用逐步回归方法-Stepwise,逐步回归方法的基本思想,对全部的自变量x1,x2,.,xp,按它们对Y贡献的大小进行比较,并通过F检验法,选择偏回归平方和显著的变量进入回归方程,每一步

3、只引入一个变量,同时建立一个偏回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除。在引入了两个自变量以后,便开始考虑是否有需要剔除的变量。只有当回归方程中的所有自变量对Y都有显著影响而不需要剔除时,在考虑从未选入方程的自变量中,挑选对Y有显著影响的新的变量进入方程。不论引入还是剔除一个变量都称为一步。不断重复这一过程,直至无法剔除已引入的变量,也无法再引入新的自变量时,逐步回归过程结束。,10.1.6 线性回归分析实例p240,实例:P240Data07-03 建立一个以初始工资S

4、albegin、工作经验prevexp、工作时间jobtime、工作种类jobcat、受教育年限edcu等为自变量,当前工资Salary为因变量的回归模型。先做数据散点图,观测因变量Salary与自变量Salbegin之间关系是否有线性特点Graphs-Scatter-SimpleX Axis:SalbeginY Axis:Salary若散点图的趋势大概呈线性关系,可以建立线性回归模型Analyze-Regression-LinearDependent:SalaryIndependents:Salbegin,prevexp,jobtime,jobcat,edcu等变量Method:Stepwi

5、se比较有用的结果:拟合程度Adjusted R2:越接近1拟合程度越好回归方程的显著性检验Sig回归系数表Coefficients的Model最后一个中的回归系数B和显著性检验Sig得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu,10.2 曲线估计(Curve Estimation),对于一元回归,若散点图的趋势不呈线性分布,可以利用曲线估计方便地进行线性拟合(liner)、二次拟合(Quadratic)、三次拟合(Cubic)等。采用哪种拟合方式主要取决于各种拟合模型

6、对数据的充分描述(看修正Adjusted R2-1),10.2.3 曲线估计(Curve Estimation)分析实例,实例P247 Data11-01:有关汽车数据,看mpg(每加仑汽油行驶里程)与weight(车重)的关系先做散点图(Graphs-Scatter-Simple):weight(X)、mpg(Y),看每加仑汽油行驶里程数mpg(Y)随着汽车自重weight(X)的增加而减少的关系,也发现是曲线关系建立若干曲线模型(可试着选用所有模型Models)Analyze-Regression-Curve EstimationDependent:mpgIndependent:weigh

7、tModels:全选(除了最后一个逻辑回归)选Plot models:输出模型图形比较有用的结果:各种模型的Adjusted R2,并比较哪个大,结果是指数模型Compound的Adjusted R2=0.70678最好(拟合情况可见图形窗口),结果方程为:mpg=60.15*0.999664weight说明:Growth和Exponential的结果也相同,也一样。,10.3二项逻辑回归(Binary Logistic),在现实中,经常需要判断一些事情是否将要发生,候选人是否会当选?为什么一些人易患冠心病?为什么一些人的生意会获得成功?此问题的特点是因变量只有两个值,不发生(0)和发生(1)

8、。这就要求建立的模型必须因变量的取值范围在01之间。Logistic回归模型Logistic模型:在逻辑回归中,可以直接预测观测量相对于某一事件的发生概率。包含一个自变量的回归模型和多个自变量的回归模型公式:其中:z=B0+B1X1+BpXp(P为自变量个数)。某一事件不发生的概率为Prob(no event)1-Prob(event)。因此最主要的是求B0,B1,Bp(常数和系数)数据要求:因变量应具有二分特点。自变量可以是分类变量和定距变量。如果自变量是分类变量应为二分变量或被重新编码为指示变量。指示变量有两种编码方式。回归系数:几率和概率的区别。几率=发生的概率/不发生的概率。如从52张

9、桥牌中抽出一张A的几率为(4/52)/(48/52)=1/12,而其概率值为4/52=1/13 根据回归系数表,可以写出回归模型公式中的z。然后根据回归模型公式Prob(event)进行预测。,10.3.3二项逻辑回归(Binary Logistic)实例,实例P255 Data11-02:乳腺癌患者的数据进行分析,变量为:年龄age,患病时间time,肿瘤扩散等级pathscat(3种),肿瘤大小pathsize,肿瘤史histgrad(3种)和癌变部位的淋巴结是否含有癌细胞ln_yesno,建立一个模型,对癌变部位的淋巴结是否含有癌细胞ln_yesno的情况进行预测。Analyze-Reg

10、ression-Binary LogisticDependent:ln_yesnoCovariates:age,time,pathscat,pathsize,histgrad比较有用的结果:在Variables in Equation表中的各变量的系数(B),可以写出z=-0.86-0.331pathscat+0.415pathsize 0.023age+0.311histgrad。根据回归模型公式Prob(event)=1/(1+e-z),就可以计算一名年龄为60岁、pathsize为1、histgrad为1、pathscat为1的患者,其淋巴结中发现癌细胞的概率为1/(1+e-(-1.84

11、5)=0.136(Prob(event)0.5 预测事件将会发生),补充:回归分析,以下的讲义是吴喜之教授有关回归分析的讲义,很简单,但很实用,定量变量的线性回归分析,对例1(highschoo.sav)的两个变量的数据进行线性回归,就是要找到一条直线来最好地代表散点图中的那些点。,检验问题等,对于系数b1=0的检验对于拟合的F检验R2(决定系数)及修正的R2.,多个自变量的回归,如何解释拟合直线?,什么是逐步回归方法?,自变量中有定性变量的回归,例1(highschoo.sav)的数据中,还有一个自变量是定性变量“收入”,以虚拟变量或哑元(dummy variable)的方式出现;这里收入的

12、“低”,“中”,“高”,用1,2,3来代表.所以,如果要用这种哑元进行前面回归就没有道理了.以例1数据为例,可以用下面的模型来描述:,自变量中有定性变量的回归,现在只要估计b0,b1,和a1,a2,a3即可。哑元的各个参数a1,a2,a3本身只有相对意义,无法三个都估计,只能够在有约束条件下才能够得到估计。约束条件可以有很多选择,一种默认的条件是把一个参数设为0,比如a3=0,这样和它有相对意义的a1和a2就可以估计出来了。对于例1,对b0,b1,a1,a2,a3的估计分别为28.708,0.688,-11.066,-4.679,0。这时的拟合直线有三条,对三种家庭收入各有一条:,SPSS实现

13、(hischool.sav),AnalizeGeneral linear modelUnivariate,在Options中选择Parameter Estimates,再在主对话框中把因变量(s1)选入Dependent Variable,把定量自变量(j3)选入Covariate,把定量因变量(income)选入Factor中。然后再点击Model,在Specify Model中选Custom,再把两个有关的自变量选入右边,再在下面Building Term中选Main effect。Continue-OK,就得到结果了。输出的结果有回归系数和一些检验结果。,注意,这里进行的线性回归,仅仅是

14、回归的一种,也是历史最悠久的一种。但是,任何模型都是某种近似;线性回归当然也不另外。它被长期广泛深入地研究主要是因为数学上相对简单。它已经成为其他回归的一个基础。总应该用批判的眼光看这些模型。,SPSS的回归分析,自变量和因变量都是定量变量时的线性回归分析:菜单:AnalizeRegressionLinear把有关的自变量选入Independent,把因变量选入Dependent,然后OK即可。如果自变量有多个(多元回归模型,选Method:Stepwise),只要都选入就行。,SPSS的回归分析,自变量中有定性变量(哑元)和定量变量而因变量为定量变量时的线性回归分析(hischool.sav)菜单:AnalizeGeneral linear modelUnivariate,在Options中选择Parameter Estimates,再在主对话框中把因变量(s1)选入Dependent Variable,把定量自变量(j3)选入Covariate,把定性因变量(income)选入Factor中。点击Model,在Specify Model中选Custom,再把两个有关的自变量选入右边,再在下面Building Term中选Main effect。然后就Continue-OK。,

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1