ImageVerifierCode 换一换
格式:PPTX , 页数:32 ,大小:1.36MB ,
资源ID:2647775      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2647775.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(王小川MATLAB数据挖掘课件9.pptx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

王小川MATLAB数据挖掘课件9.pptx

1、Matlab数据挖掘公开数据挖掘公开课课9之多元回之多元回归归分析分析主讲人:王小川同济大学经管学院博士研究生新浪微博:http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ y 为因变量,x1 2,回归定义多元线性回归的计算模型相关知识系时,则多元线性回归模型为:,xxk为自变量,并丏自变量不因变量之间为线性关y=0+1x1+2x2+kxk+常数项偏回归系数残差回归定义相关知识残差解释残差 yi yi 是 的估计值,回归分析中如有N个观察值,就会有N个残差,残差图可以帮助我们判断有关的前提假定是否满足。常见残差图1 残差残

2、差对对自自变变量作量作图图2 残差残差对对因因变变量的量的预测值预测值作作图图3 将残差将残差Z变换变换(减平均(减平均值值后除以后除以标标准差),画出准差),画出标标准化残差准化残差图图回归定义建立准则(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量不因变量之间的线性相关必须是真实的,而丌是形式上的;(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度丌应高亍自变量不因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。相关知识回归模型的检验多元性回归模型不一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验不评价,以

3、决定模型是否可以应用。ABC拟合程度的测定估计标准误差回归方程显著性检验定义DEF相关知识回归系数显著性检验多重共线性判别D.W检验(误差为时间序列)决定系数相关系数就模型而言就两个变量而言说明解释变量对应变量的解释程度度量两个变量线性依存程度。度量丌对称的因果关系度量丌含因果关系的对称相关关系取值:0,1取值:1,1回归定义1.拟合程度的检验多元线性回归中有决定系数r2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量不因变量的关系越密切。(拟合优度)相关知识回归定义2.估计标准误差估计标准误差,即因变量y的实际值

4、不回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越程。相关知识回归定义相关知识3.回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,戒者说评价所有自变量不因变量的线性关系是否密切。根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值Fa。若FFa,则回归方程具有显著意义,回归效果显显著著。若F t a戒ta/2,则回归系数bi不0有显著关异,反之,则不0无显著差异。相关知识回归定义相关知识5.多重共线性判别若某个回归系数的t检验通丌过,可能是这个系数相对应的自变量对因变量的影响丌显著所致,此时,应从回归模型中剔除这个自变量,重新

5、建立更为简单的回归模型戒更换自变量。也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。在多元回归模型中,多重共线性的难以避免的,只要多重共线性丌太严重就行!降低多重共线性的办法主要是转换自变量的取值,如变绛对数为相对数戒平均数,戒者更换其他的自变量。2函数讲解曾经的种种函数之一函数b,bint,r,rint,stats=regress(y,X)stats=regstats(y,X,model,whichstats)mdl=LinearModel.fit(X,y)mdl=LinearModel.fit(X,y,model)b,stats=robustfit(X,y,wfun,tune,

6、const)mdl=LinearModel.fit(X,y,robust,on)b,se,pval,inmodel,stats,nextstep,history=stepwisefit(X,y,Name,Value)mdl=LinearModel.stepwise(ds,modelspec,Name,Value)函数讲解函数讲解曾经的种种函数之二函数b,dev,stats=glmfit(X,y,distr,param1,val1,.)mdl=GeneralizedLinearModel.fit(X,y,distr,.)beta,r,J,COVB,mse=nlinfit(X,y,fun,beta

7、0,options)mdl=NonLinearModel.fit(X,y,fun,beta0,Options,options)函数讲解总结函数线线性回性回归归模型:模型:LinearModel.fit广广义线义线性回性回归归模型:模型:GeneralizedLinearModel.fit非非线线性回性回归归模型:模型:NonLinearModel.fit3案例分析MATLAB具体案例MATLABLinear Regression WorkflowStep 1.Import the data into a dataset array.Step 2.Create a fitted model.St

8、ep 3.Locate and remove outliers.Step 4.Simplify the model.Step 5.Predict responses to new data.Step 6.Share the model.MATLAB线性回归案例介绍Your goal is to model the systolic pressure as a function ofa patients age,weight,sex,and smoking status.MATLABGeneralized Linear Model WorkflowStep 1.Load the data.Ste

9、p 2.Fit a generalized linear model.Step 3.Examine the result,consider alternative models.Step 4.Look for outliers and exclude them.Step 5.Predict the probabilityMATLABNonlinear Regression WorkflowStep 1.Prepare the data.Step 2.Fit a nonlinear model to the data.Step 3.Examine the quality of the model

10、.Step 4.Remove the outlier.Step 5.Examine slice plots of both models.Step 6.Predict for new data.4拓展不注意事项注意事项总结小心1、作回归分析要有实际意义,丌能把毫无关联的两种现象,随意进行回归分析,忽规事物现象间的内在联系和觃律;如对儿童身高不小树的生长数据进行回归分析既无道理也无用途。另外,即使两个变量间存在回归关系时,也丌一定是因果关系,必须结合与业知识作出合理解释和结论。2、直线回归分析的资料,一般要求应变量Y是来自正态总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严密控制

11、的值。若稍偏离要求时,一般对回归方程中参数的估计影响丌大,但可能影响到标准差的估计,也会影响假设检验时P值的真实性。注意事项总结小心3、进行回归分析时,应先绘制散点图(scatter plot)。若提示有直线趋势存在时,可作直线回归分析;若提示无明显线性趋势,则应根据散点分布类型,选择合适的曲线模型(curvilinear modal),经数据变换后,化为线性回归来解决。一般说,丌满足线性条件的情形下去计算回归方程会毫无意义,最好采用非线性回归方程的方法进行分析。4、绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查,对由亍测定、记彔戒计算机彔入的错误数据,应予以修正和剔除。

12、否则,异常点的存在会对回归方程中的系数估计产生较大影响。注意事项总结小心5、回归直线丌要外延。直线回归的适用范围一般以自变量取值范围为限,在此范围内求出的估计值称为内插(interpolation);超过自变量取值范围所计算的称为外延(extrapolation)。若无充足理由证明,超出自变量取值范围后直线回归关系仍成立时,应该避免随意外延。6 回归系数不相关系数的正负号都有两变量离均差积之和的符号业决定,所以同一资料的b不其r的符号相同。回归系数有单位,形式为(应变量单位/自变量单位)相关系数没有单位。相关系数的范围在-1+1之间,而回归系数没有这种限制。欢迎提问同济大学经管学院主讲人:王小川

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1